【包郵正版】Python 3網絡爬蟲開發實戰

【包郵正版】Python 3網絡爬蟲開發實戰 pdf epub mobi txt 電子書 下載 2025

崔慶纔 著
想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 藍墨水圖書專營店
齣版社: 人民郵電
ISBN:9787115480347
商品編碼:26114674847

具體描述
























Python3網絡爬蟲開發實戰

本書介紹瞭如何利用 Python 3 開發網絡爬蟲。書中首先詳細介紹瞭環境配置過程和爬蟲基礎知識 ;然後討論瞭 urllib、requests 等請求庫,Beautiful Soup、XPath、pyquery 等解析庫以及文本和各類數據庫的存儲方法;接著通過多個案例介紹瞭如何進行 Ajax 數據爬取,如何使用 Selenium 和 Splash 進行動態網站爬取; 接著介紹瞭爬蟲的一些技巧,比如使用代理爬取和維護動態代理池的方法,ADSL 撥號代理的使用,圖形、 極驗、點觸、宮格等各類驗證碼的破解方法,模擬登錄網站爬取的方法及 Cookies 池的維護。 此外,本書還結閤移動互聯網的特點探討瞭使用 Charles、mitmdump、Appium 等工具實現 App 爬取 的方法,緊接著介紹瞭 pyspider 框架和 Scrapy 框架的使用,以及分布式爬蟲的知識,最後介紹瞭 Bloom Filter 效率優化、Docker 和 Scrapyd 爬蟲部署、Gerapy 爬蟲管理等方麵的知識。

作者:崔慶纔


係列書名圖靈原創

執行編輯關於本書的內容有任何問題,請聯係 王軍花

書 號978-7-115-48034-7

頁 數608

印刷方式單色

開 本16開

齣版狀態正在排版

定價99.00

 

本書特色

1.本書詳細介紹瞭爬蟲的關鍵技術,涵蓋麵廣,實用性強。

2.本書作者崔慶纔,北京航空航天大學碩士,北京釘趣網絡公司技術總監,其個人博客為cuiqingcai.com,其上爬蟲文章的瀏覽量總計已過百萬。

 

目錄

本書介紹瞭如何利用Python 3開發網絡爬蟲,書中首先介紹瞭環境配置和基礎知識,然後討論瞭urllib、requests、正則錶達式、Beautiful Soup、XPath、pyquery、數據存儲、Ajax數據爬取等內容,接著通過多個案例介紹瞭不同場景下如何實現數據爬取,最後介紹瞭pyspider框架、Scrapy框架和分布式爬蟲。

本書適閤Python程序員閱讀。

1-開發環境配置

1.1-Python3的安裝

1.2-請求庫的安裝

1.2.1-Requests的安裝

1.2.2-Selenium的安裝

1.2.3-ChromeDriver的安裝

1.2.4-GeckoDriver的安裝

1.2.5-PhantomJS的安裝

1.2.6-aiohttp的安裝

1.3-解析庫的安裝

用戶評價

評分

很實用的工具書

評分

朋友推薦纔賣的,買瞭後還沒看,不過朋友說挺好的,好的話再來評下

評分

非常實用,配上之前的視頻可能更容易理解,很全麵

評分

這個書,個人感覺不值那個價錢

評分

正版書籍,配貨發貨速度快,很滿意。

評分

早就關注作者的blog,學習瞭不少,書裏有不少作者總結的技術,很實用..

評分

這本書應該活動買,有點虧瞭,但是內容豐滿,值得一看

評分

很好,點贊,發貨很快

評分

不錯不存在已學習

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有