loading
cover

爬蟲在手 資料我有:7堂課學會高效率Scrapy爬蟲(iT邦幫忙鐵人賽系列書)

點閱數

作者
簡學群

出版社
博碩文化

格式
PDF

由淺入深了解Scrapy爬蟲框架,讓你從零開始建立高效率爬蟲!



◆自學網路爬蟲沒問題,手把手教學讓你無痛上手
◆完整的網路爬蟲和Scrapy知識,資料取得更輕鬆
◆學會各種套件和實作範例,讓你的爬蟲比別人更有效率


本書內容改編自第11屆iT邦幫忙鐵人賽的AI & Data組優選網路系列文章─《爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰》。在AI的大時代中,「資料來源」是基礎中的基礎,但網路上的資料豐富又繁雜,總不可能都靠人工來蒐集資料。這時就是爬蟲出場的時候了!本書會帶讀者了解爬蟲的基礎知識,克服爬蟲常見的問題,最後可以寫出維護成本低、執行效率高的爬蟲程式。


│四大重點│


★初學者必備的爬蟲指南,大大降低你的學習門檻
網路爬蟲妙計已為你爬取完成!從安裝環境、認識架構、資料儲存、除錯到各類型網
站實作,本書將一步步帶你學會網路爬蟲。


★全面解析各種知識,爬蟲能力再提升
不只教你如何進行網路爬蟲,還要帶你深入Scrapy架構,並特別介紹NoSQL、反反
爬蟲。提升你的爬蟲技能,擁有越級打怪的神力。


★活用各種套件,打造高效率爬蟲
本書將手把手帶你活用各種套件,並從範例中學會撰寫精簡有效的程式碼,讓你克服
問題、達成任務,邁向高效率的資料取得之路。


★爬取資料生活化,就像抓寶一樣好玩有趣!
你會學到如何抓取PTT、Mobile01、新聞網站、股市網站資料,你想要的各種資料都能
輕鬆取得。



│適用讀者│


◆對Python有基礎了解,想要學習爬蟲程式的初學者
◆為爬蟲維護和效能所苦,想要更進一步的開發人員

簡學群


在業界打滾五年的C#後端工程師。興趣使然,也斜槓於Python爬蟲、PHP Laravel、Vue.js、Java Spring等領域,熱愛跟朋友研究和分享新技術。


連續參加第10、11屆iT邦幫忙鐵人賽且完賽,更在第11屆iT邦幫忙鐵人賽中,以《爬蟲在手、資料我有 -30 天 Scrapy 爬蟲實戰》系列文章,獲得AI & Data組優選。

第1章 基礎知識
第2章 爬蟲基礎
第3章 基礎實戰–蒐集iThelp文章資料
第4章 資料持久化
第5章 進階爬蟲
第6章 Scrapy基礎
第7章 實戰Scrapy

其他人也在看