聯合新聞網 琅琅讀墨

活動專區 原「琅琅書店」用戶專屬福利,開通書櫃領好禮  琅琅讀墨試營運開跑,全館消費滿額送LINE POINTS 琅琅讀墨開幕慶抽好禮,書櫃、裝備一起升級


取消 確認

News
使用Python搜刮網路資料的12堂實習課

使用Python搜刮網路資料的12堂實習課

出 版 社
格  式
EPUB(固定版面)
不提供電子書檔案另存下載
電子書定價 NT$ 520
NT$ 390
電子書定價 NT$ 520
NT$ 390

出版資訊

出版日期
2020-09-28
線上出版日期
2020-11-28
ISBN
9789864345212
EISBN
分級
普級
語言
繁體中文
閱讀更多

簡介

網路爬蟲是AI範疇中,取得資料與儲存的一項重要技能,而Python是爬蟲過程中相當好用的工具。

全書以簡單的Python程式為主軸,讓您可以輕鬆學會如何利用Python的模組擷取公開的網站資料、網頁內容,並建立自己的自動化爬蟲程式,增進您在網路上搜刮資料的能力與效率,是已具有Python基礎的學習者最佳的爬蟲入門工具書。

【本書特色】
✪了解網站、網頁、瀏覽器間的關係,認識爬蟲程式
✪了解網路上格式HTML/CSV/JSON/XLSX
✪使用requests模組取得網路上的資料
✪擷取及解析JSON及CSV格式資料檔案
✪利用Regular Expression及BeautifulSoup模組剖析網頁資料
✪活用Chrome開發人員工具找出網頁中特定資料的CSS選擇器內容
✪使用Selenium自動化工具擷取動態網頁
✪把擷取的資料儲存到MySQL及MongoDB資料庫
✪利用排程器做到自動化資料擷取及通知的功能
✪透過Scrapy框架建立爬蟲程式,大量搜刮資料

閱讀更多

目錄

第2堂 快速了解網路資料格式
第3堂 擷取網頁資料基礎
第4堂 HTML網頁剖析基礎
第5堂 HTML網頁剖析實務
第6堂 CSS選擇器基礎與活用
第7堂 MySQL資料庫儲存
第8堂 MongoDB資料庫操作
第9堂 自動化資料擷取
第10堂 Scrapy初階
第11堂 Scrapy 爬蟲實務
第12堂 爬蟲實戰技巧及實例
附錄 反爬蟲與反反爬蟲的戰爭
閱讀更多
18+