Name: 使用Python搜刮網路資料的12堂實習課
Brand: 博碩文化

使用Python搜刮網路資料的12堂實習課

作者

何敏煌、葉柏漢、顏凰竹

出版社

博碩文化

格式

EPUB(固定版面)
不提供電子書檔案另存下載

電子書定價 NT$ 520

NT$ 390

加入購物車試閱

電子書定價 NT$ 520

NT$ 390

加入購物車試閱

出版日期

2020-09-28

線上出版日期

2020-11-28

ISBN

9789864345212

EISBN

分級

普級

語言

繁體中文

網路爬蟲是AI範疇中，取得資料與儲存的一項重要技能，而Python是爬蟲過程中相當好用的工具。

全書以簡單的Python程式為主軸，讓您可以輕鬆學會如何利用Python的模組擷取公開的網站資料、網頁內容，並建立自己的自動化爬蟲程式，增進您在網路上搜刮資料的能力與效率，是已具有Python基礎的學習者最佳的爬蟲入門工具書。

【本書特色】
✪了解網站、網頁、瀏覽器間的關係，認識爬蟲程式
✪了解網路上格式HTML/CSV/JSON/XLSX
✪使用requests模組取得網路上的資料
✪擷取及解析JSON及CSV格式資料檔案
✪利用Regular Expression及BeautifulSoup模組剖析網頁資料
✪活用Chrome開發人員工具找出網頁中特定資料的CSS選擇器內容
✪使用Selenium自動化工具擷取動態網頁
✪把擷取的資料儲存到MySQL及MongoDB資料庫
✪利用排程器做到自動化資料擷取及通知的功能
✪透過Scrapy框架建立爬蟲程式，大量搜刮資料

第2堂快速了解網路資料格式
第3堂擷取網頁資料基礎
第4堂 HTML網頁剖析基礎
第5堂 HTML網頁剖析實務
第6堂 CSS選擇器基礎與活用
第7堂 MySQL資料庫儲存
第8堂 MongoDB資料庫操作
第9堂自動化資料擷取
第10堂 Scrapy初階
第11堂 Scrapy 爬蟲實務
第12堂爬蟲實戰技巧及實例
附錄反爬蟲與反反爬蟲的戰爭

使用Python搜刮網路資料的12堂實習課

出版資訊

簡介

目錄

其他人也買了

程式人（2014年7月）

Excel精算速學500招【新裝修訂版】

其他人也看了

Illustrator隨手畫，隨便繪。

Excel 真．密技字典