出版資訊
簡介
人工智慧世代必備的資料擷取術 ─ 網路爬蟲,幫你建立 Python 網路爬蟲 SOP 標準作業程序。
☛ 資料是王 ( Data is King ),誰擁有資料,誰就能主宰世界。從 Python 網路爬蟲到生活應用,完整說明你需要必備的 Python 資料擷取術。
☛ 網路爬蟲就是從 HTML 網頁取得資料。你可以想像在 Web 星球 ( WWW ) 上有眾多果園 ( 網站 ) 和 HTML 果樹 ( 網頁 ),你的工作是拿著水果籃進入指定的果園後,爬上果樹摘下樹上的水果 ( HTML 標籤 ),你需要定位水果在哪裡以及規劃摘取順序,才能成功摘下整棵樹的水果,放進水果籃。
☛ 本書讓你學得到 Python,用得到 Python,還能夠「真正活用」Python 來解決你日常生活、學習和工作上,各種資料擷取和處理的問題。
【適用讀者】
✎ 已經有其他程式語言基礎、或對運算思維有興趣的初學者。
✎ 適合讀者自學 Python 程式設計,亦可作為 Python 程式設計相關課程的上課教材。
作者簡介
陳會安
現 職
專職資訊圖書作者、大專資訊課程老師
經 歷
企業講師、松崗電腦產品經理、美商PH出版經理、專業電腦書作者。
資訊技術作家,出版超過 100 本電腦著作, 包括: 程式設計( C / C + + 、J a v a 、C # 、( H T M L 5 、P H P 、ASP.NET、JSP等)、資料庫、系統分析、資料結構等各種不同主題。
近年研究人工智慧、機器學習 / 深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作,也熱衷利用 Raspberry Pi 、 Arduino 、ESP8266 / ESP32 和 Micro:bit 等開發板製作創客作品,投入創客領域的教學與寫作。
fChart 程式設計教學工具官方網址:
fChart
目錄
03 作業步驟一:認識網路爬蟲與 HTML 網頁分析
04 作業步驟二:Requests 和 Selenium 取得網路資料
05 作業步驟三:BeautifulSoup 剖析和擷取網頁資料
06 作業步驟四:Pandas 資料清理、讀取與儲存
07 應用實務:爬取食衣住行和娛樂資訊
08 應用實務:爬取排行榜和網路趨勢資訊
09 整合應用:IFTTT、LINE 和 Telegram 發送通知訊息
10 應用實務:爬取 YouTube 等影音網站
11 應用實務:爬取 Imgur 和 PTT 表特版圖片
12 整合應用:自動排程通知、爬取 / 下載資料和 Telegram Bot
13 應用實務:爬取金融與商務資料
14 應用實務:爬取股市指數和股價數據
15 整合應用:SQLite 資料庫和 Plotly 繪製互動圖表
16 整合應用:Web API 和 LINE/Telegram Bot 聊天機器人
附錄A 安裝與使用Python 開發環境 - Anaconda 和 WinPython