聯合新聞網 琅琅讀墨

活動專區 原「琅琅書店」用戶專屬福利,開通書櫃領好禮  琅琅讀墨試營運開跑,全館消費滿額送LINE POINTS 琅琅讀墨開幕慶抽好禮,書櫃、裝備一起升級


取消 確認

News
JavaScript爬蟲新思路! 從零開始帶你用Node.js打造FB & IG爬蟲專案(iT邦幫忙鐵人賽系列書)

JavaScript爬蟲新思路! 從零開始帶你用Node.js打造FB & IG爬蟲專案(iT邦幫忙鐵人賽系列書)

作  者
出 版 社
格  式
EPUB(固定版面)
不提供電子書檔案另存下載
電子書定價 NT$ 620
NT$ 460
電子書定價 NT$ 620
NT$ 460

出版資訊

出版日期
2021-07-25
線上出版日期
2021-09-13
ISBN
9789864348008
EISBN
分級
普級
語言
繁體中文
閱讀更多

簡介

本書內容改編自第12屆iT邦幫忙鐵人賽,AI & Data組佳作網路系列文章──
《行銷廣告、電商小編的武器,FB & IG爬蟲專案從零開始》

你知道JavaScript不僅能寫網頁還能夠爬蟲嗎?
你受夠像機器人般蒐集資料的生活嗎?
從新手村畢業的朋友想知道一個專案是如何進行的嗎?
PM們想知道工程師面對問題時在想什麼嗎?

想知道這些答案嗎?想知道的話可以全部都給你。
閱讀吧!我把所有的解答都放在書裡了!

【書籍特色】
◎從零開始!手把手建置 Mac/Windows 的專案環境
擋住學習熱情的不是困難的工具,而是屢戰屢敗的環境建置!除了 step by step 帶你安裝環境,更讓你掌握每個工具的用途與原理。

◎循序漸進!每個章節都是一個里程碑
每個章節都有明確的學習目標,讓讀者在閱讀與實作的過程中成長;並透過實務上的議題,培養獨立思考能力。

◎整合技術!完成屬於自己的爬蟲專案
從架構上全面著手,提供多種解決問題的思路,打造擴充性強大的系統。透過需求訪談,你將發現──只有爬蟲技術是無法完善整個專案的!

儲存資料的容器、定時執行的排程與爬蟲完成後的通知都是不可或缺的一環。
Node.js x Selenium x Google Sheets x Schedule x LINE Notify

最後,習得爬蟲技能的你

 1. 向機械化的操作 Say Goodbye ~
 2. 蒐集海量資料不再是苦差事
 3. 比別人擁有更多技能優勢

閱讀更多

目錄

01 需求訪談
02 撰寫需求規格書
PART 2 開發前環境介紹& 設定
03 開發前環境介紹&設定
PART 3 寫程式所需的基礎常識(Node.js)
04 寫程式時該注意的基本原則
05 認識 Node.js 專案
06 用 Yarn 安裝及控管套件
07 善用「.env」管理環境變數,幫你快速遷移專案
08 在「.gitignore」設定不加入版控的資料
PART 4 用 selenium-webdriver 爬蟲網頁資訊
09 爬蟲之前
10 認識 selenium-webdriver,操作所見即所得的爬蟲工具
11 爬蟲第一步,FB 先登入
12 關閉干擾爬蟲的彈窗,取得 FB 粉專追蹤數
13 舉一反三,帶你了解 IG 爬蟲不可忽略的細節
14 合體吧!用一隻程式搞定 FB、IG 爬蟲
15 重構程式碼,減少歷史業障
16 用try-catch 捕獲爬蟲過程發生的錯誤
17 json x 爬蟲 = 瑣事自動化
18 驗證 json 的內容是否符合格式
19 優化爬蟲的小技巧
20 學會爬蟲,之後呢?
PART 5 使用 Google Sheets 儲存爬蟲資訊
21 免費儲存資料的好選擇,一起進入省錢起手式
22 了解官方範例在做什麼事
23 你在文件迷路了嗎?用兩個處理 Sheet 的範例帶你攻略官方文件
24 寫入爬蟲資料,告別 Copy & Paste 的日子
25 客戶:「爬蟲資料塞錯位置!」專案被報 Bug 的處理方式
26 客戶:「我希望新資料插在最前面!」如何談需求變更
27 優化格式,滿足客戶需求 & 談使用者體驗
PART 6 設定排程自動執行爬蟲程式
28 用Schedule 套件讓爬蟲自己動起來
29 用 pm2 套件來控管 Node.js 排程,背景執行才是王道!
30 今天爬蟲怎麼沒有跑?來試試系統內建的排程吧!
PART 7 透過 LINE 回報爬蟲狀況
31 透過 POSTMAN 了解 LINE Notify 如何使用
32 用 axios 發出 LINE 通知
33 整合 LINE 的爬蟲通知,專案大功告成!
閱讀更多
18+