從如何獲取、掌控、探索、預測與溝通資料認識現代資料科學應用
您已經具備Python或R語言基礎程式設計能力,卻不曉得該如何應用所學來撰寫網頁爬蟲、連結資料庫、清理資料、資料視覺化或者機器學習嗎?這是為您量身打造的一本進階應用書,您將在本書找到用Python和R語言實踐前述這些迷人資料科學應用場景的實作範例!
●用語平易近人、淺顯易讀
●有效提升就學、研究與求職的即戰力
●適合閱讀本書的讀者:已經能嫻熟使用Python或R語言基本程式設計的使用者、想學習Python或R語言資料科學應用的使用者
郭耀仁
畢業於台灣大學商學研究所,是資料科學與推廣教育的愛好者,目前為教育科技新創團隊 Kyosei.ai的共同創辦人,於台大資工系統訓練班、資策會、中華電信學院及多所大專院校講授資料科學課程。
在Kyosei.ai之前任職過上海的韓商新創公司、台北的美商軟體公司與銀行,閒暇時喜歡長跑;著有輕鬆學習 R語言、R語言使用者的Python學習筆記(2017 iT邦幫忙鐵人賽Big Data組冠軍)與進擊的資料科學。
Chapter 1 資料科學的前世今生
Part 1:如何獲取資料
Chapter 2 載入常見檔案格式
Chapter 3 向資料庫查詢
Chapter 4 靜態擷取網頁內容
Chapter 5 動態擷取網頁內容
Part 2:如何掌控資料
Chapter 6 認識常見的資料結構
Chapter 7 基礎資料框操作技巧
Chapter 8 進階資料框操作技巧
Chapter 9 關於文字
Part 3:如何探索資料
Chapter 10 基礎視覺化
Chapter 11 視覺化中的元件
Chapter 12 其他視覺化類型
Part 4:如何預測資料
Chapter 13 尋找迴歸模型的係數
Chapter 14 迴歸模型的評估
Chapter 15 尋找羅吉斯迴歸的係數
Chapter 16 分類模型的評估
Part 5:如何溝通資料
Chapter 17 互動式圖表及 R 語言
Chapter 18 互動式圖表及 Python