本書是利用Python參加機器學習競賽「kaggle」的入門書。一開始先以適合初學者學習的「Titanic:Machine Learning from Disater」競賽學習Kaggle的基礎。從中除了可學習實踐Titanic的方法,還能掌握自行參加競賽所需的知識。
本書具有以下特色:
.為了kaggle撰寫的習作教學書籍
.每一章或每一節都有具體的主題,可讓讀者按部就班地掌握需要的知識
.解說各種表單、圖片檔、文字檔的操作方法,作為進入下一個競賽的路標。
.兩位執筆者都擁有「Kaggle Master」的稱號,也有賺到獎金的經驗
.除了說明之外,還有兩位筆者的對談,從不同的角度介紹Kaggle的魅力
.會為程式設計與Python的初學者詳細講解範例程式
石原祥太郎(u++)
.Kaggle Master(kaggle.com/sishihara)。
.2019年4月於「PetFinder.my Adoption Prediction」競賽獲得冠軍。
.2019年12月協助舉辦「Kaggle Days Tokyo」的競賽。
.於2019年3月在Qiita公開的Kaggle入門文章得到1600個讚。
.於日本經濟新聞社從事資料分析。
村田秀樹(咖哩)
.Kaggle Master(kaggle.com/currypurin)。
.2018年8月於「Santander Value Prediction Challenge」競賽得到solo gold medal(第8名)。
.2019年6月於「LANL Earthquake Prediction」競賽得到第三名。
.為了Kaggle初學者所寫的同人誌《Kaggle的習作》累計賣出2500本。
.從2018年7月開始成為專職Kaggler。
第1章|了解Kaggle
1.1 何謂Kaggle
1.2 於Kaggle使用的機器學習
1.3 建立Kaggle的帳號
1.4 Competitions 頁面的概要
1.5 不需另行建置環境的「Notebooks」的使用方法
第2章|著手進行Titanic
2.1 先submit !試著寫進順位表
2.2 掌握全貌!了解submit之前的處理流程
2.3 找出下一步!試著進行探索式資料分析
2.4 在此拉開差距!基於假設建立新的特徵值
2.5 決策樹是最強的演算法?試著使用各種機器學習演算法
2.6 機器學習演算法的心情?試著調整超參數
2.7 在submit 之前!了解「Cross Validation」的重要性
2.8 「三個臭皮匠,勝過一個諸葛亮!」體驗集成學習
第3章|往Titanic的下個階段前進
3.1 操作多個表格
3.2 操作影像資料
3.3 操作文字資料
第4章|為了進一步學習
4.1 挑選競賽的方法
4.2 初學者適用的參賽方式
4.3 可選擇的分析環境
4.4 值得參考的資料、文獻、連結
4.5 第4 章總結
附錄A|範例程式碼詳細解說