loading
cover

R語言資料分析:從機器學習、資料探勘、文字探勘到巨量資料分析[第三版]

點閱數

作者
李仁鐘、李秋緣

出版社
博碩文化

格式
PDF

巨量資料時代來臨,
你需要最新、最實用、功能最強的資料分析工具─R語言

R是一套自由免費的軟體,具有入門容易、使用簡單之特色,目前多應用於機器學習、資料探勘、文字探勘、統計分析及巨量資料分析等領域。

本書第1至5章先介紹R的基本操作及應用,包括認識R語言特性、資料讀取及寫入方式,接著介紹R的繪圖功能及相關套件之運用;第6至9章介紹各類學習演算法,如:決策樹、K平均算法、基因演算法等,每一章節都加入範例供讀者即時練習;第10至12章介紹關聯性規則、社群網路分析、文字探勘及圖形化資料分析工具等內容,將R軟體在資料分析上的使用作更完整的補充,對於沒有程式設計經驗的讀者來說,本書是入門的最佳選擇;第13章及14章加入巨量資料分析介紹,讀者可先了解Hadoop基本原理並充分結合R與Hadoop之功能;讀者亦可了解Spark基本原理並充分學習SparkR之功能,進而導引讀者進入巨量資料分析的殿堂;第15章加入SparkR應用,讀者可瞭解如何應用SparkR。

本書特色
1. 各章節皆附範例實作,幫助初學者從做中學,增加練習機會,同時培養自行撰寫程式之能力。
2. 附錄加入R、RStudio、Hadoop及Spark軟體的下載及安裝步驟,指令清楚、操作容易,讓讀者輕鬆完成安裝。

【本書範例檔案請至博碩官網下載】
李仁鐘
現職:福州外語外貿學院-理工學院教授 /副院長
經歷:華梵大學資訊管理學系教授。
研究專長:智慧型計算及其應用、資訊安全、軟體工程、機器學習等等。

李秋緣
現職:福州外語外貿學院-理工學院教授
研究專長:智慧型計算及其應用、資料挖掘、人工智能、機器學習等等。
第 1 章:簡介
1.1 開始使用 R 軟體
1.2 R 物件
1.2.1 向量
1.2.2 陣列
1.2.3 矩陣
1.2.4 資料框架
1.2.5 因子
1.2.6 列表
1.2.7 物件轉換

第 2 章:資料的讀取與寫入
2.1 資料讀取
2.2 資料寫入與資料集
2.3 RData 格式資料之寫入與讀取
2.4 讀取 SQL Srver 資料庫資料
2.5 讀取 Excel 資料

第 3 章:流程控制及自訂函數
3.1 條件執行
3.2 迴圈控制
3.3 自訂函數

第 4 章:繪圖功能及基本統計
4.1 高階繪圖
4.2 低階繪圖
4.3 互動式繪圖
4.4 圖形參數
4.5 基本統計

第 5 章:相關套件介紹
5.1 機器學習
5.2 資料探勘
5.3 社群網路分析及文字探勘
5.4 巨量資料分析
5.5 套件介紹

第 6 章:監督式學習
6.1 決策樹
6.2 支持向量機器
6.3 人工神經網路
6.4 組合方法
6.4.1 隨機森林
6.4.2 推進法

第 7 章:非監督式學習
7.1 階層式分群法
7.2 K 平均算法
7.3 模糊 C 平均算法
7.4 分群指標

第 8 章:演化式學習
8.1 基因演算法
8.2 人工蜂群演算法

第 9 章:混合式學習
9.1 使用 C50 及 ABCoptim 套件範例
9.2 使用基因演算法來調整人工神經網路參數範例

第 10 章:關聯性規則
10.1 關聯性規則簡介
10.2 Apriori 演算法

第 11 章:社群網路分析及文字探勘
11.1 社群網路分析
11.2 文字探勘

第 12 章:圖形化資料分析工具
12.1 匯入資料
12.1.1 處理資料集
12.1.2 設定變數
12.2 探索及檢定資料
12.3 轉換資料
12.4 建立、評估及匯出模型

第 13 章:R+Hadoop 巨量資料分析
13.1 Hadoop 簡介
13.2 R+Hadoop

第 14 章:SparkR 巨量資料分析
14.1 Dplyr 資料處理套件
14.2 SparkR 資料處理
14.3 SparkR 與 SQL Server
14.4 SparkR 與 Cassandra
14.5 Spark Standalone 模式
14.6 SparkR 資料分析

第 15 章:SparkR 應用
15.1 SparkR 應用於氣溫預測
15.2 SparkR 應用於先分群後分類

附錄A 下載及安裝 R
附錄B 安裝 RStudio Desktop
附錄C 安裝 ODBC
附錄D 指令及用法
附錄E 安裝 R+Hadoop 於虛擬機上
附錄F 安裝 SparkR 於虛擬機上
參考文獻

其他人也在看