|
-- 會員 / 註冊 --
|
|
|
|
數據科學 R語言實戰 ( 簡體 字) |
作者:美 Dan Toomey 丹 圖米 | 類別:1. -> 程式設計 -> R語言 |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 45642 詢問書籍請說出此書號!【缺書】 NT售價: 345 元 |
出版日:11/1/2016 |
頁數:327 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115435903 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介: 本書講述的是R語言在數據科學中的應用,目標讀者是從事不同行業的數據分析師、數據挖掘工程師、機器學習工程師、自然語言處理工程師、數據科學家,以及從事大數據和人工智能領域的工作者、學生、老師等。
本書的優點在于其通俗易懂、容易上手,每一個實例都有現成的數據和源代碼,讀者不僅能理解整個案例的來龍去脈,還可以直接編譯本書提供的所有源代碼,從而了解怎么從實際問題轉變成可實現的代碼,感受R語言的魅力,讓數據產生價值。這種學習和實踐相結合的方式非常適合初學者和有一定經驗的數據分析師。
本書的內容涵蓋了基于數據挖掘的常用模型,包括分類、聚類、關聯分析、預測、異常檢測等,還包括機器學習的常用算法和自然語言處理、數據可視化等內容。本書內容全面,做到了易讀、易用、易理解、易實現、易上手,是不可多得的R語言書籍。
|
目錄:第1章 模式的數據挖掘 1 1.1 聚類分析 2 1.1.1 K-means聚類 3 1.1.2 K-medoids聚類 7 1.1.3 分層聚類 12 1.1.4 期望最大化 15 1.1.5 密度估計 21 1.2 異常檢測 24 1.2.1 顯示異常值 25 1.2.2 計算異常 28 1.3 關聯規則 30 1.4 問題 33 1.5 總結 34 第2章 序列的數據挖掘 35 2.1 模式 35 2.1.1 Eclat 36 2.1.2 arulesNBMiner 40 2.1.3 Apriori 43 2.1.4 用TraMineR確定序列 47 2.1.5 序列相似點 54 2.2 問題 57 2.3 總結 57 第3章 文本挖掘 59 3.1 功能包 60 3.1.1 文本處理 60 3.1.2 文本集群 69 3.2 問題 80 3.3 總結 80 第4章 數據分析——回歸分析 81 4.1 功能包 81 4.1.1 簡單回歸 81 4.1.2 多次回歸 88 4.1.3 多變量回歸分析 94 4.1.4 穩健回歸 100 4.2 問題 106 4.3 總結 106 第5章 數據分析——相關性 107 5.1 功能包 107 5.1.1 基本相關性 108 5.1.2 可視化相關性 112 5.1.3 協方差 114 5.1.4 皮爾森相關性 117 5.1.5 多分格相關性 118 5.1.6 四分相關性 122 5.1.7 異構相關矩陣 126 5.1.8 部分相關性 128 5.2 問題 129 5.3 總結 129 第6章 數據分析——聚類 131 6.1 功能包 131 6.2 K-means聚類 132 6.2.1 示例 132 6.2.2 Medoids集群 140 6.2.3 cascadeKM函數 142 6.2.4 基于貝葉斯定理信息選取集群 144 6.2.5 仿射傳播聚類 146 6.2.6 用于估測集群數量的間隙統計量 149 6.2.7 分級聚類 151 6.3 問題 153 6.4 總結 154 第7章 數據可視化——R圖形 155 7.1 功能包 155 7.1.1 交互式圖形 156 7.1.2 latticist功能包 160 7.1.3 ggplot2功能包 169 7.2 問題 180 7.3 總結 181 第8章 數據可視化——繪圖 183 8.1 功能包 183 8.2 散點圖 183 8.2.1 回歸線 187 8.2.2 lowess線條 188 8.2.3 scatterplot函數 189 8.2.4 Scatterplot矩陣 192 8.2.5 密度散點圖 197 8.3 直方圖和條形圖 200 8.3.1 條形圖 200 8.3.2 直方圖 203 8.3.3 ggplot2 203 8.3.4 詞云 204 8.4 問題 206 8.5 總結 206 第9章 數據可視化——三維 207 9.1 功能包 207 9.2 生成三維圖形 208 9.2.1 Lattice Cloud——三維散點圖 212 9.2.2 scatterplot3d 215 9.2.3 scatter3d 216 9.2.4 cloud3d 218 9.2.5 RgoogleMaps 220 9.2.6 vrmlgenbar3D 221 9.2.7 大數據 223 9.2.8 研究方向 228 9.3 問題 234 9.4 總結 234 第10章 機器學習實戰 235 10.1 功能包 235 10.2 數據集 236 10.2.1 數據劃分 240 10.2.2 模型 241 10.2.3 train方法 254 10.3 問題 264 10.4 總結 264 第11章 用機器學習預測事件 265 11.1 自動預測功能包 265 11.1.1 時間序列 266 11.1.2 SMA函數 272 11.1.3 分解函數 273 11.1.4 指數平滑法 274 11.1.5 預測 277 11.1.6 霍爾特指數平滑法 281 11.2 問題 293 11.3 總結 293 第12章 監督學習和無監督學習 295 12.1 功能包 296 12.1.1 監督學習 296 12.1.2 無監督學習 316 12.2 問題 327 12.3 總結 327
|
序: |
|