-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

機器學習與R語言(原書第2版)

( 簡體 字)
作者:(美)布雷特·蘭茨(Brett Lantz)類別:1. -> 程式設計 -> 機器學習
   2. -> 程式設計 -> R語言
譯者:
出版社:機械工業出版社機器學習與R語言(原書第2版) 3dWoo書號: 46347
詢問書籍請說出此書號!

缺書
NT售價: 345

出版日:3/14/2017
頁數:278
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111553281
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

本書共12章:第1章介紹機器學習的基本概念和理論,并介紹用于機器學習的R軟件環境的準備;第2章介紹如何應用R來管理數據,進行數據的探索分析和數據可視化;第3∼9章介紹典型的機器學習算法,包括k近鄰分類算法、樸素貝葉斯算法、決策樹和規則樹、回歸預測、黑盒算法——神經網絡和支持向量機、關聯分析、k均值聚類,并給出大量的實際案例和詳細的分析步驟,例如乳腺癌的判斷、垃圾短信的過濾、貸款違約的預測、毒蘑菇的判別、醫療費用的預測、建筑用混凝土強度的預測、光學字符的識別、超市購物籃關聯分析以及市場細分等;第10章介紹模型性能評價的原理和方法;第11章給出提高模型性能的幾種常用方法;第12章討論用R進行機器學習時可能遇到的一些高級專題,如特殊形式的數據、大數據集的處理、并行計算和GPU計算等技術。
目錄:

推薦序
譯者序
前言
關于審稿人
第1章 機器學習簡介1
1.1 機器學習的起源1
1.2 機器學習的使用與濫用3
1.2.1 機器學習的成功使用3
1.2.2 機器學習的限制4
1.2.3 機器學習的倫理方面5
1.3 機器如何學習6
1.3.1 數據存儲7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 評估10
1.4 實踐中的機器學習11
1.4.1 輸入數據的類型11
1.4.2 機器學習算法的類型12
1.4.3 為輸入數據匹配算法14
1.5 使用R進行機器學習15
1.5.1 安裝R添加包15
1.5.2 載入和卸載R添加包16
1.6 總結16
第2章 數據的管理和理解18
2.1 R數據結構18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 數據框23
2.1.5 矩陣和數組25
2.2 用R管理數據27
2.2.1 保存、載入和移除R數據結構27
2.2.2 用CSV文件導入和保存數據28
2.3 探索和理解數據29
2.3.1 探索數據的結構29
2.3.2 探索數值變量30
2.3.3 探索分類變量38
2.3.4 探索變量之間的關系40
2.4 總結43
第3章 懶惰學習—使用近鄰分類44
3.1 理解近鄰分類44
3.1.1 kNN算法45
3.1.2 為什么kNN算法是懶惰的50
3.2 例子—用kNN算法診斷乳腺癌51
3.2.1 第1步—收集數據51
3.2.2 第2步—探索和準備數據52
3.2.3 第3步—基于數據訓練模型55
3.2.4 第4步—評估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 總結59
第4章 概率學習—樸素貝葉斯分類60
4.1 理解樸素貝葉斯60
4.1.1 貝葉斯方法的基本概念61
4.1.2 樸素貝葉斯算法65
4.2 例子—基于貝葉斯算法的手機垃圾短信過濾69
4.2.1 第1步—收集數據69
4.2.2 第2步—探索和準備數據70
4.2.3 第3步—基于數據訓練模型81
4.2.4 第4步—評估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 總結84
第5章 分而治之—應用決策樹和規則進行分類85
5.1 理解決策樹85
5.1.1 分而治之86
5.1.2 C5.0決策樹算法89
5.2 例子—使用C5.0決策樹識別高風險銀行貸款91
5.2.1 第1步—收集數據92
5.2.2 第2步—探索和準備數據92
5.2.3 第3步—基于數據訓練模型94
5.2.4 第4步—評估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分類規則101
5.3.1 獨立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 來自決策樹的規則105
5.3.5 什么使決策樹和規則貪婪106
5.4 例子—應用規則學習算法識別有毒的蘑菇108
5.4.1 第1步—收集數據108
5.4.2 第2步—探索和準備數據108
5.4.3 第3步—基于數據訓練模型109
5.4.4 第4步—評估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 總結114
第6章 預測數值型數據—回歸方法115
6.1 理解回歸115
6.1.1 簡單線性回歸117
6.1.2 普通最小二乘估計119
6.1.3 相關性120
6.1.4 多元線性回歸121
6.2 例子—應用線性回歸預測醫療費用124
6.2.1 第1步—收集數據124
6.2.2 第2步—探索和準備數據125
6.2.3 第3步—基于數據訓練模型129
6.2.4 第4步—評估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回歸樹和模型樹134
6.4 例子—用回歸樹和模型樹估計葡萄酒的質量136
6.4.1 第1步—收集數據137
6.4.2 第2步—探索和準備數據137
6.4.3 第3步—基于數據訓練模型139
6.4.4 第4步—評估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 總結145
第7章 黑箱方法—神經網絡和支持向量機147
7.1理解神經網絡147
7.1.1從生物神經元到人工神經元148
7.1.2激活函數149
7.1.3網絡拓撲151
7.1.4用后向傳播訓練神經網絡154
7.2例子—用人工神經網絡對混凝土的強度進行建模155
7.2.1第1步—收集數據155
7.2.2第2步—探索和準備數據156
7.2.3第3步—基于數據訓練模型157
7.2.4第4步—評估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量機161
7.3.1用超平面分類161
7.3.2對非線性空間使用核函數164
7.4例子—用支持向量機進行光學字符識別166
7.4.1第1步—收集數據166
7.4.2第2步—探索和準備數據167
7.4.3第3步—基于數據訓練模型168
7.4.4第4步—評估模型的性能170
7.4.5第5步—提高模型的性能171
7.5總結172
第8章 探尋模式—基于關聯規則的購物籃分析173
8.1理解關聯規則173
8.1.1用于關聯規則學習的Apriori算法174
8.1.2度量規則興趣度—支持度和置信度175
8.1.3用Apriori原則建立規則176
8.2例子—用關聯規則確定經常一起購買的食品雜貨177
8.2.1第1步—收集數據177
8.2.2第2步—探索和準備數據178
8.2.3第3步—基于數據訓練模型183
8.2.4第4步—評估模型的性能185
8.2.5第5步—提高模型的性能187
8.3總結190
第9章 尋找數據的分組—k均值聚類191
9.1理解聚類191
9.1.1聚類—一種機器學習任務192
9.1.2k均值聚類算法193
9.2例子—用k均值聚類探尋青少年市場細分198
9.2.1第1步—收集數據199
9.2.2第2步—探索和準備數據199
9.2.3第3步—基于數據訓練模型203
9.2.4第4步—評估模型的性能205
9.2.5第5步—提高模型的性能207
9.3總結208
第10章 模型性能的評價210
10.1 度量分類方法的性能210
10.1.1 在R中處理分類預測數據211
10.1.2 深入探討混淆矩陣213
10.1.3 使用混淆矩陣度量性能214
10.1.4 準確率之外的其他性能度量指標216
10.1.5 性能權衡的可視化223
10.2 評估未來的性能226
10.3 總結232
第11章 提高模型的性能233
11.1 調整多個模型來提高性能233
11.2 使用元學習來提高模型的性能241
11.2.1 理解集成學習241
11.2.2 bagging243
11.2.3 Boosting245
11.2.4 隨機森林247
11.3 總結251
第12章 其他機器學習主題253
12.1 分析專用文件和數據庫253
12.1.1 讀/寫Excel、SAS、SPSS和Stata文件254
12.1.2 查詢SQL數據庫中的數據254
12.2 處理在線數據和服務255
12.2.1 下載網頁的所有文本256
12.2.2 從網頁爬取數據257
12.3 處理特定領域的數據263
12.3.1 分析生物信息學數據264
12.3.2 分析和可視化網絡數據264
12.4 提高R語言的性能267
12.4.1 處理非常大的數據集267
12.4.2 使用并行處理來加快學習過程271
12.4.3 GPU計算276
12.4.4 部署優化的學習算法277
12.5 總結278
序: