-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

機器學習——Python實踐

( 簡體 字)
作者:魏貞原類別:1. -> 程式設計 -> Python
譯者:
出版社:電子工業出版社機器學習——Python實踐 3dWoo書號: 48204
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:1/1/2018
頁數:228
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121331107
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

“這是最好的時代,也是最壞的時代”,這是英國文豪狄更斯的名著《雙城記》開篇的第一句話,一百多年來不斷被人引用。這里再次引用它來形容智能革命給我們帶來的未來社會。從 2016 年 AlphaGo 在圍棋比賽中戰勝韓國選手李世石,到 2017 年 Master 戰勝世界排名第一的圍棋選手柯潔,人工智能再一次引起了世人的注意。在大數據出現之前,人工智能的概念雖然一直存在,但是計算機一直不擅長處理需要依賴人類的智慧解決的問題,現在換個思路就可以解決這些問題,其核心就是變智能問題為數據問題。由此,全世界開始了新一輪的技術革命——智能革命。
自從 1687 年艾薩克·牛頓發表了論文《自然定律》,對萬有引力和三大運動定律進行了描述,人類社會進入了科學時代。在此之后,瓦特通過科學原理直接改進蒸汽機,開啟了工業革命的篇章,由于機器的發明及運用成為這個時代的標志,因此歷史學家稱這個時代為“機器時代”。機器時代是利用機器代替人力,在原有的產業基礎上加上蒸汽機形成新的產業,例如馬車加上蒸汽機成為火車,改變了人的出行方式;帆船加上蒸汽機成為輪船,讓貨物的運輸變得更加便捷。同時,原有的工匠被更加便宜的工人替代,社會的財富分配不均,社會進入動蕩期,如英國大約花費了半個世紀的時間才完成了工業革命的變革。同樣,第二次工業革命和信息革命,每一次變革都讓財富更加集中,給社會帶來動蕩。第二次工業革命同樣花費了半個世紀的時間,一代人才消除工業革命帶來的影響,讓大部分人受益。當前的智能革命也會帶來財富的重新分配和社會的動蕩,當然目前的政府對這次革命的過程都有了足夠的了解,能夠把社會的動蕩控制在最小范圍,但是在變革中的人依然需要經受這次變革帶來的動蕩。
每一次變革都是一次思維方式的改進, 工業革命是機器思維替代了農耕時代的思想;信息革命是香農博士(1916—2001 年)的信息論帶來的思想方法替代機器思維,并成為社會主導思想;在這次智能革命中,以大數據為核心的思維方式將會主導這次變革。在歷次的技術革命中,一個人、一家企業,甚至一個國家,可以選擇的道路只有兩條:要么加入變革的浪潮,成為前 2%的弄潮兒;要么觀望徘徊,被淘汰。要成為 2%的弄潮兒,需要積極擁抱這次智能變革,掌握在未來社會不會被淘汰的技能。在以大數據為基石的智能社會,利用機器學習算法對數據進行挖掘,是使機器更智能的關鍵,掌握數據挖掘是擁抱智能社會的舉措之一。本書就將介紹如何利用機器學習算法來解決問題,對數據進行挖掘。
作 者

序言
人工智能作為一種新技術,它的發展變遷可以用著名的 S 曲線來表示。具有劃時代意義的新技術(Disruptive Innovation),往往出現在社會發展的成熟期。這時國家的 GDP 增長開始減緩,生產成本居高不下,相比之下社會需求卻沒有顯著增加。現在的人工智能技術發展正處于這樣一個時期,可以說是應運而熱。但我們更關心的是它是否到了騰飛的前期。我個人覺得時機已經到來,原因有三:數字化、物聯網及人工智能(AI)技術。
第一,社會生活的高度數字化進程已經讓人與人之間的聯結幾乎完全可以用數字化的方式來描述。這一切極大地歸功于智能手機和社交媒體的深度普及。關于我們的信息都被記錄在信息系統里,無論是以格式化的形式(ERP、銀行系統、電商系統等),還是以非格式化的形式(社交媒體上的文字或語音的交流),這些都已成為機器可以分析解讀的數據,而且還在不斷積累中。
第二, 物聯網技術使信息系統能夠實時不間斷地從我們的日常活動中獲取新的信息,并且可以通過雙向通信機制給予實時反饋。比如智能手表和智能掃地機器人等。
第三,人工智能技術本身的發展已經到了足以支撐大規模商業化應用的階段。無論是人臉識別還是醫療文獻分析,人工智能已經作為工具出現在我們的身邊。
很多人還在爭論人工智能是否會成為人類的敵人,尤其是在 AI 技術發展到泛人工智能(Artificial General Intelligence, AGI)甚至超級人工智能(Artificial SuperIntelligence, ASI)的時候。這是否會成為現實或者什么時候會成為現實誰也說不清楚。但在人機同行的今天,如果還不趕快學習充實自己,明天我們肯定會遇到已經用 AI 版本升級了的人類對手。這種痛也許只有百多年前抵抗英法聯軍的八旗子弟才領悟過,但為時已晚。如何不掉隊,趕上甚至超越時代發展潮流,學習新技術是唯一手段。
就像前幾次工業革命一樣,人工智能帶來的技術革命也有三個關鍵成功因素(3M):數據(原材料: Raw Material)、技術(機器: Machine)及商業模式(Business Model)。在現實世界中,數據的金礦已經大量積累,并等待我們去開采和精煉。技術,如 Python、卷積神經網絡等都已被成熟應用。商界精英更是想出了很多商業化的應用場景,在同聲翻譯、文本分析、醫療影像分析等領域展開了眾多的投資和商業化應用。本書作為一本介紹 Python 的技術類專業書籍,立足機器學習中的監督式學習,圍繞著課程、項目和方法深入淺出地介紹了如何使用 Python 來完成機器學習的相關工作。內容涵蓋了人能的三個關鍵成功因素,以體系化和細致的講解方便讀者理解和學習有關機器學習的全過程。本書是一本實戰性很強的參考書籍,幫助我們在人工智能時代迅速掌握新技術的精髓。
周德標
副合伙人
IBM 大中華區董事長執行助理
“周教授談人工智能”微信公眾號作者
內容簡介:

本書系統地講解了機器學習的基本知識,以及在實際項目中使用機器學習的基本步驟和方法;詳細地介紹了在進行數據處理、分析時怎樣選擇合適的算法,以及建立模型并優化等方法,通過不同的例子展示了機器學習在具體項目中的應用和實踐經驗,是一本非常好的機器學習入門和實踐的書籍。不同于很多講解機器學習的書籍,本書以實踐為導向,使用 scikit-learn 作為編程框架,強調簡單、快速地建立模型,解決實際項目問題。讀者通過對本書的學習,可以迅速上手實踐機器學習,并利用機器學習解決實際問題。本書非常適合于項目經理、有意從事機器學習開發的程序員,以及高校相關專業在的讀學生閱讀。

目錄:

第一部分 初始
1 初識機器學習............ 2
1.1 學習機器學習的誤區 ............ 2
1.2 什么是機器學習 .............. 3
1.3 Python 中的機器學習............ 3
1.4 學習機器學習的原則 ............ 5
1.5 學習機器學習的技巧 ............ 5
1.6 這本書不涵蓋以下內容 ............ 6
1.7 代碼說明 ............... 6
1.8 總結................ 6
2 Python 機器學習的生態圈 ......... 7
2.1 Python ................ 7
2.2 SciPy ................ 9
2.3 scikit-learn ............... 9
2.4 環境安裝 ............... 10
2.4.1 安裝 Python............ 10
2.4.2 安裝 SciPy ............. 10
2.4.3 安裝 scikit-learn ............ 11
2.4.4 更加便捷的安裝方式........... 11
2.5 總結................ 12
3 第一個機器學習項目.......... 13
3.1 機器學習中的 Hello World 項目 .......... 13
3.2 導入數據............... 14
3.2.1 導入類庫............. 14
3.2.2 導入數據集............ 15
3.3 概述數據............... 15
3.3.1 數據維度............. 16
3.3.2 查看數據自身............ 16
3.3.3 統計描述數據............ 17
3.3.4 數據分類分布............ 17
3.4 數據可視化.............. 18
3.4.1 單變量圖表............ 18
3.4.2 多變量圖表............ 20
3.5 評估算法............... 20
3.5.1 分離出評估數據集........... 21
3.5.2 評估模式............. 21
3.5.3 創建模型............. 21
3.5.4 選擇最優模型............ 22
3.6 實施預測............... 23
3.7 總結................ 24
4 Python 和 SciPy 速成 .......... 25
4.1 Python 速成 .............. 25
4.1.1 基本數據類型和賦值運算.......... 26
4.1.2 控制語句............. 28
4.1.3 復雜數據類型............ 29
4.1.4 函數.............. 32
4.1.5 with 語句............. 33
4.2 NumPy 速成.............. 34
4.2.1 創建數組............. 34
4.2.2 訪問數據............. 35
4.2.3 算數運算............. 35
4.3 Matplotlib 速成 .............. 36
4.3.1 繪制線條圖............ 36
4.3.2 散點圖.............. 37
4.4 Pandas 速成.............. 39
4.4.1 Series .............. 39
4.4.2 DataFrame ............. 40
4.5 總結................ 41
第二部分 數據理解
5 數據導入............ 44
5.1 CSV 文件 ............... 44
5.1.1 文件頭.............. 45
5.1.2 文件中的注釋............ 45
5.1.3 分隔符.............. 45
5.1.4 引號.............. 45
5.2 Pima Indians 數據集 ............ 45
5.3 采用標準 Python 類庫導入數據.......... 46
5.4 采用 NumPy 導入數據............ 46
5.5 采用 Pandas 導入數據............ 47
5.6 總結................ 47
6 數據理解............ 48
6.1 簡單地查看數據............. 48
6.2 數據的維度.............. 49
6.3 數據屬性和類型............. 50
6.4 描述性統計.............. 50
6.5 數據分組分布(適用于分類算法) ......... 51
6.6 數據屬性的相關性............ 52
6.7 數據的分布分析............. 53
6.8 總結................ 54
7 數據可視化 ............ 55
7.1 單一圖表............... 55
7.1.1 直方圖.............. 55
7.1.2 密度圖.............. 56
7.1.3 箱線圖.............. 57
7.2 多重圖表............... 58
7.2.1 相關矩陣圖............ 58
7.2.2 散點矩陣圖............ 60
7.3 總結................ 61
第三部分 數據準備
8 數據預處理 ............ 64
8.1 為什么需要數據預處理............ 64
8.2 格式化數據.............. 65
8.3 調整數據尺度.............. 65
8.4 正態化數據.............. 67
8.5 標準化數據.............. 68
8.6 二值數據 ............... 69
8.7 總結................ 70
9 數據特征選定........... 71
9.1 特征選定 ............... 72
9.2 單變量特征選定 ............. 72
9.3 遞歸特征消除 .............. 73
9.4 主要成分分析 .............. 75
9.5 特征重要性 .............. 76
9.6 總結................ 76
第四部分 選擇模型
10 評估算法............ 78
10.1 評估算法的方法 ............. 78
10.2 分離訓練數據集和評估數據集 .......... 79
10.3 K 折交叉驗證分離 ............ 80
10.4 棄一交叉驗證分離 ............ 81
10.5 重復隨機分離評估數據集與訓練數據集 ........ 82
10.6 總結................ 83
11 算法評估矩陣 ........... 85
11.1 算法評估矩陣 .............. 85
11.2 分類算法矩陣 .............. 86
11.2.1 分類準確度 ............ 86
11.2.2 對數損失函數 ............ 87
11.2.3 AUC 圖.............. 88
11.2.4 混淆矩陣............. 90
11.2.5 分類報告............. 91
11.3 回歸算法矩陣.............. 93
11.3.1 平均絕對誤差............ 93
11.3.2 均方誤差............. 94
11.3.3 決定系數( ........... )??95
11.4 總結................ 96
12 審查分類算法........... 97
12.1 算法審查............... 97
12.2 算法概述............... 98
12.3 線性算法............... 98
12.3.1 邏輯回歸............. 99
12.3.2 線性判別分析............ 100
12.4 非線性算法.............. 101
12.4.1 K 近鄰算法............ 101
12.4.2 貝葉斯分類器............ 102
12.4.3 分類與回歸樹............ 103
12.4.4 支持向量機............ 104
12.5 總結................ 105
13 審查回歸算法........... 106
13.1 算法概述.............. 106
13.2 線性算法.............. 107
13.2.1 線性回歸算法............ 107
13.2.2 嶺回歸算法............ 108
13.2.3 套索回歸算法............ 109
13.2.4 彈性網絡回歸算法........... 110
13.3 非線性算法.............. 111
13.3.1 K 近鄰算法............ 111
13.3.2 分類與回歸樹............ 112
13.3.3 支持向量機............ 112
13.4 總結................ 113
14 算法比較............ 115
14.1 選擇最佳的機器學習算法 ........... 115
14.2 機器學習算法的比較 ............ 116
14.3 總結................ 118
15 自動流程............ 119
15.1 機器學習的自動流程 ............ 119
15.2 數據準備和生成模型的 Pipeline .......... 120
15.3 特征選擇和生成模型的 Pipeline .......... 121
15.4 總結................ 122
第五部分 優化模型
16 集成算法............ 124
16.1 集成的方法 .............. 124
16.2 裝袋算法 .............. 125
16.2.1 裝袋決策樹............ 125
16.2.2 隨機森林............ 126
16.2.3 極端隨機樹............ 127
16.3 提升算法 .............. 129
16.3.1 AdaBoost ............ 129
16.3.2 隨機梯度提升............ 130
16.4 投票算法 .............. 131
16.5 總結................ 132
17 算法調參............ 133
17.1 機器學習算法調參............ 133
17.2 網格搜索優化參數............ 134
17.3 隨機搜索優化參數............ 135
17.4 總結................ 136
第六部分 結果部署
18 持久化加載模型 ........... 138
18.1 通過 pickle 序列化和反序列化機器學習的模型 ...... 138
18.2 通過 joblib 序列化和反序列化機器學習的模型...... 140
18.3 生成模型的技巧............ 141
18.4 總結................ 141
第七部分 項目實踐
19 預測模型項目模板.......... 144
19.1 在項目中實踐機器學習........... 145
19.2 機器學習項目的 Python 模板.......... 145
19.3 各步驟的詳細說明............ 146
步驟 1:定義問題............ 147
步驟 2:理解數據............ 147
步驟 3:數據準備............ 147
步驟 4:評估算法............ 147
步驟 5:優化模型............ 148
步驟 6:結果部署............ 148
19.4 使用模板的小技巧 ............ 148
19.5 總結................ 149
20 回歸項目實例........... 150
20.1 定義問題 .............. 150
20.2 導入數據 .............. 151
20.3 理解數據 .............. 152
20.4 數據可視化 .............. 155
20.4.1 單一特征圖表............ 155
20.4.2 多重數據圖表............ 157
20.4.3 思路總結............ 159
20.5 分離評估數據集 ............ 159
20.6 評估算法 .............. 160
20.6.1 評估算法——原始數據.......... 160
20.6.2 評估算法——正態化數據 ......... 162
20.7 調參改善算法 ............. 164
20.8 集成算法 .............. 165
20.9 集成算法調參 ............. 167
20.10 確定最終模型 ............. 168
20.11 總結 ............... 169
21 二分類實例 ........... 170
21.1 問題定義 .............. 170
21.2 導入數據 .............. 171
21.3 分析數據 .............. 172
21.3.1 描述性統計............ 172
21.3.2 數據可視化............ 177
21.4 分離評估數據集 ............ 180
21.5 評估算法 .............. 180
21.6 算法調參.............. 184
21.6.1 K 近鄰算法調參........... 184
21.6.2 支持向量機調參........... 185
21.7 集成算法.............. 187
21.8 確定最終模型............. 190
21.9 總結................ 190
22 文本分類實例........... 192
22.1 問題定義.............. 192
22.2 導入數據.............. 193
22.3 文本特征提取............. 195
22.4 評估算法.............. 196
22.5 算法調參.............. 198
22.5.1 邏輯回歸調參............ 199
22.5.2 樸素貝葉斯分類器調參.......... 199
22.6 集成算法.............. 200
22.7 集成算法調參............. 201
22.8 確定最終模型............. 202
22.9 總結................ 203
附錄 A .............. 205
A.1 IDE PyCharm 介紹 ............ 205
A.2 Python 文檔.............. 206
A.3 SciPy、 NumPy、 Matplotlib 和 Pandas 文檔 ....... 206
A.4 樹模型可視化.............. 206
A.5 scikit-learn 的算法選擇路徑 .......... 209
A.6 聚類分析.............. 209
序: