-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

機器學習實踐指南:案例應用解析

( 簡體 字)
作者:麥 好 著類別:1. -> 程式設計 -> 機器學習
譯者:
出版社:機械工業出版社機器學習實踐指南:案例應用解析 3dWoo書號: 44680
詢問書籍請說出此書號!

缺書
NT售價: 445

出版日:7/1/2016
頁數:526
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111540212
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

為什么要寫這本書

隨著全球第三次工業革命的迅猛發展,機器學習技術異軍突起,人類對機器學習技術的研究也開辟出了許多全新的應用領域,這使智能機器的計算能力和可定制性上升到了一個新的層次。到了2015年,人類在機器學習領域取得了一系列重大的突破,這項技術已悄無聲息地潛入我們的日常生活,而在未來,機器學習也將擁抱變化,持續發力。如今,它已經在各行各業的技術革新中扮演著日益重要的角色,從各方面影響和改變著我們的生活。

近年來,機器學習技術在國外得到了海量應用和深入發展。2015年11月,谷歌開源了全新的TensorFlow機器學習系統,該系統更快、更智能,也更具有彈性。2015年1月,機器學習平臺 GraphLab改名為Dato,并獲得了 1850 萬美元的新融資(投資方為 Vulcan Capital 、Opus Capital 、New Enterprise Associates、Madrona Venture Group),此前他們曾獲得 680 萬美元的融資。2015年8月,Facebook推出了“M”,Facebook認為人類不僅會回答人工智能所不能回答的問題,而且從長遠來看,人類也會幫助改善人工智能技術,“M”除了能做到回答問題、查閱信息等基本功能外,還可以幫助用戶完成如購買商品、餐廳定位、安排旅行計劃等操作。在2015年12月召開的“2015年神經信息處理系統”(NIPS)會議上,微軟研究人員和工程師公開了20多篇機器學習最新研究成果的論文。此外,微軟還宣布,機器學習正在成為Windows 10的一部分:Skype翻譯可以將口語幾乎實時地翻譯成其他語言,就像《星際迷航》中的通用翻譯器那樣,可以做到面對面的交流。Cortana個人數字助理在與用戶的互動中不斷學習與改進,從而幫助用戶管理日歷、跟蹤快遞,甚至能與用戶聊天和講笑話,實現真正的個性化互動體驗。Clutter是微軟Office 2016的成員,通過學習它可以識別出哪些電子郵件對用戶來說最重要,并自動將不重要的郵件重定向到一個單獨的文件夾中,從而保持用戶收件箱的整潔。2015年9月,美軍軍隊醫療中心指揮官少將Steve Jones在美軍陸軍的一次會議上發言表示,未來可以讓智能機器人代替人類上戰場運送傷員,美國軍方甚至高調宣布:未來戰場上機器人救起的可能不是人,而是機器人,因為智能機器人軍團將代替人類出征。

在國內,機器學習掀起了技術革新的熱潮,智能技術得到了廣泛的普及和應用。隸屬于中國科學院的新松機器人自動化公司生產了智能復合型機器人,這個安裝了眼睛和感知器件的智能機器人,可以在車間里自由地行走并十分精確地完成任務,當其他工位人手不足時,接到指令的他還會主動上前幫忙,馬上進入角色并開始工作。百度創造和完善了大規模機器學習的技術,搭建了一個能容納萬億特征數據的、分鐘級別模型更新的、高效訓練的點擊率預估系統;為進一步深入地發展機器學習技術,百度開始研究如何從“機器學習”到“復制人類大腦”; 此外,百度甚至在2016年提出,百度的產品和服務都靠機器學習等技術來驅動。

隨著機器學習技術在國內外的大量應用,機器學習工程師成為炙手可熱的職位。現在中國已經悄然興起了機器學習的學習熱潮,掌握了機器學習技術的工程師將成為各大IT巨頭瘋搶的“香饃饃”,良好的發展勢頭和較高的職業薪水,吸引著越來越多的軟件工程師和數據分析師涌入機器學習的領域。國內知名的公司百度、阿里巴巴、騰訊(俗稱BAT)為迎接大數據時代帶來的挑戰,早已全面引進機器學習方面的人才,并有組織地對機器學習技術展開大規模的、更深入的研究。其他各大公司(包括非IT行業的公司)也提出了引進機器學習研發工程師的渴求。

但是,機器學習的入門門檻較高,尤其是對研究者的數學理解能力有較高的要求,相對于數據結構、算法導論中講述的計算機算法及系統架構知識來說,機器學習是一個全新的領域,理解機器學習算法往往要從理解它所涉及的數學公式和數學知識開始,打好數學基礎是非常有必要的,一旦掌握了數學分析、線性代數、概率與統計、統計學、離散數學、抽象代數、數學建模等數學理論后,理解機器學習算法就會容易很多,不再畏懼那些讓人生厭的、麻煩的數學符號和數學公式,說不定還會喜歡上這些數學公式,并親自推導一番。希望本書能幫助朋友們進入機器學習的精彩世界。

讀者對象

開發人員。在理解機器學習算法的基礎上,調用機器學習的中間庫進行開發,將機器學習應用于各種場景,如數據分析、圖像識別、文本分類、搜索引擎、中文智能輸入法等。

架構師。在理解機器學習算法的基礎上,適應現代云計算平臺的發展,將機器學習算法應用在大規模的并行計算上。同時,機器學習算法是大數據分析的基礎,如神經網絡、SVM、相似度分析、統計分析等技術。

機器學習的初、中級讀者。人類對機器學習的研究只是一個開始,還遠遠沒有結束。近年來,機器學習一直保持著強勁的發展勢頭,并擁有美好的發展前景,這點不同于某些軟件開發領域中的程序語言或架構知識。掌握機器學習技術有一定的難度,但也意味著,掌握機器學習的技術就能獲得更高的薪水和更具前景的職業。

如何閱讀本書

全書分為準備篇、基礎篇、 統計分析實戰篇和機器學習實戰篇。機器學習算法建立在復雜的計算理論基礎之上,并涉及多門數學學科。抽象的理論加上成堆的數學公式,給部分讀者帶來了極大的挑戰,將渴求學習的人們擋在了門外。針對這種情況,本書力求理論聯系實際,在介紹理論基礎的同時,注重機器學習算法的實際運用,讓讀者更好地明白其中的原理。

準備篇中首先將介紹機器學習的發展及應用前景,使讀者產生濃厚的興趣,同時也將介紹目前常用的科學計算平臺和本書將用到的工程計算平臺,使讀者消除對機器學習的畏難情緒,這些平臺的使用也降低了機器學習軟件實現的難度。

基礎篇將介紹數學知識基礎和計算平臺應用實例,介紹計算平臺的開發基本知識,并應用這些平臺實現計算應用。

最后,本書將針對統計分析實戰和機器學習實戰兩個部分幫助讀者建立機器學習實戰指南,應用計算平臺對統計分析及機器學習算法進行實現和應用,同時還會附上效果圖,讓讀者對機器學習的基本應用和理論基礎有一個形象的理解。

勘誤和支持

由于作者的水平有限,編寫的時間也很倉促,書中難免會出現一些錯誤或不準確的地方,不妥之處懇請讀者批評指正。如果遇到任何問題,或有更多的寶貴意見,歡迎發送郵件至我的郵箱myhaspl@myhaspl.com,很期待能夠聽到您的真摯反饋。此外,本書的代碼及相關資源(包括思考題中涉及的數據等)的下載地址為:https://yunpan.cn/cYjhBYGLKkKTb(提取碼:65ad)。

致謝

首先我要感謝偉大的電影《機械公敵》及其主角威爾?史密斯,這位美國演員主演了《當幸福來敲門》《拳王阿里》《絕地戰警》《全民超人漢考克》《黑衣人》《機械公敵》,他曾獲奧斯卡獎和金球獎提名。他主演的《當幸福來敲門》讓很多人理解到了幸福是什么,而《機械公敵》讓我看到了人工智能的未來,我相信《機械公敵》描述的以下場景在將來一定能實現:

公元2035年,智能型機器人已被人類廣泛利用,作為最好的生產工具和人類伙伴,機器人在各個領域扮演著日益重要的角色。而由于眾所周知的機器人“三大安全法則”的限制,人類對這些能夠勝任各種工作且毫無怨言的伙伴充滿信任,它們中的很多甚至已經成為各個家庭的組成成員。

在此,我衷心地感謝機械工業出版社華章公司的編輯楊福川老師和策劃編輯楊繡國老師,由于他們的魄力和遠見,讓我順利地完成了全部書稿。最后我要感謝家人的大力支持和無私奉獻,正因為有他們的關心和照顧,我才有足夠的時間和精力來完成本書的撰寫工作。

謹以此書,獻給熱愛機器學習的朋友,以及喜歡威爾?史密斯的影迷。



麥好(Myhaspl)

2016年3月于中國廣東
內容簡介:

本書以算法應用為主線,由淺入深細致地講解,從全新的角度詮釋機器學習的算法理論,同時注重機器學習算法的實際運用。為讓讀者便于理解,首先概述了機器學習算法,并介紹目前常用的科學計算平臺和書中將用到的工程計算平臺,通過應用計算平臺,降低了算法實現的難度;然后,對相關計算平臺應用實例進行講解,介紹計算平臺的開發基礎,并講解計算的應用與實例;最后,以數據統計分析實戰和機器學習實戰為重點,應用計算平臺實現數據統計分析以及機器學習算法。第2版相對第1版擴充了很多內容,比如:生產環境部署、假設檢驗與回歸、描述性分析、圖像算法與機器視覺、更多的機器學習算法、自然語言處理等。此書可供IT專業人員和機器學習愛好者參考使用。
最近幾年,借著大數據的東風,機器學習一直保持著強勁的發展勢頭,資本市場也一度為之“瘋狂”,到了2015年,人類在機器學習領域取得了一系列重大突破,2016年及未來若干年將是“機器學習”的發力階段。本書致力于闡述機器學習實踐的必備知識,第1版發行以后,深受廣大讀者的喜愛。然而,由于機器學習涉及的內容繁多,以致必須了解的知識也很龐雜,而第1版成書匆忙,部分內容缺失或描述不夠細致,因此第2版在此基礎上進行了完善,增補內容達40%以上。本書分為四部分,由淺入深講解機器學習算法,希望能幫助更多的朋友進入機器學習的精彩世界。
目錄:

推薦序

前言

第一部分 準備篇

第1章 機器學習發展及應用前景 2

1.1 機器學習概述 2

1.1.1 什么是機器學習 3

1.1.2 機器學習的發展 3

1.1.3 機器學習的未來 4

1.2 機器學習應用前景 5

1.2.1 數據分析與挖掘 5

1.2.2 模式識別 6

1.2.3 更廣闊的領域 6

1.3 小結 7

第2章 科學計算平臺 8

2.1 科學計算軟件平臺概述 9

2.1.1 常用的科學計算軟件 9

2.1.2 本書使用的工程計算平臺 10

2.2 計算平臺的配置 11

2.2.1 Numpy等Python科學計算包的安裝與配置 11

2.2.2 OpenCV 安裝與配置 14

2.2.3 mlpy 安裝與配置 14

2.2.4 BeautifulSoup安裝與配置 15

2.2.5 Neurolab安裝與配置 15

2.2.6 R安裝與配置 16

2.3 小結 16

第二部分 基礎篇

第3章 計算平臺應用實例 18

3.1 Python計算平臺簡介及應用實例 18

3.1.1 Python語言基礎 18

3.1.2 Numpy庫 29

3.1.3 pylab、matplotlib繪圖 36

3.1.4 圖像基礎 38

3.1.5 圖像融合與圖像鏡像 46

3.1.6 圖像灰度化與圖像加噪 48

3.1.7 聲音基礎 51

3.1.8 聲音音量調節 53

3.1.9 圖像信息隱藏 58

3.1.10 聲音信息隱藏 62

3.2 R語言基礎 68

3.2.1 基本操作 69

3.2.2 向量 71

3.2.3 對象集屬性 77

3.2.4 因子和有序因子 78

3.2.5 循環語句 79

3.2.6 條件語句 79

3.3 R語言科學計算 80

3.3.1 分類(組)統計 80

3.3.2 數組與矩陣基礎 81

3.3.3 數組運算 84

3.3.4 矩陣運算 85

3.4 R語言計算實例 93

3.4.1 學生數據集讀寫 93

3.4.2 最小二乘法擬合 94

3.4.3 交叉因子頻率分析 96

3.4.4 向量模長計算 97

3.4.5 歐氏距離計算 98

3.5 小結 99

思考題 99

第4章 生產環境基礎 100

4.1 Windows Server 2008基礎 100

4.1.1 Windows Server 2008 R2概述 101

4.1.2 Windows PowerShell 102

4.2 Linux基礎 103

4.2.1 Linux命令 104

4.2.2 Shell基礎 114

4.3 Vim編輯器 122

4.3.1 Vim編輯器概述 122

4.3.2 Vim常用命令 123

4.4 虛擬化平臺 124

4.4.1 Citrix Xenserver概述 125

4.4.2 Citrix Xenserver部署 126

4.4.3 基于XenCenter的虛擬服務器管理 126

4.5 Linux環境下的NumPy安裝 135

4.6 Linux環境下的R運行環境 136

4.7 PyPy編譯器 136

4.7.1 PyPy概述 136

4.7.2 PyPy安裝與配置 137

4.7.3 PyPy性能 137

4.7.4 PyPy實踐之Lempel-Ziv壓縮 138

4.8 小結 145

思考題 146

第三部分 統計分析實戰篇

第5章 統計分析基礎 148

5.1 數據分析概述 148

5.2 數學基礎 149

5.3 回歸分析 154

5.3.1 單變量線性回歸 154

5.3.2 多元線性回歸 156

5.3.3 非線性回歸 157

5.4 數據分析基礎 159

5.4.1 區間頻率分布 159

5.4.2 數據直方圖 161

5.4.3 數據散點圖 162

5.4.4 五分位數 164

5.4.5 累積分布函數 165

5.4.6 核密度估計 166

5.5 數據分布分析 167

5.6 小結 169

思考題 170

第6章 描述性分析案例 171

6.1 數據圖形化案例解析 171

6.1.1 點圖 171

6.1.2 餅圖和條形圖 172

6.1.3 莖葉圖和箱線圖 173

6.2 數據分布趨勢案例解析 175

6.2.1 平均值 175

6.2.2 加權平均值 175

6.2.3 數據排序 176

6.2.4 中位數 177

6.2.5 極差、半極差 177

6.2.6 方差 178

6.2.7 標準差 178

6.2.8 變異系數、樣本平方和 178

6.2.9 偏度系數、峰度系數 179

6.3 正態分布案例解析 180

6.3.1 正態分布函數 180

6.3.2 峰度系數分析 181

6.3.3 累積分布概率 181

6.3.4 概率密度函數 182

6.3.5 分位點 183

6.3.6 頻率直方圖 185

6.3.7 核概率密度與正態概率分布圖 185

6.3.8 正態檢驗與分布擬合 186

6.3.9 其他分布及其擬合 188

6.4 多變量分析 189

6.4.1 多變量數據分析 189

6.4.2 多元數據相關性分析 197

6.5 小結 201

思考題 201

第7章 假設檢驗與回歸模型案例 202

7.1 假設檢驗 202

7.1.1 二項分布假設檢驗 202

7.1.2 數據分布檢驗 204

7.1.3 正態總體均值檢驗 205

7.1.4 列聯表 206

7.1.5 符號檢測 207

7.1.6 秩相關檢驗 210

7.1.7 Kendall相關檢驗 213

7.2 回歸模型 214

7.2.1 回歸預測與顯著性檢驗 214

7.2.2 回歸診斷 216

7.2.3 回歸優化 217

7.2.4 主成分回歸 219

7.2.5 廣義線性模型 221

7.3 小結 226

思考題 226

第四部分 機器學習實戰篇

第8章 機器學習算法 230

8.1 神經網絡 230

8.1.1 Rosenblatt感知器 232

8.1.2 梯度下降 245

8.1.3 反向傳播與多層感知器 251

8.1.4 Python神經網絡庫 270

8.2 統計算法 272

8.2.1 平均值 272

8.2.2 方差與標準差 274

8.2.3 貝葉斯算法 276

8.3 歐氏距離 279

8.4 余弦相似度 280

8.5 SVM 281

8.5.1 數學原理 281

8.5.2 SMO算法 283

8.5.3 算法應用 283

8.6 回歸算法 287

8.6.1 線性代數基礎 288

8.6.2 最小二乘法原理 289

8.6.3 線性回歸 290

8.6.4 多元非線性回歸 292

8.6.5 嶺回歸方法 294

8.6.6 偽逆方法 295

8.7 PCA降維 296

8.8 關聯規則 297

8.8.1 關聯規則概述 297

8.8.2 頻繁項集算法 298

8.8.3 關聯規則生成 301

8.8.4 實例分析 302

8.9 自動分類 306

8.9.1 聚類算法 306

8.9.2 決策樹 313

8.9.3 AdaBoost 316

8.9.4 競爭型神經網絡 317

8.9.5 Hamming神經網絡 323

8.10 小結 325

思考題 325

第9章 數據擬合案例 327

9.1 數據擬合 327

9.1.1 圖像分析法 327

9.1.2 神經網絡擬合法 338

9.2 線性濾波 352

9.2.1 WAV聲音文件 352

9.2.2 線性濾波算法過程 352

9.2.3 濾波Python實現 353

9.3 數據或曲線平滑 358

9.3.1 平滑概述 358

9.3.2 移動平均 359

9.3.3 遞歸線性過濾 362

9.3.4 指數平滑 364

9.4 小結 368

思考題 368

第10章 圖像算法案例 370

10.1 圖像邊緣算法 370

10.1.1 數字圖像基礎 370

10.1.2 算法描述 371

10.2 圖像匹配 372

10.2.1 差分矩陣求和 373

10.2.2 差分矩陣均值 375

10.2.3 歐氏距離匹配 376

10.3 圖像分類 382

10.3.1 余弦相似度 382

10.3.2 PCA圖像特征提取算法 388

10.3.3 基于神經網絡的圖像分類 389

10.3.4 基于SVM的圖像分類 394

10.4 高斯噪聲生成 397

10.5 二值化 401

10.5.1 threshold 401

10.5.2 adaptiveThreshold 402

10.6 插值與縮放 404

10.7 仿射 405

10.7.1 仿射原理 405

10.7.2 仿射變換實例 405

10.8 透視投影與透視變換 406

10.8.1 透視投影原理 406

10.8.2 透視投影實例 407

10.9 灰度變換與圖像增強 409

10.9.1 灰度變換概述 409

10.9.2 對數變換 409

10.9.3 分段線性變換 410

10.9.4 指數變換 411

10.9.5 直方圖均衡化 412

10.10 圖像濾波與除噪 415

10.10.1 均一化塊濾波 415

10.10.2 鄰域平均法 420

10.10.3 中值濾波 423

10.10.4 高斯濾波 427

10.10.5 雙邊濾波 429

10.10.6 卷積濾波 431

10.10.7 邊緣檢測 433

10.11 小結 435

思考題 435

第11章 機器視覺案例 437

11.1 人臉辨識 437

11.1.1 人臉定位 437

11.1.2 人臉辨識 439

11.2 手寫數字識別 446

11.2.1 手寫數字識別算法 446

11.2.2 算法的Python實現 447

11.3 運動偵測 449

11.3.1 視頻采集 450

11.3.2 差分算法 452

11.3.3 光流法 456

11.4 形狀檢測 458

11.4.1 KNN算法概述 458

11.4.2 形狀特征提取 459

11.4.3 形狀分類 459

11.5 小結 462

思考題 462

第12章 文本分類案例 463

12.1 文本分類概述 463

12.2 余弦相似度分類 464

12.2.1 中文分詞 465

12.2.2 停用詞清理 467

12.2.3 算法實戰 468

12.3 樸素貝葉斯分類 473

12.3.1 算法描述 473

12.3.2 先驗概率計算 474

12.3.3 最大后驗概率 474

12.3.4 算法實現 474

12.4 自然語言處理 480

12.4.1 NLTK簡介 480

12.4.2 NLTK與jieba的配置 481

12.4.3 中文分詞并標注詞性 483

12.4.4 詞特征指標分析 484

12.4.5 Web文檔分析 499

12.4.6 Web文檔的樸素貝葉斯分類 503

12.4.7 語法結構分析 515

12.4.8 Web文檔聚類 518

12.5 小結 526

思考題 526
序: