|
-- 會員 / 註冊 --
|
|
|
|
深入淺出數據科學 ( 簡體 字) |
作者:[美] 斯楠·奧茲德米爾(Sinan Ozdemir) | 類別:1. -> 程式設計 -> 綜合 |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 49871 詢問書籍請說出此書號!【缺書】 NT售價: 345 元 |
出版日:10/1/2018 |
頁數:311 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115481269 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介: 數據科學家是目前熱門的職業之一。本書全面介紹了成為合格數據科學家所需的知識、技能和工作流程,是一本內容全面的實用性技術圖書。 本書分為13章,其中第1∼3章介紹數據科學;第4∼8章介紹數學知識,包括統計學和概率論;第9章介紹數據可視化;第10∼12章介紹機器學習;第13章介紹案例。各個章節內容均由淺入深,同時通過案例和Python代碼,使讀者掌握實戰技能。 本書適合有志于成為數據科學家的師生或業界新手,同時也適合經驗豐富的職場老手參考。
|
目錄:第 1章 如何聽起來像數據科學家 1 1.1 什么是數據科學 3 1.1.1 基本的專業術語 3 1.1.2 為什么是數據科學 4 1.1.3 案例:西格瑪科技公司 4 1.2 數據科學韋恩圖 5 1.2.1 數學 7 1.2.2 計算機編程 8 1.2.3 為什么是Python 9 1.2.4 領域知識 13 1.3 更多的專業術語 14 1.4 數據科學案例 15 1.4.1 案例:自動審核政府文件 16 1.4.2 案例:市場營銷費用 17 1.4.3 案例:數據科學家的崗位描述 18 1.5 總結 21
第 2章 數據的類型 23 2.1 數據的“味道” 23 2.2 為什么要進行區分 24 2.3 結構化數據和非結構化數據 24 2.4 定量數據和定性數據 28 2.4.1 案例:咖啡店數據 28 2.4.2 案例:世界酒精消費量 30 2.4.3 更深入的研究 32 2.5 簡單小結 33 2.6 數據的4個尺度 33 2.6.1 定類尺度 34 2.6.2 定序尺度 35 2.6.3 定距尺度 37 2.6.4 定比尺度 41 2.7 數據是旁觀者的眼睛 42 2.8 總結 43
第3章 數據科學的5個步驟 44 3.1 數據科學簡介 44 3.2 5個步驟概覽 45 3.2.1 提出有意思的問題 45 3.2.2 獲取數據 45 3.2.3 探索數據 45 3.2.4 數據建模 46 3.2.5 可視化和分享結果 46 3.3 探索數據 46 3.3.1 數據探索的基本問題 47 3.3.2 數據集1:Yelp點評數據 48 3.3.3 數據集2:泰坦尼克 56 3.4 總結 60
第4章 基本的數學知識 61 4.1 數學學科 61 4.2 基本的數學符號和術語 62 4.2.1 向量和矩陣 62 4.2.2 算術符號 65 4.2.3 圖表 68 4.2.4 指數/對數 69 4.2.5 集合論 71 4.3 線性代數 74 4.4 總結 78
第5章 概率論入門:不可能,還是不太可能 79 5.1 基本的定義 79 5.2 概率 80 5.3 貝葉斯VS頻率論 81 5.4 復合事件 84 5.5 條件概率 86 5.6 概率定理 87 5.6.1 加法定理 87 5.6.2 互斥性 88 5.6.3 乘法定理 88 5.6.4 獨立性 89 5.6.5 互補事件 89 5.7 再進一步 91 5.8 總結 92
第6章 高等概率論 93 6.1 互補事件 93 6.2 重溫貝葉斯思想 94 6.2.1 貝葉斯定理 94 6.2.2 貝葉斯定理的更多應用 97 6.3 隨機變量 100 6.3.1 離散型隨機變量 101 6.3.2 連續型隨機變量 110 6.4 總結 113
第7章 統計學入門 114 7.1 什么是統計學 114 7.2 如何獲取數據 115 7.3 數據抽樣 118 7.3.1 概率抽樣 118 7.3.2 隨機抽樣 119 7.3.3 不等概率抽樣 120 7.4 如何描述統計量 120 7.4.1 測度中心 120 7.4.2 變異測度 121 7.4.3 變異系數 125 7.4.4 相對位置測度 126 7.5 經驗法則 132 7.6 總結 134
第8章 高等統計學 135 8.1 點估計 135 8.2 抽樣分布 139 8.3 置信區間 142 8.4 假設檢驗 145 8.4.1 實施假設檢驗 146 8.4.2 單樣本t檢驗 147 8.4.3 I型錯誤和II型錯誤 151 8.4.4 分類變量的假設檢驗 151 8.5 總結 155
第9章 交流數據 156 9.1 為什么交流數據很重要 156 9.2 識別有效和無效的可視化 157 9.2.1 散點圖 157 9.2.2 折線圖 159 9.2.3 條形圖 160 9.2.4 直方圖 162 9.2.5 箱形圖 163 9.3 當圖表和統計在說謊 166 9.3.1 相關性VS因果關系 166 9.3.2 辛普森悖論 168 9.3.3 如果相關性不等于因果關系,那什么導致了因果關系 169 9.4 語言交流 170 9.4.1 關鍵在于講故事 170 9.4.2 正式場合的注意事項 170 9.5 為什么演示、如何演示和演示策略 171 9.6 總結 172
第 10章 機器學習精要:你的烤箱在學習嗎 173 10.1 什么是機器學習 173 10.2 機器學習并不完美 175 10.3 機器學習如何工作 176 10.4 機器學習的分類 176 10.4.1 監督學習 177 10.4.2 無監督學習 182 10.4.3 強化學習 183 10.5 統計模型如何納入以上分類 186 10.6 線性回歸 186 10.6.1 增加更多預測因子 191 10.6.2 回歸指標 193 10.7 Logistic回歸 199 10.8 概率、幾率和對數幾率 201 10.9 啞變量 206 10.10 總結 210
第 11章 樹上無預言,真的嗎 212 11.1 樸素貝葉斯分類 212 11.2 決策樹 220 11.2.1 計算機如何生成回歸樹 221 11.2.2 計算機如何擬合分類樹 222 11.3 無監督學習 226 11.3.1 無監督學習的使用場景 226 11.3.2 K均值聚類 227 11.3.3 如何選擇最佳的K值,并對簇進行評價 233 11.4 特征提取和主成分分析 235 11.5 總結 246
第 12章 超越精要 247 12.1 偏差-方差權衡 247 12.1.1 偏差導致的誤差 248 12.1.2 方差導致的誤差 248 12.1.3 兩種極端的偏差-方差權衡情況 255 12.1.4 偏差-方差如何組成誤差函數 256 12.2 K層交叉驗證 257 12.3 網格搜索算法 261 12.4 集成技術 266 12.4.1 隨機森林 268 12.4.2 隨機森林VS決策樹 273 12.5 神經網絡 274 12.6 總結 279
第 13章 案例 280 13.1 案例1:基于社交媒體預測股票價格 280 13.1.1 文本情感分析 280 13.1.2 探索性數據分析 281 13.1.3 超越案例 294 13.2 案例2:為什么有些人會對配偶撒謊 295 13.3 案例3:初試TensorFlow 301 13.4 總結 311
|
序: |
|