Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模，數據工程一次搞定！ @ 3dWoo大學簡體電腦書店

Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模，數據工程一次搞定！ ( 繁體字)
作者：陳會安著	類別：1. -> 程式設計 -> Python
出版社：旗標出版	3dWoo書號： 55981 詢問書籍請說出此書號！缺書 NT定價： ~~680~~ 元折扣價： 537 元
出版日：8/14/2022
頁數：616
光碟數：0
站長推薦：
印刷：黑白印刷	語系： ( 繁體字 )
ISBN：9789863127246	加入購物車 │加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
目錄前言內容簡介第一篇資料科學和 Python 基礎第 1 章資料科學概論與開發環境建立 – Anaconda 1-1 資料科學的基礎 1-2 資料的種類 1-3 資料科學的五大步驟 1-4 Python 開發環境的建立第 2 章 Python 程式語言 2-1 認識 Python 程式語言 2-2 變數、資料型態與運算子 2-3 流程控制 2-4 函數、模組與套件 2-5 容器型態 2-6 類別（Class）與物件（Object）第二篇網路爬蟲和 Open Data (取得、清理與儲存資料) 第 3 章取得網路資料 3-1 認識網路爬蟲 3-2 使用 Requests 送出 HTTP 請求 3-3 取得 HTTP 回應內容 3-4 使用 Requests 送出進階 HTTP 請求 3-5 使用 Selenium 取得網路資料第 4 章資料擷取 4-1 如何進行網路爬蟲的資料擷取 4-2 BeautifulSoup 剖析和走訪 HTML網頁 4-3 使用 find() 函數搜尋 HTML 網頁 4-4 使用 CSS 選擇器選取 HTML 標籤 4-5 使用正規表達式比對 HTML 標籤內容 4-6 Selenium + BeautifulSoup 擷取網頁資料第 5 章資料清理與資料儲存 5-1 資料清理 5-2 將資料存入 CSV 和 JSON 檔案 5-3 將資料存入 SQLite 資料庫 5-4 將資料存入 MySQL 資料庫 5-5 將資料存入 NoSQL 資料庫第 6 章網路爬蟲實作案例 6-1 使用 Web API 取得網路資料 6-2 網路爬蟲的常見問題 6-3 擷取多筆記錄和 HTML 表格資料 6-4 擷取多頁面的分頁記錄資料 6-5 實作案例：majortests.com 的單字清單 6-6 實作案例：批踢踢 PTT BBS 熱門文章第三篇 Python資料科學套件 – 探索資料（資料視覺化與大數據分析）第 7 章向量與矩陣運算 – NumPy 套件 7-1 Python 資料科學套件 7-2 陣列的基本使用 7-3 一維陣列–向量的運算 7-4 二維陣列–矩陣的運算 7-5 陣列廣播 7-6 陣列的相關函數第 8 章資料處理與分析 – Pandas 套件 8-1 Pandas 套件的基礎 8-2 DataFrame 的基本使用 8-3 選擇、過濾與排序資料 8-4 合併與更新 DataFrame 物件 8-5 群組、樞紐分析與套用函數第 9 章大數據分析 (一) – Matplotlib 和 Pandas 資料視覺化 9-1 Matplotlib 套件的基本使用 9-2 使用 Matplotlib 套件繪製各種圖表 9-3 Matplotlib 套件的進階使用 9-4 Pandas 套件的資料視覺化第 10 章大數據分析 (二) – Seaborn 統計資料視覺化 10-1 大數據分析–資料視覺化 10-2 Seaborn 套件的基礎 10-3 Seaborn 套件的基本使用 10-4 繪製資料集關聯性的圖表 10-5 繪製資料集分佈情況的圖表 10-6 分類型資料的圖表 10-7 水平顯示的寬圖表 10-8 迴歸圖表第 11 章機率與統計 11-1 認識機率 11-2 組合事件與條件機率 11-3 機率定理與排列組合 11-4 統計的基礎 11-5 集中量數與離散量數 11-6 隨機變數與機率分配第 12 章估計與檢定 12-1 抽樣與抽樣分配 12-2 標準常態分配與資料標準化 12-3 中央極限定理 12-4 估計 12-5 假設檢定 12-6 卡方檢定第 13 章探索性資料分析實作案例 13-1 找出資料的關聯性 13-2 特徵縮放與標準化 13-3 資料整理–資料轉換與清理 13-4 資料預處理與探索性資料分析 13-5 實作案例：鐵達尼號資料集的探索性資料分析第四篇人工智慧、機器學習與深度學習 – 預測資料第 14 章人工智慧與機器學習概論 – 認識深度學習 14-1 人工智慧概論 14-2 機器學習 14-3 機器學習的種類 14-4 深度學習第 15 章機器學習演算法實作案例 – 迴歸 15-1 認識機器學習演算法 15-2 線性迴歸 15-3 複迴歸 15-4 Logistic 迴歸第 16 章機器學習演算法實作案例 – 分類與分群 16-1 決策樹 16-2 K 鄰近演算法 16-3 K-means 演算法第 17 章深度學習神經網路實作案例 17-1 啟用 Google Colaboratory 雲端服務 17-2 Google Colaboratory 基本使用 17-3 深度學習實例：鳶尾花資料集的多元分類 17-4 深度學習實作案例：辨識 MINIST 手寫數字圖片附錄A：HTML 網頁結構與 CSS 附錄B：Python 文字檔案存取與字串處理附錄C：下載與安裝 MongoDB 和 MySQL 資料庫色彩：黑白附件：書附檔案下載 (詳內文) 【題材涵蓋最全面！一本書掌握資料科學 / 數據工程必學 know-how！】從大數據到人工智慧世代，其背後蘊含的關鍵技術與理論不脫資料科學、機器學習的範疇。基本上，資料科學需要的背景知識與技能相當的多，通常要會 Python 程式設計基礎、熟悉相關 Python 套件和模組的使用；再加上機器學習的基礎就是機率和統計，因此也免不了得學機率和統計知識，可說有一拖拉庫的主題等著你去學，也難怪市面上各主題 (程式基礎、統計、套件、機器學習建模...) 的專書滿坑滿谷，一時間實在讓人難以消化... 為了降低讀者初學資料科學面對的負擔以及混亂感，我們精心設計了這本入門實戰教本，秉持讓讀者「買一本抵多本」的精神，本書一次涵蓋所有入門必須熟悉的重要題材，同時也將初學資料科學的脈絡梳理清楚。在章節的安排上，本書從資料取得的網路爬蟲開始，提供一個標準 SOP 來幫助讀者從網路取得資料；接著說明資料科學必學的 Python 重量級套件，再接著介紹機率、統計和探索式資料分析的基礎知識，最後進入最熱門的機器學習、深度學習建模主題。這一連串「取得資料 → 探索資料 → 預測分析」是一套完整的資料科學 / 數據工程實戰訓練，跟著本書掌握這些重要 know-how 後，就不難看懂網路上眾多資料科學、機器學習專案的 Python 程式碼和線上教材，甚至參與資料科學、機器學習的網路競賽；希望本書能協助讀者開啟資料科學家 / 數據工程師的成功之路！ □ 資料科學三部曲：取得資料 → 探索資料 → 預測分析 □ 一次補足最入門的統計和機率基礎 □ Python 開發環境與基礎語法快速上手 □ 從網頁爬蟲、資料清理到資料視覺化，快速完成資料探索的預處理程序 □ 將清理後的資料存入 SQL 資料庫，便於日後存取利用 □ 實踐資料科學的四大套件：NumPy、Pandas、Matplotlib、Seaborn 一次掌握 □ 用 Scikit-learn、tensorflow.Keras 套件實作最熱門的 AI 機器學習應用