|
-- 會員 / 註冊 --
|
|
|
|
SPSS統計分析與數據挖掘(第2版) ( 簡體 字) |
作者:謝龍漢,尚濤,蔡明京 | 類別:1. -> 工具書、軟體 -> 統計軟體 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 38071 詢問書籍請說出此書號!【缺書】 【不接受訂購】 |
出版日:4/1/2014 |
頁數:508 |
光碟數:1 (含視頻教學) |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
【不接受訂購】 | ISBN:9787121225499 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:再版前言
SPSS(Statistical Product and Service Solutions,統計產品和服務解決方案)是當今國際上最流行的統計分析軟件之一,具有界面友好、統計功能強大、前后處理功能完善等優點。SPSS提供了廣泛的數據收集、分類、分析和處理技術,揭示了數據模式、異常,以及關鍵變量和關系,幫助企業深入洞察企業信息,做出更好決策。本書從SPSS窗口操作出發,用案例的形式介紹SPSS數據分析在各個領域的廣泛應用。 本書集作者多年使用SPSS的工作經驗,并在改正第1版錯誤的基礎上編寫,在編寫過程中,突出了以下特點。 ? 直觀易懂性。全書以圖解實例的形式介紹基礎知識和實例操作,所有的知識模塊和案例分析都盡可能詳細,模塊操作采取中英文介紹的方式進行,直觀易懂,使讀者能夠在最短的時間內獲取最多的知識。 ? 先進性。以最新的SPSS 21.0中文版為藍本進行講解,中英文并用,廣泛吸收國內外優秀教材的成果進行內容編排,在系統介紹基本理論和基本方法的同時,注意介紹新的成熟的內容,以及統計學在實際問題中的應用。 ? 實用性。全書采用了基礎知識介紹和實例操作相結合的方法,互相補充,書中的實例大多來源于經濟生活之中,使讀者在學完本書后能夠快速將知識應用于實踐。 ? 結構清晰,講解詳盡。全書采用基礎知識—窗口操作—綜合實例分析的循序漸進的講解方法,一步一步地提高讀者的SPSS操作知識,而且每個知識點和實例都盡可能詳細地講解,使讀者學習起來輕松自如。 ? 全部的案例數據、程序與多媒體示范相結合。本書的配套光盤 中提供了所有實例的數據、SPSS窗口操作視頻,讀者可以在觀看錄像中增強對知識點的理解。 本書共24章,依次介紹SPSS基本文件管理、基本統計分析、高級統計分析、決策樹模型、神經網絡模型、信用風險、社會經濟評價,以及各章節中的案例分析等內容。 第 1 章 SPSS軟件概述。包括SPSS軟件簡介、SPSS操作入門、SPSS各個模塊,以及SPSS幫助系統。 第 2 章 SPSS數據挖掘系統。包括數據挖掘概述、SPSS數據挖掘過程的介紹,以便掌握數據挖掘基本概念、流程等知識。 第 3 章 數據文件、變量與函數。包括SPSS的變量類型、SPSS數據文件的打開和保存,最后介紹SPSS的函數。 第 4 章 數據預處理。包括最基本的數據文件的整理和數據變量的變換和計算。 第 5 章 基本統計分析。包括基本概念、頻數過程、描述性統計分析過程、數據探索性分析過程,以及列聯表分析過程。 第 6 章 參數檢驗。包括參數估計和假設檢驗概述、均值(Means)過程、單樣本t檢驗、獨立樣本t檢驗,以及配對兩樣本 t 檢驗。 第 7 章 基本圖形的繪制。包括統計圖概述、條形圖、線圖、面積圖、餅圖、高低圖、質量控制圖、箱圖、散點圖、直方圖、P-P圖和Q-Q圖,以及時間序列圖。 第 8 章 非參數檢驗。包括非參數檢驗概述、2檢驗、二項分布檢驗、游程檢驗、K-S檢驗、兩獨立樣本分布位置檢驗、多個獨立樣本分布位置檢驗、兩相關樣本分布位置檢驗、多個獨立樣本分布位置檢驗。 第 9 章 方差分析。包括方差分析的基本原理、單因素方差分析、多因素方差分析、協方差分析。 第 10 章 回歸分析。包括線性回歸、非線性回歸,以及Logistic過程。 第 11 章 相關分析。包括相關分析概述、Bivariate過程、Partial過程,以及Distances(距離)過程。 第 12 章 聚類分析。包括聚類分析的原理、快速聚類的SPSS過程、系統聚類的SPSS過程、兩階段聚類的SPSS過程,以及案例分析。 第 13 章 判別分析。包括判別分析的基本原理、一般判別分析過程、逐步判別分析過程。 第 14 章 因子分析。包括因子分析,以及SPSS中的因子分析操作過程。 第 15 章 對應分析。包括對應分析的基本原理、對應分析過程、Optimal Scaling過程。 第 16 章 可靠性和多維尺度分析。包括可靠性分析、多維尺度分析及案例。 第 17 章 生存分析。包括生存分析概述、Life Tables過程、Kaplan-Meier分析過程、Cox模型回歸分析。 第 18 章 對數線性模型。包括對數線性模型概述、General過程、Logit過程、模型(Model)Selection過程。 第 19 章 時間序列分析。包括時間序列概述、時間序列數據的預處理、指數平滑方法、ARIMA模型、季節分解模型。 第 20 章 缺失值分析。包括SPSS中的缺失值理論概述、SPSS缺失值分析操作,以及缺失值實例分析。 第 21 章 決策樹模型。包括決策樹模型概述、SPSS中參數設置,以及利用實例分析來介紹決策樹模型的應用。 第 22 章 神經網絡。包括神經網絡概述、SPSS神經網絡模型的設置及實例分析。 第 23 章 信用風險分析。包括主要信用風險概述,以及利用SPSS解決信用風險的各種實例分析。 第 24 章 SPSS在社會經濟綜合評價中的應用。包括SPSS的各種分析案例,包括沿海省市經濟綜合指標的主成分分析、中國城鎮居民消費結構的聚類分析研究,以及我國內地可支配收入和消費性支出之間的回歸分析。 本書主要由謝龍漢、尚濤、蔡明京完成,參與編寫和光盤開發的還有林偉、魏艷光、林木議、王悅陽、林偉潔、林樹財、鄭曉、吳苗、盧彩元、蘇延全、王文娟、周金華、呂云峰、付應乾、唐長剛、王敏、楊峰、趙新宇、丁圓圓等。由于時間倉促,書中難免有疏漏之處,請讀者諒解。讀者可通過電子郵件xielonghan @yahoo.com.cn與我們交流。 注:本書在介紹軟件應用時,命令、選項等包含英文注釋,有助于使用英文版軟件的讀者學習。 編著者 |
內容簡介:本書基于SPSS 21.0編寫,每章均有大量分析案例,結合案例對SPSS各模塊的統計分析功能和圖形功能進行詳細講解。本書具體內容為SPSS簡介、SPSS數據挖掘系統介紹、數據文件管理、數據預處理、基本統計分析、多重反應分析、均值的比較與檢驗、統計圖制作、參數檢驗、回歸分析、方差分析、相關分析、聚類分析、判別分析、因子分析、對應分析、信度分析、生存分析、對數線性模型、時間序列分析、缺失值分析,以及SPSS在財務智能、數據預測、股市分析、社會經濟分析、金融數據分析等方面的數據挖掘應用。 本書最大特點是拋棄了其他同類書籍中只介紹理論用法、缺乏案例分析的弊端,全書給出大量數據挖掘分析案例,并配有視頻講解,為讀者展示SPSS在數據分析、信用風險管理、直銷分析、社會經濟分析等實際項目中的應用。 |
目錄:第1章 SPSS軟件概述 1 1.1 SPSS簡介 1 1.2 SPSS操作入門 2 1.2.1 軟件安裝、啟動及退出 3 1.2.2 操作環境 4 1.2.3 系統參數的設置 7 1.3 SPSS的幫助系統 14 第2章 SPSS數據挖掘系統 16 2.1 數據挖掘概述 16 2.1.1 數據挖掘的含義 16 2.1.2 數據挖掘與OLAP 17 2.1.3 數據挖掘和統計學 17 2.1.4 數據挖掘的目的 18 2.1.5 數據挖掘應用 18 2.1.6 數據挖掘流程 18 2.2 成功的數據挖掘 19 2.2.1 CRISP-DM方法論 20 2.2.2 選擇數據挖掘工具 24 2.2.3 SPSS數據挖掘 25 2.3 SPSS數據挖掘的過程 28 2.3.1 商業理解 28 2.3.2 數據理解 28 2.3.3 數據準備 28 2.3.4 數據模型 29 2.3.5 評估 29 2.3.6 部署 30 第3章 數據文件、變量與函數 32 3.1 SPSS的變量類型 32 3.1.1 數據的輸入 33 3.1.2 變量的編輯 34 3.2 數據文件的打開和保存 36 3.2.1 打開SPSS數據文件 36 3.2.2 打開其他格式的數據文件 36 3.2.3 數據文件保存 37 3.3 SPSS函數 38 3.3.1 算術函數 38 3.3.2 統計函數 38 3.3.3 邏輯函數 39 3.3.4 日期和時間函數 39 3.3.5 隨機變量函數 41 3.3.6 反分布函數 43 3.3.7 累計分布函數 43 3.3.8 缺失值函數 45 3.3.9 字符串函數 46 第4章 數據預處理 48 4.1 數據文件的整理 48 4.1.1 排序個案(Sort Case)過程 49 4.1.2 轉置(Transpose)過程 49 4.1.3 合并文件(Merge File)過程 50 4.1.4 分類匯總(Aggregate)過程 52 4.1.5 拆分文件(Split File)過程 54 4.1.6 選擇個案(Select Cases)過程 54 4.1.7 加權個案(Weight Cases)過程 55 4.2 數據變量的變換和計算 55 4.2.1 計算變量(Compute Variables)過程 56 4.2.2 計數(Count)過程 58 4.2.3 重新編碼(Recode)過程 59 4.2.4 個案排秩(Rank Cases)過程 60 4.2.5 自動重新編碼(AutomaticRecode)過程 62 第5章 基本統計分析 64 5.1 基本概念 64 5.1.1 基本的統計概念 64 5.1.2 描述性統計分析 66 5.2 頻數分析 67 5.2.1 Frequencies過程的操作界面 67 5.2.2 實例分析 69 5.3 描述性統計分析過程 71 5.3.1 Descriptive過程的參數設置 71 5.3.2 實例分析 71 5.4 數據探索性分析過程 73 5.4.1 Explore過程的參數設置 73 5.4.2 實例分析 74 5.5 列聯表分析過程 77 5.5.1 Crosstabs過程的參數設置 77 5.5.2 實例分析 80 第6章 參數檢驗 83 6.1 參數估計和假設檢驗概述 83 6.1.1 參數估計 83 6.1.2 假設檢驗 86 6.2 均值(Means)過程 91 6.2.1 SPSS的均值(Means)過程參數設置 91 6.2.2 均值(Means)過程實例 92 6.3 單樣本t檢驗 93 6.3.1 單樣本t檢驗過程的參數設置 93 6.3.2 實例分析 94 6.4 獨立樣本t檢驗 96 6.4.1 獨立樣本t檢驗過程的參數設置 96 6.4.2 實例分析 97 6.5 配對兩樣本t檢驗 99 6.5.1 配對兩樣本t檢驗過程的參數設置 99 6.5.2 實例分析 99 第7章 基本圖形的繪制 102 7.1 統計圖概述 102 7.2 條形圖 103 7.3 線圖 107 7.4 面積圖 109 7.5 餅圖 110 7.5.1 SPSS設置 110 7.5.2 實例分析 111 7.6 高低圖 112 7.7 質量控制圖 113 7.8 箱圖 118 7.8.1 SPSS參數設置 118 7.8.2 實例分析 119 7.9 散點圖 120 7.9.1 SPSS參數設置 121 7.9.2 實例分析 121 7.10 直方圖 123 7.11 時間序列圖 125 7.11.1 SPSS參數設置 125 7.11.2 實例分析 129 第8章 非參數檢驗 132 8.1 非參數檢驗概述 132 8.2 檢驗 133 8.2.1 檢驗的參數設置 134 8.2.2 檢驗實例分析 136 8.3 二項分布檢驗 138 8.3.1 二項分布檢驗的參數設置 138 8.3.2 實例分析 138 8.4 游程檢驗 140 8.4.1 游程檢驗的參數設置 141 8.4.2 實例分析 141 8.5 單樣本K-S檢驗 143 8.5.1 單樣本K-S檢驗的參數設置 143 8.5.2 實例分析 144 8.6 兩獨立樣本分布位置檢驗 146 8.6.1 兩獨立樣本分布位置檢驗的參數設置 147 8.6.2 實例分析 147 8.7 多個獨立樣本分布位置檢驗 149 8.7.1 SPSS參數設置 149 8.7.2 實例分析 150 8.8 兩相關樣本分布位置檢驗 152 8.8.1 SPSS參數設置 152 8.8.2 實例分析 153 8.9 多個配對樣本分布位置檢驗 154 8.9.1 SPSS參數設置 155 8.9.2 實例分析 155 第9章 方差分析 158 9.1 方差分析的基本原理 158 9.1.1 自由度與平方和分解 159 9.1.2 F檢驗 161 9.1.3 多重比較 162 9.2 單因素方差分析 163 9.2.1 單因素方差分析步驟 164 9.2.2 判斷與結論 165 9.2.3 One-Way ANOVA過程的參數設置 165 9.2.4 實例分析 168 9.3 多因素方差分析 169 9.3.1 只考慮主效應的多因素方差分析 169 9.3.2 存在交互效應的多因素方差分析 171 9.3.3 Univariate過程參數設置 173 9.3.4 實例分析 178 9.4 協方差分析 182 9.4.1 協方差分析概述 182 9.4.2 實例分析 183 第10章 回歸分析 186 10.1 線性回歸 186 10.1.1 線性回歸模型 187 10.1.2 最小二乘估計 187 10.1.3 回歸方程的顯著性檢驗 188 10.1.4 預測問題 190 10.1.5 SPSS線性回歸分析設置 191 10.1.6 回歸分析模型的實例分析 195 10.2 非線性回歸 198 10.2.1 非線性回歸分析的基本原理 199 10.2.2 非線性回歸參數設置 199 10.2.3 案例——銷售數量和廣告投入的非線性回歸分析 202 10.3 Logistic回歸 205 10.3.1 Logistic回歸模型概述 205 10.3.2 Binary Logistic回歸模型參數設置 206 10.3.3 案例——銀行貸款的信用風險分析 209 第11章 相關分析 214 11.1 相關分析概述 214 11.1.1 相關關系 214 11.1.2 相關圖形和相關系數 215 11.1.3 SPSS的相關分析功能簡介 217 11.2 Bivariate(雙變量)過程 217 11.2.1 雙變量相關分析簡介 217 11.2.2 Bivariate過程的參數設置 219 11.2.3 案例——汽車銷售中各變量之間的相關分析 220 11.3 Partial(偏相關)過程 223 11.3.1 Partial過程的參數設置 223 11.3.2 案例——醫療門診病人的流動情況分析 224 11.4 Distances(距離)過程 226 11.4.1 Distances過程的參數設置 226 11.4.2 案例——全國各個省市自治區直轄市的農民家庭收支的分布研究 229 第12章 聚類分析 231 12.1 聚類分析的原理 231 12.1.1 一般原理 232 12.1.2 聚類分析步驟 235 12.1.3 系統聚類方法 236 12.2 快速樣本聚類過程 239 12.2.1 快速聚類簡介 239 12.2.2 SPSS快速聚類的設置 239 12.2.3 案例——2006年中國主要城市空氣質量的比較分析 241 12.3 系統聚類過程 245 12.3.1 系統聚類簡介 245 12.3.2 SPSS系統聚類設置 245 12.3.3 案例——中國經濟地理區域的聚類分析 248 12.4 兩階段聚類分析 251 12.4.1 兩階段聚類簡介 251 12.4.2 SPSS兩階段聚類的設置 252 12.4.3 案例——兩階段聚類分析應用于農村居民人均收入與生活消費支出研究 253 第13章 判別分析 256 13.1 判別分析的基本原理 256 13.1.1 判別分析簡介 256 13.1.2 判別分析的數學模型與判別方法 257 13.2 一般判別分析 263 13.2.1 一般判別分析的參數設置 263 13.2.2 案例——上市公司類型的比較分析 266 13.3 逐步判別分析 271 13.3.1 逐步判別的參數設置 271 13.3.2 案例——全國部分省市地區的農民家庭收支的分布規律研究 272 第14章 因子分析 278 14.1 因子分析簡介 278 14.1.1 因子分析的基本原理 279 14.1.2 因子分析的基本步驟和過程 281 14.2 SPSS因子分析 281 14.2.1 SPSS因子分析的參數設置 281 14.2.2 案例——汽車銷售的數據中各變量的因子分析 285 第15章 對應分析 290 15.1 對應分析的基本原理 290 15.2 簡單對應分析 292 15.2.1 Correspondence Analysis過程 292 15.2.2 案例——簡單對應分析實例 295 15.3 Optimal Scaling過程 298 15.3.1 Optimal Scaling過程的SPSS參數設置 298 15.3.2 案例——最優尺度分析實例 305 第16章 可靠性和多維尺度分析 309 16.1 可靠性分析 309 16.1.1 可靠性分析的基本原理 309 16.1.2 可靠性分析的參數設置 311 16.1.3 案例——電視節目調查數據可靠性分析 313 16.2 多維尺度分析 315 16.2.1 多維尺度分析簡介 315 16.2.2 ALSCAL過程的參數設置 316 16.2.3 案例——多維尺度實例分析 319 第17章 生存分析 322 17.1 生存分析簡介 322 17.1.1 生存分析的基本概念 322 17.1.2 生存資料的特點 324 17.1.3 生存分析方法 324 17.1.4 SPSS中的生存分析過程 325 17.2 Life Tables過程 326 17.2.1 Life Tables過程的參數設置 326 17.2.2 案例——電信公司客戶流失分析 327 17.3 Kaplan-Meier分析 331 17.3.1 Kaplan-Meier分析的步驟 331 17.3.2 案例——新藥開發的數據分析 333 17.4 Cox模型回歸分析 336 17.4.1 Cox回歸模型 336 17.4.2 Cox模型參數設置 338 17.4.3 案例——電信公司的客戶流失的Cox回歸模型分析 342 第18章 對數線性模型 347 18.1 對數線性模型概述 347 18.2 General過程 348 18.2.1 General過程的參數設置 348 18.2.2 實例分析 351 18.3 Logit過程 353 18.3.1 Logit過程的參數設置 353 18.3.2 實例分析 356 18.4 模型選擇(Model Selection)過程 359 18.4.1 模型選擇的參數設置 359 18.4.2 實例分析 361 第19章 時間序列分析 364 19.1 時間序列概述 364 19.1.1 時間序列的組成部分 364 19.1.2 時間序列的數學模型 365 19.1.3 時間序列的分析步驟 367 19.1.4 SPSS時間序列分析功能 367 19.2 時間序列數據的預處理 374 19.2.1 缺失值替換 374 19.2.2 定義時間變量 375 19.2.3 時間序列的平穩化 375 19.3 指數平滑模型過程 376 19.3.1 指數平滑的基本原理 376 19.3.2 指數平滑模型的參數設置 379 19.3.3 案例——銷售數據預測分析 380 19.4 ARIMA模型 385 19.4.1 ARIMA模型的基本原理 385 19.4.2 ARIMA模型的參數設置 388 19.4.3 案例——上海證券交易所綜合指數收益率模擬預測分析 389 19.5 季節分解模型過程 393 19.5.1 季節分解模型的參數設置 393 19.5.2 案例——具有季節因素的服裝銷售數據的預測分析 394 第20章 缺失值分析 398 20.1 缺失值理論概述 398 20.1.1 數據缺失方式 399 20.1.2 缺失值處理方法 399 20.2 SPSS缺失值分析操作 403 20.2.1 缺失值分析的參數設置 403 20.2.2 案例——數據集中缺失值的實例分析 407 第21章 決策樹模型 413 21.1 決策樹模型概述 413 21.1.1 CHAID算法 415 21.1.2 Exhaustive CHAID算法 416 21.1.3 CART算法 416 21.1.4 QUEST算法 417 21.2 決策樹的參數設置 417 21.2.1 變量設置 417 21.2.2 類別(Categories)設置 418 21.2.3 輸出(Output)設置 419 21.2.4 驗證(Validation)設置 421 21.2.5 保存(Save)設置 422 21.2.6 條件(Criteria)設置 423 21.2.7 CHAID算法設置 424 21.2.8 CART算法設置 424 21.2.9 QUEST算法設置 425 21.2.10 修剪(Pruning)設置 425 21.2.11 替代變量(Surrogates)設置 426 21.2.12 選項(Options)設置 426 21.2.13 誤分類成本設置 427 21.2.14 利潤(Profits)設置 427 21.2.15 先驗概率(Prior Probabilities)設置 428 21.2.16 實例分析 429 21.2.17 模型建立 429 21.2.18 模型評估 431 第22章 神經網絡 438 22.1 神經網絡概述 438 22.1.1 歷史及現狀 439 22.1.2 神經網絡特點 440 22.1.3 神經元模型 441 22.1.4 神經網絡模型 442 22.1.5 神經網絡的學習規則 442 22.1.6 SPSS神經網絡模型 443 22.2 SPSS神經網絡模型的設置 445 22.2.1 多層感知器(MLP)的設置 445 22.2.2 徑向基函數(RBF)的設置 453 22.3 實例分析 455 22.3.1 參數設置 456 22.3.2 結果分析 458 第23章 信用風險分析 463 23.1 信用風險概述 463 23.1.1 信用風險基本概念 463 23.1.2 信用風險度量方法 464 23.1.3 SPSS中信用風險分析模塊 467 23.2 案例分析 467 23.2.1 Binary Logistic(二元Logistic)過程 467 23.2.2 Tree(決策樹)過程 472 23.2.3 Discriminant(判別)過程 478 第24章 SPSS在社會經濟綜合評價中的應用 483 24.1 沿海省市經濟綜合指標的主成分分析 483 24.2 中國內地城鎮居民消費結構的聚類分析 487 24.3 我國內地可支配收入和消費性支出之間的回歸分析 491 |
序: |
|