-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

決策分析:以Excel為分析工具

( 簡體 字)
作者:(美) Conrad Carlberg 著類別:1. -> Office -> OFFICE -> EXCEL
譯者:
出版社:機械工業出版社決策分析:以Excel為分析工具 3dWoo書號: 40413
詢問書籍請說出此書號!

缺書
NT售價: 245

出版日:12/1/2014
頁數:218
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111483892
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

訴讀者的是:本書所用的Excel工作簿可以從本書英文版出版商的網站quepublishing.com/title/9780789751683上下載。下載鏈接有時候難以和常規文本區分,但是鏈接和工作簿都在那里。

從第2章開始,每章都有自己的Excel工作簿,每章中的每幅插圖都是一個單獨的工作表。還有幾個附加的工作簿用于執行聚類分析、判別函數分析和其他沒有自己的工作表函數的分析過程。

好吧,我們來做個澄清:

本書不是關于獲取、存儲和分割所謂“大數據”的書籍。本書講述的是關于如何了解數字的含義—它們到底是“大數據”,還是“小啤酒”。

我們都碰到過這種情況:有30個變量需要處理,每個都可能很重要,各自針對有趣現象的不同側面,可能是12個月的生存率,或者投資盈利的可能性,或者了解新雇員的業績。不管你需要處理的是200個還是200 000個記錄,真正的問題是如何處理這30個變量。如何組合或者拋棄它們,以做出關于藥物效果,是否提供資金,以及雇用哪位應征者的正確決策。

本書內容

本書的主題是:尋找你所掌握的變量的最佳組合,以便盡可能做出明智的決策。

這是使用定量分類技術的一種實踐,此類技術有如下幾種。

判別函數分析有悠久的光榮歷史。它的用途很廣泛,范圍從根據法律記錄辨別19世紀政治家所屬黨派,到根據扣減金額和調整金額,標記可能的不實1040表格。第5章和第6章帶你經歷這種分析,探索所涉及的數據簡化技術。它們能夠讓你看到,在工作表和圖表的環境中,判別函數分析如何起作用。

因為判別分析依賴多變量方法處理連續變量,所以我加入了第7章。第7章能夠幫助你了解特征值和特征向量等概念,因為它們與相關矩陣有關—同樣,也是在熟悉的Excel工作表和圖表環境中。

你還可以下載一個工作簿,其中包含了運行完整的判別函數分析并輸出顯著性測定、函數系數、典型相關和其他功能的VBA代碼,在正文中將對此進行解釋,并在該章的工作簿中進一步展示。

進行判別分析的最佳方法是利用多變量方差分析(MANOVA)。你將會看到,MANOVA能夠幫助你確定執行判別函數分析是否有意義—因變量(非獨立變量)之間是否相關,以及區分不同的人和行為分組的能力,以支持進一步分析。因此,第4章討論MANOVA,你可以下載一個單獨的工作簿,運行多個因變量的單因素MANOVA。

如果你有很久沒思考過ANOVA或者MANOVA的問題了,可能應該通讀第3章。作為MANOVA的背景知識,在工作表的環境中了解ANOVA管理變量的能力是很有幫助的。

除了判別函數分析之外,對人或者市場行為(或者政治家、室內植物)進行分類的另一種方法是邏輯回歸。這是一種實用的方法,它避免了判別分析可能犯的一些錯誤。例如,邏輯回歸不會像判別分析那樣,做出關于數據分布方式的所有假設。所以,如果擔心數據違背了那些假設(老實說,即使這些假設不成立,你的分析也不一定無效),往往可以使用邏輯回歸來代替,作為決策分析的基礎。

另一方面,那些假設給判別分析帶來了統計能力——成功和可靠地區分不同對象組的能力。在其他情況相同時,判別分析對分類的指導比邏輯回歸更敏感。

在我的前一本書《Predictive Analytics: Microsoft Excel》中為邏輯回歸保留了兩章。在本書第2章中我對此進行了介紹,更多的是一種復習,而非完整的討論。

第8章和第9章介紹了其他決策分析方法。在邏輯回歸和判別分析中,你知道分組的情況。你有一個或大或小的數據樣板,觀測值包括所屬組(幸存與否、盈利與否、輸贏)和你希望用來幫助你做出好的決策的變量(人口統計學數據、財務數據、購買歷史)。

但是在聚類分析中,你不知道自己的分組。例如,你有一組人口統計學變量,希望知道如何用它們對人們進行分類。 你對數據集實施聚類分析的某一變種,希望它聚合樣本中的人,使得同一個群集中的人在人口統計學上的差異較小,而不同群集的人之間差別相對大。

Leland Wilkinson在1986年對這種決策分析方法做出了一種恰當的描述,他寫道,“粗略地說,這種方法就像一種單向的差異分析,其中的組別未知,最大的F值通過重新安排每個組的成員來求得。”(參見SYSTAT手冊“Cluster”節的第1頁)。

為什么使用Excel

感謝大家購買我寫的書。但是,我還是一位顧問,我希望客戶理解我對他們交給我的數字做了什么。我認為這是20年之后,我仍然工作在這個行業的主要原因之一。

我不喜歡交給客戶一堆R輸出,不管是采用字面形式還是電子形式。我這么說并不是對R語言有什么意見。盡管文檔難以理解,結果就像Fortran語言輸出的,它仍是很好的統計程序。我經常使用R來進行Excel中所完成工作的基準測試。

SAS、SPSS、Stata和類似的軟件包在文檔上比R好得多,分析結果也采用更直接的方式輸出。但是,它們太貴了。而且,和R一樣,使用它們需要付出相當多的精力進行研究,才能學會用戶界面的正確用法和正確地處理命令語法。

相比之下,我的大部分客戶都很適應熟悉的Excel環境,并且欣賞在Excel圖表中簡單地查看一組數字的能力。當然,也很難在公司或者教學環境中找到一臺沒有安裝和運行某種Excel版本的Windows電腦。

但是Excel能夠處理分析(特別是決策分析)所需的復雜數據歸納方法嗎?顯然,我相信它可以。Excel確實是一個通用的數字分析軟件包,從一開始就不是為了提供特殊的統計功能而設計的。它們沒有WILKS()工作表函數。

Excel提供了一個MDETERM()工作表函數,如果將它指向一個組內矩陣和一個總體矩陣,就可以得到自己的Wilks Lambda值。假定你是一位分析的新手,或者企業的高級管理人員,想要知道為什么有人認為Wilks Lambda值說明應該回避某項業務。我主張,在任何一種情況下,你更應該了解的是:為什么它能夠告訴你一些情況,而不僅僅是知道這個數值是什么意思。

而且,如果使用得當,Excel能夠幫助你了解那些情況。有時候,所需要的就只是一個內建的工作表函數。直接在工作表上進行多變量方差分析完全是可能的,不需要任何附加程序。我認為這樣做一兩次很有好處,因為它能夠幫助你鞏固對概念的理解。

但是,有時候你需要Excel Slover規劃求解加載項(Excel自帶的一個附加程序)等工具的幫助。第2章告訴你如何使用規劃求解加載項完成邏輯回歸(順便說一句,純統計軟件包使用相同的優化算法—只是它們掩蓋了這一方法,所以你沒有發現)。

還有一些處理,例如尋找大型相關矩陣的特征值,它們過于復雜且依賴循環,如果沒有編寫子程序,嘗試起來會令人發瘋。但是,可以在本書的Excel文件中找到用VBA編寫的子程序,有些是開放的。

強調一下我的觀點:2013年年初,我著手幫助一家公司建立一個評估未來投資的模型。客戶有將近10萬個用于開發該模型的記錄。 根據數據的特性,需要采用邏輯回歸,客戶以文本文件的方式提供數據,這很容易用Excel讀取。我嘗試使用Excel在該數據集上運行邏輯回歸,我的公式導致下溢。

然后,我使用R,讓數據通過一個邏輯回歸例程(R程序庫的一部分),再次遇到了下溢的情況。在很多情況下,中間結果對于Excel或者R都太小了,無法精確處理。

現在,這不再會帶來真正的問題了。我打算保留一些數據用于交叉驗證,所以隨機地將一半數據通過R的邏輯回歸例程,得到結果,并用剩下的一半數據進行驗證。然后,我用Excel確認結果。當然,客戶得到了R和Excel的結果,但是我注意到,客戶隨后利用該模型所做的工作若采用Excel,公式的結果會更加透明。

現在,這個普通的小故事不僅是件趣聞,還是一個樣板。它真實發生了,是我自己使用Excel作為分析引擎的一次典型體驗。如果你嘗試本書中描述的方法,我相信你也會得出同樣的結論。

說得夠多了。建議你帶上喜歡的飲料,打開筆記本電腦,進入第1章。

致謝

我要再次感謝Loretta Yates,感謝她在協作過程中對本書的精妙指導,還要感謝她堅定的支持和平和的性情。感謝科羅拉多大學調查與評估方法實驗室的Michael Turner提供很好的技術編輯,他的工作使我免于在付印的書籍中遭遇尷尬,并且在必要的時候使我回到正確的路上。對Anne Jones,我能說什么呢?她為《Statistical Analysis:Microsoft Excel 2010》和《Predictive Analytics:Microsoft Excel》所做的封面設計和內容一樣吸引讀者,現在她又一次這么做了。感謝Geneil Breeze在編輯文稿時溫和地提醒我,在初稿中有些賣弄學問了。感謝Elaine Wiley在百忙之中抽出時間來管理這個項目。我衷心地感謝大家!
內容簡介:

統計學專家、多部暢銷書作者Conrad Carlberg傾情撰寫,循序漸進系統講解Excel決策分析的各種技術、方法和實踐,指導讀者充分利用已有數據優化業務和投資決策,Amazon全五星評價
從基本原理、適用范圍、數據構造需求和實際執行方法等方面,由淺入深介紹決策分析涉及的主要統計學方法,包括邏輯回歸、單變量及多變量方差分析、判別分析、主分量分析和聚類分析,包含大量實用案例

你是不是被所擁有的大數據搞得不知所措?是不是不知道要提出什么問題,也不知道怎么提出問題?使用Microsoft Excel和經過證明的決策分析技術,你可以從所有數據中提煉出容易控制的數據集——并使用它們優化許多業務和投資決策。在本書中,多部統計學暢銷書作者、統計學專家Conrad Carlberg將手把手由淺入深地告訴你如何做到這一點。
Carlberg指導你用決策分析將客戶(或者其他對象)分解為有意義、可以采取相應措施的分組和群集。接著,你將學習優化業務和其他方面(從定價到交叉銷售,從招聘到投資)各種決策的實用方法,甚至面部識別軟件也可以使用本書討論的技術。
通過實例,Carlberg幫助你理解作為決策分析基礎的技術和假設,并使用簡單的Excel圖表,直觀地表現結果。以此為基礎,你可以在Excel中進行自己的分析,處理SAS和SPSS等高級統計軟件生成的結果。
本書英文版網站包含大量可下載的Excel工作簿,你可以根據自己的需求進行改編,工作簿中的VBA代碼簡化了最為復雜的多項技術。
通過閱讀本書,你將學到:
根據現有分類或者預測變量自然存在的群集,對數據進行分類。
精簡變量和記錄的數量,以便獲得需要的答案。
利用聚類分析,尋找市場研究和許多其他應用中的相似性模式。
學習多重判別分析,幫助你分類案例。
使用MANOVA確定分組在多變量重心上是否有差異。
使用主分量研究數據,尋找模式,識別潛在因素。

內容簡介
本書由知名統計學專家、暢銷書作者Conrad Carlberg傾情撰寫,循序漸進系統講解Excel決策分析的各種技術、方法和實踐,指導讀者充分利用已有數據優化業務和投資決策,Amazon全五星評價。作者從基本原理、適用范圍、數據構造需求和實際執行方法等方面,由淺入深介紹決策分析涉及的主要統計學方法,包括邏輯回歸、單變量及多變量方差分析、判別分析、主分量分析和聚類分析等,并提供大量實用案例,實踐性強。
本書共分9章:第1章介紹決策分析的幾個組件,并解釋了根據現有類別和自然群組分類的幾種方法;第2章講解邏輯回歸的原理、殘差的分布,以及如何使用邏輯回歸;第3章介紹單變量方差分析(ANOVA)的基本理論和計算;第4章介紹多變量方差分析(MANOVA)的原理及如何使用Excel進行MANOVA分析;第5章介紹判別函數分析的基礎、目的及其與多重回歸分析之間的關系——至少在兩個分組的情況下;第6章進一步討論超出兩個分組和超出兩個連續變量的判別函數分析;第7章討論用于MANOVA和判別分析的概念和方法,以及聚類分析的一些有趣的潛力;第8章介紹聚類分析的一些入門知識,并討論兩種根本不同的方法——鏈接(或者層次)方法和中心距離方法,特別是流行的K均值方法;第9章進一步探討聚類分析,并提供兩個結合使用聚類分析和主分量分析的例子。
目錄:

譯者序

前 言

第1章 決策分析組件 1

1.1 根據現有類別分類 1

1.1.1 使用兩個步驟的方法 1

1.1.2 多重回歸和決策分析 2

1.1.3 獲取參考樣本 3

1.1.4 多變量方差分析 4

1.1.5 判別函數分析 5

1.1.6 邏輯回歸 6

1.2 根據自然存在的群組分類 7

1.2.1 主分量分析 7

1.2.2 聚類分析 8

1.3 一些術語學問題 10

1.3.1 設計決定術語 10

1.3.2 因果關系與預測的對比 11

1.3.3 術語為什么重要 12

第2章 邏輯回歸 13

2.1 邏輯回歸原理 14

2.1.1 比例問題 15

2.1.2 關于基本假設 17

2.1.3 均等分布 17

2.1.4 對分法中的等方差 19

2.1.5 均等分布和范圍 19

2.2 殘差的分布 21

2.2.1 殘差的計算 21

2.2.2 對分的殘差 21

2.3 使用邏輯回歸 22

2.3.1 使用可能性而非概率 23

2.3.2 使用對數優勢比 24

2.3.3 使用最大似然方法代替最小二乘方法 25

2.4 最大化對數似然率 26

2.4.1 建立數據 26

2.4.2 建立邏輯回歸方程式 27

2.4.3 求得優勢比 29

2.4.4 求得概率 29

2.4.5 計算對數似然率 30

2.4.6 尋找和安裝規劃求解加載項 31

2.4.7 運行規劃求解 31

2.5 對數似然法原理 33

2.5.1 正確分類的概率 34

2.5.2 使用對數似然 35

2.6 對數似然率的統計顯著性 37

2.6.1 建立精簡模型 38

2.6.2 建立完整模型 40

第3章 單變量方差分析(ANOVA) 42

3.1 ANOVA的邏輯 43

3.1.1 使用方差 43

3.1.2 方差分區 44

3.1.3 方差預期值(組內) 45

3.1.4 方差預期值(組間) 46

3.1.5 F比率 49

3.1.6 非中心F分布 52

3.2 單因素ANOVA 53

3.2.1 采用錯誤率 54

3.2.2 計算統計數字 55

3.2.3 得出均值的標準誤差 57

3.3 使用Excel的數據分析加載項 59

3.3.1 安裝數據分析加載項 59

3.3.2 使用“方差分析:單因素方差分析”工具 60

3.4 理解ANOVA輸出 62

3.4.1 使用描述統計 62

3.4.2 使用推論統計 62

3.5 回歸方法 65

3.5.1 使用影響編碼 66

3.5.2 LINEST()公式 68

3.5.3 LINEST()結果 68

3.5.4 LINEST()推斷統計 70

第4章 多變量方差分析(MANOVA) 72

4.1 MANOVA原理 72

4.1.1 相關變量 73

4.1.2 ANOVA中的相關變量 73

4.2 理解多變量ANOVA 74

4.2.1 單變量ANOVA結果 75

4.2.2 多變量ANOVA結果 76

4.2.3 均值和重心 78

4.3 從ANOVA到MANOVA 78

4.3.1 使用SSCP代替SS 80

4.3.2 獲得組間和組內SSCP矩陣 83

4.3.3 平方和與SSCP矩陣 85

4.4 求得多變量F比率 86

4.5 Wilks’ Lambda和F比率 88

4.6 在Excel中運行MANOVA 90

4.6.1 數據布局 91

4.6.2 運行MANOVA代碼 91

4.6.3 描述統計 92

4.6.4 離差矩陣的同一性 93

4.6.5 單變量和多變量F檢驗 95

4.7 多變量測試之后 96

第5章 判別函數分析基礎 98

5.1 將類別當作數字處理 99

5.2 判別分析原理 100

5.2.1 多重回歸和判別分析 100

5.2.2 調整視角 101

5.3 判別分析和多重回歸 103

5.3.1 回歸、判別分析和典型相關 103

5.3.2 編碼和多重回歸 104

5.4 判別函數和回歸方程式 106

5.5 從判別權重到回歸系數 107

5.5.1 回歸和判別分析中的特征結構 110

5.5.2 結構系數可能引起誤導 112

5.6 小結 113

第6章 判別函數分析:進一步的問題 114

6.1 使用判別工作簿 114

6.1.1 打開判別工作簿 114

6.1.2 使用判別對話框 116

6.2 為什么在鳶尾花上運行判別分析 118

6.2.1 評估原始測度 118

6.2.2 判別分析和投資 119

6.3 用R進行基準測試 121

6.3.1 下載R 121

6.3.2 編排數據文件 122

6.3.3 運行分析 123

6.4 Discrim加載項的結果 126

6.4.1 判別結果 126

6.4.2 解讀結構系數 128

6.4.3 特征結構和系數 129

6.4.4 系數的其他用途 132

6.5 案例分類 134

6.5.1 與重心的距離 135

6.5.2 均值修正 135

6.5.3 調整方差–協方差矩陣 139

6.5.4 指定一個分類 140

6.5.5 創建分類表格 141

6.6 訓練樣本:提前知曉的分類 142

第7章 主分量分析 144

7.1 為主分量分析建立概念性框架 145

7.1.1 主分量和測試 145

7.1.2 PCA的基本原則 146

7.1.3 相關與斜交因素旋轉 146

7.2 使用主分量加載項 147

7.2.1 相關矩陣 149

7.2.2 R矩陣的逆矩陣 149

7.2.3 球形測試 152

7.3 特征值和系數的計算以及公用因素方差的理解 152

7.3.1 有幾個分量 153

7.3.2 因素得分系數 155

7.3.3 公共因素方差 155

7.4 單獨結果之間的關系 156

7.4.1 使用特征值和特征向量 156

7.4.2 特征值、特征向量和負載 157

7.4.3 特征值、特征向量和因素系數 159

7.4.4 從因素得分直接獲得特征值 159

7.5 獲得特征值和特征向量 160

7.6 旋轉因素以得到有意義的解決方案 164

7.6.1 確定因素 164

7.6.2 最大方差旋轉 167

7.7 分類示例 169

7.7.1 州犯罪率 169

7.7.2 蚜蟲物理測量 173

第8章 聚類分析:基礎知識 175

8.1 聚類分析、判別分析和邏輯回歸 175

8.2 歐幾里得距離 176

8.3 尋找群集:單連接方法 180

8.4 聚類分析的自選擇特性 185

8.5 發現群集:全連接方法 187

8.5.1 全連接:示例 188

8.5.2 其他連接方法 191

8.6 發現群集:K均值方法 191

8.6.1 K均值分析特性 191

8.6.2 K均值的一個例子 192

8.7 用R對K均值方法進行基準測試 196

第9章 聚類分析:更深入的問題 198

9.1 使用K均值工作簿 198

9.1.1 確定群集數量 200

9.1.2 群集成員工作表 201

9.1.3 群集重心工作表 203

9.1.4 群集方差工作表 204

9.1.5 F比率工作表 206

9.1.6 報告過程統計 208

9.2 使用主分量進行聚類分析 209

9.2.1 主分量回顧 210

9.2.2 葡萄酒的聚類分析 213

9.2.3 結果的交叉驗證 216
序: