-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

如虎添翼!數據處理的SAS EG實現

( 簡體 字)
作者:人大經濟論壇類別:1. -> 程式設計 -> 大數據
譯者:
出版社:電子工業出版社如虎添翼!數據處理的SAS EG實現 3dWoo書號: 40714
詢問書籍請說出此書號!

缺書
NT售價: 245

出版日:2/1/2015
頁數:180
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121252457
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

序言:這是一個用數據說話的時代




在 CDA(注冊數據分析師)Level I 級教材付諸印刷之際,關于數據分析這個職業及其價值的報 道就有很多。比如,下面兩條報道就充分體現了在大數據時代下,數據分析的價值。這在以前是從來 沒有過的。
LinkedIn 的最新投票結果顯示,‘統計分析和數據挖掘’是 2014 年最大的求職法寶。LinkedIn 對 全球超過 3.3 億用戶的工作經歷和技能進行分析,公布 2014 年最受雇主喜歡、最炙手可熱的 25 項技 能,其中位列榜首的是統計分析和數據挖掘。
麥肯錫公司的一份研究預測稱,到 2018 年,在“具有深入分析能力的人才”方面,美國可能面臨 著 14 萬到 19 萬人的缺口,而“可以利用大數據分析來做出有效決策的經理和分析師” 缺口則會達到
150 萬人。數據科學家將成為 2015 年最熱門的職業。
早在 2010 年 2 月,肯尼斯庫克爾在《經濟學人》上發表了一份關于管理信息的特別報告——《數 據,無所不在的數據》,文中寫道:“世界上有著無法想象的巨量數字信息,并以極快的速度增長……
從經濟界到科學界,從政府部門到藝術領域,很多地方都已感受到了這種巨量信息的影響。”2011 年, 麥肯錫發布了《大數據:下一個具有創新力、競爭力與生產力的前沿領域》,使人們在這篇文章里認識
到了數據的力量。于是,一夜之間,面向數據分析市場的新產品、新技術、新服務、新業態正在不斷 涌現。從個人、企業到國家層面,都把數據作為一種重要的戰略資產,逐漸認識到了數據的價值,不 同程度地滲透到每個行業領域和部門,大大提升了企業的經營利潤,推動了經濟的發展。
這是一個用數據說話的時代,也是一個依靠數據競爭的時代。目前世界 500 強企業中,有 90%以 上都建立了數據分析部門。IBM、微軟、Google 等知名公司都積極投資數據業務,建立數據部門,培養數據分析團隊。各國政府和越來越多的企業意識到數據和信息已經成為企業的智力資產和資源,數據的分析和處理能力正在成為日益倚重的技術手段。 作為一個數學和統計學的強國,數據分析、數據挖掘和大數據價值挖掘行業在我國仍屬于朝陽行業,數據分析人才仍然比較稀缺。各行各業在平常工作中積累的各種各樣的數據分析問題仍然沒有得 到及時有效地解決,有些問題,還是關乎本行業發展的至關重要的問題。數據積累越來越多,期待解 決分析的數據問題也越來越多,人們逐漸習慣使用數據作為決策的重要參考依據。據艾瑞的研究報告,未來與數據分析相關的就業崗位會在 1000 萬人左右,而目前來說國內合格的數據分析師不足 5 萬人, 建立一個科學有效的數據分析師培訓體系迫在眉睫。
在這樣一個用數據說話的時代,積累了豐富的數據分析培訓經驗的人大經濟論壇承擔起使命,幾番調查研究,幾番反復推演論證,在 2013 年,這個大數據的“元年”,CDA 注冊數據分析師應運而生!
2003 年,人大經濟論壇依托中國人民大學成立,在金融、管理、統計領域已積淀 11 個年頭,在國內享有良好聲譽。
2006 年,人大經濟論壇數據分析培訓中心設立,至今經歷 8 個春秋,建立了大陸、臺灣一線師資 團隊,培養人才已達 3 萬余人。
2013 年,“中國數據挖掘與數據分析俱樂部 CDMC”在人大經濟論壇旗下成立,2014 年改名為 “CDA 數據分析師俱樂部”。來自政府、金融、電信、零售、電商、互聯網、教育等行業人士加入會員, 成功舉辦了數十場行業聚會。緊接著,積累了數據分析培訓豐富經驗的人大經濟論壇在國內展開 CDA 數據分析師系統培訓和認證考試,成功見證了 1000 余名數據分析師的成長。
2015 年,人大經濟論壇將提供高水平、多層次的數據分析培訓服務,以在行業積累 多年的影響 力,吸引更好更多的優秀師資,瞄準行業內重要的數據分析問題和難點,攻堅突破,建立更加規范的行業培訓體系,引領數據分析培訓行業向規范化、有效化和前瞻化方向發展,為數據分析培訓做出應 有的貢獻。
其實,數學(含統計)和英語一樣重要,都是人們不可或缺的重要技能。既然英語全民這么重視, 數學及其數據分析的技能更加需求于方方面面,更應被做大做強。讓我們共同期待人大經濟論壇辦成 另一個數據的“新東方”!



覃智勇

2015 年 1 月 1 日








前言



感謝您選擇“CDA數據分析師”Level I學習系列叢書之《如虎添翼!數據處理的SAS EG實現》。
該叢書按照數據分析師規范化學習體系而定,對于一名初學者,應該先掌握必要的概率、統計理論基礎,包括描述性分析、推斷性分析、參數估計、假設檢驗、方差分析、回歸分析等內容,這在第一本書《從零進階!數據分析的統計基礎》中進行了專業詳細的講解。其次,數據分析需要按照標準流程進行,即數據的獲取、儲存、整理、清洗、歸約等系列數據處理技術,這在《如虎添翼!數據處理的SAS EG實現》中利用SAS EG和編程技術進行了操作過程的詳解。最后,經過處理的數據需要根據業務問題,利用相關方法進行建模分析,得出結果,結果檢驗,繪制圖表并解讀數據,這在《胸有成竹!數據分析的SAS EG進階》中進行了詳細的講解和操作分析。
CDA數據分析師叢書整體風格是“理論>技術>應用”的一個學習過程,最終目的在于商業業務應用、職場數據分析,為欲從事于數據分析領域的各界人士提供了一個規范化數據分析師的學習體系。
讀者對象
作為叢書中的一本,本書上承基礎理論部分,下啟最終建模及案例分析。本書將關注點集中到數據的探索及預處理上,通過本書的學習將會加深對基礎理論部分的理解,為后續的建模分析做好數據上的準備。本書適合那些想了解數據預處理,或者被數據的預處理占去大部分時間而想提高效率,或者囿于菜單操作的局限性而希望通過程序實現的數據分析人員。
閱讀指南
對數據分析師而言,合適的數據就像好的食材,對最終分析結果的影響不言而喻,但是在日常的工作中我們會經常遇到兩個問題,一是數據的質量不高,數據在收集、存儲等過程中不可避免地出現了臟數據、不一致數據、噪聲數據、重復數據等,如果我們不做任何預處理而直接輸入模型,就會出現“garbage in, garbage out”,即垃圾進垃圾出的情況。二是數據的形式不符,因為不同的模型,建模技術都有一定的前提假設,對數據的展現形式、分布狀態等都有較為嚴格的要求,如果不做預處理,模型出來的結果很可能與數據底層真正蘊含的規律背道而馳,對這種形式的數據盲目地進行建模分析,極容易誤人誤己。
數據預處理占到整個數據挖掘的60%∼80%的時間,要想高效正確地完成數據的預處理工作其實不是一件容易的事情,本書作者根據在咨詢公司、電信及金融行業的多年經驗,將常用的數據預處理思路融入到SAS EG的菜單操作中,并配以SAS程序的講解,使得讀者在熟悉菜單的同時,能用簡單的SAS語言完成相對復雜的數據處理要求。

全書共分為九章:
第1章介紹了SAS EG軟件,并介紹了三種常見的數據分析流程;
第2章介紹了如何通過多種方式使SAS EG可以輕松地訪問多種形式的外部數據;、
第3章介紹了探索性數據分析的基本思路,以及數據清理的相關理論,并分別演示了如何對類別數據、數據數據進行清理;
第4章、第5章介紹了如何對數據觀測進行篩選和排序、抽樣,以及數據的分組和匯總,如何對數據進行轉置,使用函數等,
第6章介紹了如何在整體上對數據集進行操作,包括如何對數據集進行橫向連接和縱向連接,數據集之間的比較創建格式等。
第7章講解了數據的可視化及圖表、報告的編制方法。
第8章、第9章介紹了如何在SAS EG中運用提示、程序等來提高數據處理效率。
各部分相互獨立,讀者可以根據自己的需要選擇性閱讀。
本書特點
1.關于SAS EG模塊的首本中文教材;
2.非單純的逐個講解菜單,而是將數據分析的基本思路、流程融入到軟件的操作之中;
3.每一章節通過設置商業背景,基本理論講解的形式更貼近讀者的實際工作;
4.本書除講解軟件操作,還同時介紹了各種操作的SAS語言的實現過程,讀者可以根據自己的基礎逐步學習,進而走進SAS處理數據的大門。
學習方法
本書在編寫上力求從讀者的實戰角度出發,每章基本上分為五部分:
1.商業背景的介紹;
2.相關的理論介紹;
3.EG軟件的解決方案;
4.程序實現,包含實現菜單的程序的簡單必要功能,讀者可以輕松過渡到編程;
5.擴展閱讀,對于想深入學習SAS編程、數據準備的讀者,進一步介紹了相關的學習內容及方向。
讀者可以根據自己的需要來閱讀,本書的菜單操作部分以SAS Eenterprise guide 5.1為例進行示范,代碼部分以SAS 9.3為基礎進行編寫,讀者在理解基本思路之后可以方便將其應用到其它版本之上。
售后服務
為方便讀者學習,本書提供了書中實例的源文件下載,請讀者進入人大經濟論壇(http://bbs.pinggu.org/),注冊后搜索“CDA教材源文件”關鍵詞下載相應的源文件。
本書讀者可以在人大經濟論壇的“數據挖掘與商業智能(http://bbs.pinggu.org/forum-133-1.html)”就書中的問題進行提問,也歡迎大家就自己遇到的業務問題和大家討論。同時,也可以向作者發郵件,作者郵箱為xuxiaog_2003@163.com。
致謝
本書由人大經濟論壇策劃,徐筱剛負責編寫和完成統稿。
叢書從策劃到出版,傾注了電子工業出版社計算機圖書分社張慧敏、石倩、官楊、張童等多位編輯的心血,特在此表示衷心地感謝!
為保證叢書的質量,使其更貼近讀者,我們組織了人大經濟論壇的多位版主和高級會員參與了本書的預讀工作,他們是楊同梅、田佳、孫華楓、原瑜芬、葉陣雨、鄭?、李劍宇、江翊雪、陳鵬、劉莎莎、丁亞軍。感謝各位預讀員的辛勤、耐心與細致,使得本叢書能以更加完善的面目與各位讀者見面,特別感謝覃智勇圓滿地組織了本次預讀工作和審校工作。
盡管作者們對書中的案例精益求精,但疏漏仍然在所難免,如果您發現書中的錯誤或某個案例有更好的解決方案,敬請登錄社區網站向作者反饋,我們將盡快在社區中給出回復,且在本書再次印刷時修正。
再次感謝您的支持!
內容簡介:

作為SAS EG模塊的首本中文教材,《如虎添翼!數據處理的SAS EG實現》并非單純的逐個講解菜單的操作,而是將數據分析的基本思路、流程融入到軟件的操作之中。每章通過設置商業背景,配以SAS理論的講解形式更貼近讀者的實際工作,使讀者真正理解數據分析、數據處理的精髓。本書除講解軟件操作,還同時介紹了對應菜單操作的SAS程序語言實現過程,讀者可以根據自己的需要逐步學習,進而走進用SAS程序處理數據的大門。

目錄:

第1章 軟件入門介紹 1
1.1 SAS EG介紹 2
1.1.1 SAS EG簡介 2
1.1.2 SAS EG的窗口及菜單 3
1.2 數據挖掘的流程介紹 4
1.2.1 KDD介紹 4
1.2.2 CRISP-DM 5
1.2.3 SEMMA 5
1.2.4 三種數據挖掘流程的比較 6
第2章 使用數據 7
2.1 通過SAS邏輯庫訪問數據 8
2.1.1 商業背景 8
2.1.2 SAS相關功能介紹 8
2.1.3 EG菜單解決方案 9
2.1.4 程序實現 10
2.2 理解SAS數據集的定義 11
2.2.1 理解SAS數據集的含義 11
2.2.2 商業背景 11
2.2.3 SAS相關功能介紹 11
2.2.3 EG菜單解決方案 15
2.2.4 程序實現 17
2.3 導入其他格式的數據文件 18
2.3.1 商業背景 18
2.3.2 SAS相關功能介紹 18
2.3.3 EG菜單解決方案 18

2.3.4 程序實現 21
2.4 擴展閱讀 22
第3章 探索性數據分析及數據的清理 23
3.1 探索性數據分析 24
3.1.1 基本理論講解 24
3.1.2 EG菜單解決方案 24
3.2 數據清理介紹 28
3.2.1 商業背景 28
3.2.2 需要清理的數據類型 28
3.3 類別變量的清理 30
3.3.1 EG菜單解決方案 30
3.3.2 類別變量的清理 34
3.4 數值型變量的清理 35
3.4.1 EG菜單解決方案 35
3.4.2 程序實現 38
3.5 正態分布的驗證 40
3.5.1 商業背景 40
3.5.2 相關理論介紹 40
3.5.3 EG菜單解決方案 40
3.5.4 程序實現 43
3.6 擴展閱讀 45
第4章 數據的行處理 46
4.1 數據篩選 47
4.1.1 商業背景 47
4.1.2 相關理論介紹 47
4.1.3 EG菜單解決方案 47
4.1.4 程序實現 49
4.2 排序與求秩 54
4.2.1 商業背景 54
4.2.2 理論介紹 54
4.2.3 菜單解決方案 55
4.2.4 EG菜單解決方案-求秩 57
4.2.5 程序實現 61
4.3 抽樣 62
4.3.1 商業背景 62
4.3.2 抽樣理論介紹 62
4.3.3 EG 菜單解決方案 64
4.3.4 程序實現 66
4.4 數據分組和匯總 67
4.4.1 商業背景 67
4.4.2 EG菜單解決方案 67
4.4.3 程序實現 69
4.5 擴展閱讀 69
第5章 數據的列處理 70
5.1 計算新變量 71
5.1.1 商業背景 71
5.1.2 EG菜單解決方案 71
5.2 拆分列 74
5.2.1 商業背景 74
5.2.2 EG菜單解決方案 74
5.3 堆疊列 76
5.3.1 商業背景 76
5.3.2 EG菜單解決方案 76
5.4 轉置列 79
5.4.1 商業背景 79
5.4.2 EG菜單解決方案 79
5.4.3 程序實現 81
5.5 函數及運算符的使用 82
5.5.1 運算符 82
5.5.2 函數 84
5.6 對列重編碼 91
5.6.1 商業背景介紹 91
5.6.2 EG菜單解決方案 91
5.6.3 程序實現 95
5.7 標準化 97
5.7.1 商業背景 97
5.7.2 相關理論介紹 97
5.7.3 EG菜單實現 97
5.7.4 實現程序 99
5.8 擴展閱讀 100
第6章 數據集的操作 101
6.1 縱向連接 102
6.1.1 商業背景 102
6.1.2 相關的理論 102
6.1.3 EG菜單解決方案 102
6.1.4 程序實現 105
6.2 橫向連接 109
6.2.1 商業背景 109
6.2.2 相關理論介紹 109
6.2.3 EG菜單解決方案 109
6.2.4 程序實現 113
6.3 數據集的比較 117
6.3.1 商業背景介紹 117
6.3.2 相關理論介紹 117
6.3.3 EG菜單解決方案 117
6.3.4 程序實現 120
6.4 創建格式 121
6.4.1 商業背景 121
6.4.2 相關理論介紹 121
6.4.3 EG菜單解決方案 123
6.4.4 程序實現 126
6.5 刪除數據集和格式 127
6.5.1 EG菜單解決方案 127
6.5.2 程序實現 128
6.6 擴展閱讀 128
第7章 數據的展示:圖形及報告的編制 129
7.1 數據可視化與圖表 130
7.1.1 商業背景 130
7.1.2 相關理論介紹 130
7.1.3 EG菜單解決方案 133
7.2 創建Listing報表 136
7.2.1 商業背景 136
7.2.2 相關理論介紹 136
7.2.3 EG菜單解決方案 138
7.2.4 程序實現 140
7.3 擴展閱讀 141
第8章 在SAS EG中使用提示和條件處理 142
8.1 提示與宏變量 143
8.1.1 商業背景 143
8.1.2 相關的理論介紹 143
8.1.3 EG菜單解決方案 144
8.2 條件處理 148
8.2.1 商業背景 148
8.2.2 EG菜單解決方案 148
8.3 擴展閱讀 152
第9章 在SAS EG中使用程序 153
9.1 如何在SAS EG中使用程序 154
9.2 SAS程序 156
9.2.1 SAS語言元素 156
9.2.2 DATA步 157
9.2.3 PROC步 158
9.2.4 SAS的模塊介紹 159
9.3 擴展閱讀 160
附錄A 菜單對應關系 161
附錄B CDA(注冊數據分析師)致力于最好的數據分析人才建設 163
參考文獻 167
序: