-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

Hadoop海量數據處理 技術詳解與項目實戰

( 簡體 字)
作者:范東來類別:1. -> 程式設計 -> 雲計算
譯者:
出版社:人民郵電出版社Hadoop海量數據處理 技術詳解與項目實戰 3dWoo書號: 41109
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:3/1/2015
頁數:317
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787115380999
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

《Hadoop海量數據處理:技術詳解與項目實戰》介紹了Hadoop技術的相關知識,并將理論知識與實際項目相結合。全書共分為三個部分:基礎篇、應用篇和總結篇。基礎篇詳細介紹了Hadoop、MapReduce、HDFS、Hive和Sqoop,并深入探討了Hadoop的運維和調優;應用篇則包含了一個具有代表性的完整的基于Hadoop的商業智能系統的設計和實現;結束篇對全書進行總結,并對技術發展做了展望。
  《Hadoop海量數據處理:技術詳解與項目實戰》結構針對學習曲線進行了優化,由淺至深,從理論基礎到項目實戰,適合Hadoop的初學者閱讀,也適合作為高等院校相關課程的教學參考書。
目錄:

基礎篇:Hadoop基礎
第1章 緒論
1.1 Hadoop和云計算
1.1.1 Hadoop的電梯演講
1.1.2 Hadoop生態圈
1.1.3 云計算的定義
1.1.4 云計算的類型
1.1.5 Hadoop和云計算
1.2 Hadoop和大數據
1.2.1 大數據的定義
1.2.2 大數據的結構類型
1.2.3 大數據行業應用實例
1.2.4 Hadoop和大數據
1.2.5 其他大數據處理平臺
1.3 數據挖掘和商業智能
1.3.1 數據挖掘的定義
1.3.2 數據倉庫
1.3.3 操作數據庫系統和數據倉庫系統的區別
1.3.4 為什么需要分離的數據倉庫
1.3.5 商業智能
1.3.6 大數據時代的商業智能
第2章 環境準備
2.1 Hadoop的發行版本選擇
2.1.1 Apache Hadoop
2.1.2 CDH
2.1.3 Hadoop的版本
2.1.4 如何選擇Hadoop的版本
2.2 Hadoop架構
2.2.1 Hadoop HDFS架構
2.2.2 Hadoop MapReduce架構
2.2.3 Hadoop架構
2.3 安裝Hadoop
2.3.1 安裝運行環境
2.3.2 修改主機名和用戶名
2.3.3 配置靜態IP地址
2.3.4 配置SSH無密碼連接
2.3.5 安裝JDK
2.3.6 配置Hadoop
2.3.7 格式化HDFS
2.3.8 啟動Hadoop并驗證安裝
2.4 安裝Hive
2.4.1 安裝元數據庫
2.4.2 修改Hive配置文件
2.4.3 驗證安裝
2.5 安裝Sqoop
2.6 Eclipse Hadoop插件的安裝和使用
2.6.1 安裝并配置Eclipse Hadoop插件
2.6.2 Eclipse插件的使用
第3章 Hadoop的基石:HDFS
3.1 認識HDFS
3.1.1 HDFS的設計理念
3.1.2 HDFS的架構
3.1.3 HDFS容錯
3.2 HDFS讀取文件和寫入文件
3.2.1 塊的分布
3.2.2 數據讀取
3.2.3 寫入數據
3.2.4 數據完整性
3.3 如何訪問HDFS
3.3.1 命令行接口
3.3.2 Java API
3.3.3 其他常用的接口
3.3.4 Web UI
第4章 分而治之的智慧:MapReduce
4.1 認識MapReduce
4.1.1 MapReduce的編程思想
4.1.2 MapReduce運行環境
4.1.3 MapReduce作業和任務
4.1.4 MapReduce的計算資源劃分
4.1.5 MapReduce的局限性
4.2 Hello WordCount
4.2.1 WordCount的設計思路
4.2.2 編寫WordCount
4.2.3 運行程序
4.2.4 還能更快嗎
4.3 MapReduce的過程
4.3.1 從輸入到輸出
4.3.2 input
4.3.3 map及中間結果的輸出
4.3.4 shuffle
4.3.5 reduce及最后結果的輸出
4.3.6 sort
4.3.7 作業的進度組成
4.4 MapReduce的工作機制
4.4.1 作業提交
4.4.2 作業初始化
4.4.3 任務分配
4.4.4 任務執行
4.4.5 任務完成
4.4.6 推測執行
4.4.7 MapReduce容錯
4.5 MapReduce編程
4.5.1 Writable類
4.5.2 編寫Writable類
4.5.3 編寫Mapper類
4.5.4 編寫Reducer類
4.5.5 控制shuffle
4.5.6 控制sort
4.5.7 編寫main函數
4.6 MapReduce編程實例:連接
4.6.1 設計思路
4.6.2 編寫Mapper類
4.6.3 編寫Reducer類
4.6.4 編寫main函數
4.7 MapReduce編程實例:二次排序
4.7.1 設計思路
4.7.2 編寫Mapper類
4.7.3 編寫Partitioner類
4.7.4 編寫SortComparator類
4.7.5 編寫Reducer類
4.7.6 編寫main函數
4.8 MapReduce編程實例:全排序
4.8.1 設計思路
4.8.2 編寫代碼
第5章 SQL on Hadoop:Hive
5.1 認識Hive
5.1.1 從MapReduce到SQL
5.1.2 Hive架構
5.1.3 Hive與關系型數據庫的區別
5.1.4 Hive命令的使用
5.2 數據類型和存儲格式
5.2.1 基本數據類型
5.2.2 復雜數據類型
5.2.3 存儲格式
5.2.4 數據格式
5.3 HQL:數據定義
5.3.1 Hive中的數據庫
5.3.2 Hive中的表
5.3.3 創建表
5.3.4 管理表
5.3.5 外部表
5.3.6 分區表
5.3.7 刪除表
5.3.8 修改表
5.4 HQL:數據操作
5.4.1 裝載數據
5.4.2 通過查詢語句向表中插入數據
5.4.3 利用動態分區向表中插入數據
5.4.4 通過CTAS加載數據
5.4.5 導出數據
5.5 HQL:數據查詢
5.5.1 SELECT…FROM語句
5.5.2 WHERE語句
5.5.3 GROUP BY和HAVING語句
5.5.4JOIN語句
5.5.5 ORDER BY和SORT BY語句
5.5.6 DISTRIBUTE BY和SORTBY語句
5.5.7 CLUSTER BY
5.5.8 分桶和抽樣
5.5.9 UNION ALL
5.6 Hive函數
5.6.1 標準函數
5.6.2 聚合函數
5.6.3 表生成函數
5.7 Hive用戶自定義函數
5.7.1 UDF
5.7.2 UDAF
5.7.3 UDTF
5.7.4 運行
第6章 SQL to Hadoop : Sqoop
6.1 一個Sqoop示例
6.2 導入過程
6.3 導出過程
6.4 Sqoop的使用
6.4.1 codegen
6.4.2 create-hive-table
6.4.3 eval
6.4.4 export
6.4.5 help
6.4.6 import
6.4.7 import-all-tables
6.4.8 job
6.4.9 list-databases
6.4.10 list-tables
6.4.11 merge
6.4.12 metastore
6.4.13 version
第7章 Hadoop性能調優和運維
7.1 Hadoop客戶端
7.2 Hadoop性能調優
7.2.1 選擇合適的硬件
7.2.2 操作系統調優
7.2.3 JVM調優
7.2.4 Hadoop參數調優
7.3 Hive性能調優
7.3.1 JOIN優化
7.3.2 Reducer的數量
7.3.3 列裁剪
7.3.4 分區裁剪
7.3.5 GROUP BY優化
7.3.6 合并小文件
7.3.7 MULTI-GROUP BY和MULTI-INSERT
序: