包郵 Hadoop構建數據倉庫實踐+Hive編程指南 2本 大數據技術書籍 數據庫管理

包郵 Hadoop構建數據倉庫實踐+Hive編程指南 2本 大數據技術書籍 數據庫管理 pdf epub mobi txt 電子書 下載 2025

王雪迎(美)卡普廖洛 著
圖書標籤:
  • Hadoop
  • Hive
  • 數據倉庫
  • 大數據
  • 數據庫
  • 編程指南
  • 技術書籍
  • 數據分析
  • 包郵
  • 實戰
想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 曠氏文豪圖書專營店
齣版社: 清華大學齣版社
ISBN:9787302469803
商品編碼:12987636800

具體描述

YL6894  9787302469803 9787115333834

 Hadoop構建數據倉庫實踐

本書講述在流行的大數據分布式存儲和計算平颱Hadoop上設計實現數據倉庫,將傳統數據倉庫建模與SQL開發的簡單性與大數據技術相結閤,快速、高效地建立可擴展的數據倉庫及其應用係統。 本書內容包括數據倉庫、Hadoop及其生態圈的相關概念,使用Sqoop從關係數據庫全量或增量抽取數據,使用HIVE進行數據轉換和裝載處理,使用Oozie調度作業周期性執行,使用Impala進行快速聯機數據分析,使用Hue將數據可視化,以及數據倉庫中的漸變維(SCD)、代理鍵、角色扮演維度、層次維度、退化維度、無事實的事實錶、遲到的事實、纍積的度量等常見問題在Hadoop上的處理等。本書適閤數據庫管理員、大數據技術人員、Hadoop技術人員、數據倉庫技術人員,也適閤高等院校和培訓機構相關**的師生教學參考。

第1章 數據倉庫簡介

1.1 什麼是數據倉庫 1

1.1.1 數據倉庫的定義 1

1.1.2 建立數據倉庫的原因 3

1.2 操作型係統與分析型係統 5

1.2.1 操作型係統 5

1.2.2 分析型係統 8

1.2.3 操作型係統和分析型係統對比 9

1.3 數據倉庫架構 10

1.3.1 基本架構 10

1.3.2 主要數據倉庫架構 12

1.3.3 操作數據存儲 16

1.4 抽取-轉換-裝載 17

1.4.1 數據抽取 17

1.4.2 數據轉換 19

1.4.3 數據裝載 20

1.4.4 開發ETL係統的方法 21

1.4.5 常見ETL工具 21

1.5 數據倉庫需求 22

1.5.1 基本需求 22

1.5.2 數據需求 23

 1.6 小結 24

第2章 數據倉庫設計基礎

2.1 關係數據模型 25

2.1.1 關係數據模型中的結構 25

2.1.2 關係完整性 28

2.1.3 規範化 30

2.1.4 關係數據模型與數據倉庫 33

2.2 維度數據模型 34

2.2.1 維度數據模型建模過程 35

2.2.2 維度規範化 36

2.2.3 維度數據模型的特點 37

2.2.4 星型模式 38

2.2.5 雪花模式 40

2.3 Data Vault模型 42

2.3.1 Data Vault模型簡介 42

2.3.2 Data Vault模型的組成部分 43

2.3.3 Data Vault模型的特點 44

2.3.4 Data Vault模型的構建 44

2.3.5 Data Vault模型實例 46

2.4 數據集市 49

2.4.1 數據集市的概念 50

2.4.2 數據集市與數據倉庫的區彆 50

2.4.3 數據集市設計 50

2.5 數據倉庫實施步驟 51

2.6 小結 54

第3章 Hadoop生態圈與數據倉庫

3.1 大數據定義 55

3.2 Hadoop簡介 56

3.2.1 Hadoop的構成 57

3.2.2 Hadoop的主要特點 58

3.2.3 Hadoop架構 58

3.3 Hadoop基本組件 59

3.3.1 HDFS 60

3.3.2 MapReduce 65

3.3.3 YARN 72

3.4 Hadoop生態圈的其他組件 77

3.5 Hadoop與數據倉庫 81

3.5.1 關係數據庫的可擴展性瓶頸 82

3.5.2 CAP理論 84

3.5.3 Hadoop數據倉庫工具 85

3.6 小結 88

第4章 安裝Hadoop

4.1 Hadoop主要發行版本 89

4.1.1 Cloudera Distribution for Hadoop(CDH) 89

4.1.2 Hortonworks Data Platform(HDP) 90

4.1.3 MapR Hadoop 90

4.2 安裝Apache Hadoop 91

4.2.1 安裝環境 91

4.2.2 安裝前準備 92

4.2.3 安裝配置Hadoop 93

4.2.4 安裝後配置 97

4.2.5 初始化及運行 97

4.3 配置HDFS Federation 99

4.4 離綫安裝CDH及其所需的服務 104

4.4.1 CDH安裝概述 104

4.4.2 安裝環境 106

4.4.3 安裝配置 106

4.4.4 Cloudera Manager許可證管理 114

4.5 小結 115.........


Hive編程指南

  《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來匯總、查詢和分析存儲在Hadoop分布式文件係統上的大數據集閤。全書通過大量的實例,首先介紹如何在用戶環境下安裝和配置Hive,並對Hadoop和MapReduce進行詳盡闡述,*終演示Hive如何在Hadoop生態係統進行工作。

  《Hive編程指南》適閤對大數據感興趣的愛好者以及正在使用Hadoop係統的數據庫管理員閱讀使用。

第1章 基礎知識 
1.1 Hadoop和MapReduce綜述 
1.2 Hadoop生態係統中的Hive 
1.2.1 Pig 
1.2.2 HBase 
1.2.3 Cascading、Crunch及其他 
1.3 Java和Hive:詞頻統計算法 
1.4 後續事情 

第2章 基礎操作 
2.1 安裝預先配置好的虛擬機 
2.2 安裝詳細步驟 
2.2.1 裝Java 
2.2.2 安裝Hadoop 
2.2.3 本地模式、僞分布式模式和分布式模式 
2.2.4 測試Hadoop 
2.2.5 安裝Hive 
2.3 Hive內部是什麼 
2.4 啓動Hive 
2.5 配置Hadoop環境 
2.5.1 本地模式配置 
2.5.2 分布式模式和僞分布式模式配置 
2.5.3 使用JDBC連接元數據 
2.6 Hive命令 
2.7 命令行界麵 
2.7.1 CLI 選項 
2.7.2 變量和屬性 
2.7.3 Hive中“一次使用”命令 
2.7.4 從文件中執行Hive查詢 
2.7.5 hiverc文件 
2.7.6 使用Hive CLI的更多介紹 
2.7.7 查看操作命令曆史 
2.7.8 執行shell命令 
2.7.9 在Hive內使用Hadoop的dfs命令 
2.7.10 Hive腳本中如何進行注釋 
2.7.11 顯示字段名稱 

第3章 數據類型和文件格式 
3.1 基本數據類型 
3.2 集閤數據類型 
3.3 文本文件數據編碼 
3.4 讀時模式 

第4章 HiveQL:數據定義 
4.1 Hive中的數據庫 
4.2 修改數據庫 
4.3 創建錶 
4.3.1 管理錶 
4.3.2 外部錶 
4.4 分區錶、管理錶 
4.4.1 外部分區錶 
4.4.2 自定義錶的存儲格式 
4.5 刪除錶 
4.6 修改錶 
4.6.1 錶重命名 
4.6.2 增加、修改和刪除錶分區 
4.6.3 修改列信息 
4.6.4 增加列 
4.6.5 刪除或者替換列 
4.6.6 修改錶屬性 
4.6.7 修改存儲屬性 
4.6.8 眾多的修改錶語句 

第5章 HiveQL:數據操作 
5.1 嚮管理錶中裝載數據 
5.2 通過查詢語句嚮錶中插入數據 
5.3 單個查詢語句中創建錶並加載數據 
5.4 導齣數據 

第6章 HiveQL:查詢 
6.1 SELECT…FROM語句 
6.1.1 使用正則錶達式來指定列 
6.1.2 使用列值進行計算 
6.1.3 算術運算符 
6.1.4 使用函數 
6.1.5 LIMIT語句 
6.1.6 列彆名 
6.1.7 嵌套SELECT語句 
6.1.8 CASE…WHEN…THEN 句式 
6.1.9 什麼情況下Hive可以避免進行MapReduce 
6.2 WHERE語句 
6.2.1 謂詞操作符 
6.2.2 關於浮點數比較 
6.2.3 LIKE和RLIKE 
6.3 GROUP BY 語句 
6.4 JOIN語句 
6.4.1 INNER JOIN 
6.4.2 JOIN優化 
6.4.3 LEFT OUTER JOIN 
6.4.4 OUTER JOIN 
6.4.5 RIGHT OUTER JOIN 
6.4.6 FULL OUTER JOIN 
6.4.7 LEFT SEMI-JOIN 
6.4.8 笛卡爾積JOIN 
6.4.9 map-side JOIN 
6.5 ORDER BY和SORT BY 
6.6 含有SORT BY 的DISTRIBUTE BY 
6.7 CLUSTER BY 
6.8 類型轉換 
6.9 抽樣查詢 
6.9.1 數據塊抽樣 
6.9.2 分桶錶的輸入裁剪 
6.10 UNION ALL ..........


用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有