YL6895 9787302469803 9787302385530
第1章 數據倉庫簡介
1.1 什麼是數據倉庫 1
1.1.1 數據倉庫的定義 1
1.1.2 建立數據倉庫的原因 3
1.2 操作型係統與分析型係統 5
1.2.1 操作型係統 5
1.2.2 分析型係統 8
1.2.3 操作型係統和分析型係統對比 9
1.3 數據倉庫架構 10
1.3.1 基本架構 10
1.3.2 主要數據倉庫架構 12
1.3.3 操作數據存儲 16
1.4 抽取-轉換-裝載 17
1.4.1 數據抽取 17
1.4.2 數據轉換 19
1.4.3 數據裝載 20
1.4.4 開發ETL係統的方法 21
1.4.5 常見ETL工具 21
1.5 數據倉庫需求 22
1.5.1 基本需求 22
1.5.2 數據需求 23
1.6 小結 24
第2章 數據倉庫設計基礎
2.1 關係數據模型 25
2.1.1 關係數據模型中的結構 25
2.1.2 關係完整性 28
2.1.3 規範化 30
2.1.4 關係數據模型與數據倉庫 33
2.2 維度數據模型 34
2.2.1 維度數據模型建模過程 35
2.2.2 維度規範化 36
2.2.3 維度數據模型的特點 37
2.2.4 星型模式 38
2.2.5 雪花模式 40
2.3 Data Vault模型 42
2.3.1 Data Vault模型簡介 42
2.3.2 Data Vault模型的組成部分 43
2.3.3 Data Vault模型的特點 44
2.3.4 Data Vault模型的構建 44
2.3.5 Data Vault模型實例 46
2.4 數據集市 49
2.4.1 數據集市的概念 50
2.4.2 數據集市與數據倉庫的區彆 50
2.4.3 數據集市設計 50
2.5 數據倉庫實施步驟 51
2.6 小結 54
第3章 Hadoop生態圈與數據倉庫
3.1 大數據定義 55
3.2 Hadoop簡介 56
3.2.1 Hadoop的構成 57
3.2.2 Hadoop的主要特點 58
3.2.3 Hadoop架構 58
3.3 Hadoop基本組件 59
3.3.1 HDFS 60
3.3.2 MapReduce 65
3.3.3 YARN 72
3.4 Hadoop生態圈的其他組件 77
3.5 Hadoop與數據倉庫 81
3.5.1 關係數據庫的可擴展性瓶頸 82
3.5.2 CAP理論 84
3.5.3 Hadoop數據倉庫工具 85
3.6 小結 88
第4章 安裝Hadoop
4.1 Hadoop主要發行版本 89
4.1.1 Cloudera Distribution for Hadoop(CDH) 89
4.1.2 Hortonworks Data Platform(HDP) 90
4.1.3 MapR Hadoop 90
4.2 安裝Apache Hadoop 91
4.2.1 安裝環境 91
4.2.2 安裝前準備 92
4.2.3 安裝配置Hadoop 93
4.2.4 安裝後配置 97
4.2.5 初始化及運行 97
4.3 配置HDFS Federation 99
4.4 離綫安裝CDH及其所需的服務 104
4.4.1 CDH安裝概述 104
4.4.2 安裝環境 106
4.4.3 安裝配置 106
4.4.4 Cloudera Manager許可證管理 114
4.5 小結 115.........
第1章 數據倉庫、商業智能及維度建模初步
1.1 數據獲取與數據分析的區彆
1.2 數據倉庫與商業智能的目標
1.3 維度建模簡介
1.3.1 星型模式與OLAP多維數據庫
1.3.2 用於度量的事實錶
1.3.3 用於描述環境的維度錶
1.3.4 星型模式中維度與事實的連接
1.4 Kimball的DW/BI架構
1.4.1 操作型源係統
1.4.2 獲取.轉換_加口載(ETL)係統
1.4.3 用於支持商業智能決策的展現區
1.4.4 商業智能應用
1.4.5 以餐廳為例描述Kimball架構
1.5 其他DW/BI架構
1.5.1 獨立數據集市架構]
1.5.2 輻射狀企業信息工廠Inmon架構
1.5.3 混閤輻射狀架構與Kimball架構
1.6 維度建模神話
1.6.1 神話1:維度模型僅包含匯總數據
1.6.2 神話2:維度模型是部門級而不是企業級的
1.6.3 神話3:維度模型是不可擴展的
1.6.4 神話4:維度模型僅用於預測
1.6.5 神話5:維度模型不能被集成
1.7 考慮使用維度模型的
更多理由
1.8 本章小結
第2章 Kimball維度建模技術概述
2.1 基本概念
2.1.1 收集業務需求與數據實現
2.1.2 協作維度建模研討
2.1.3 4步驟維度設計過程
2.1.4 業務過程
2.1.5 粒度
2.1.6 描述環境的維度
2.1.7 用於度量的事實
2.1.8 星型模式與OLAP多維數據庫
2.1.9 方便地擴展到維度模型
2.2 事實錶技術基礎
2.2.1 事實錶結構
2.2.2 可加、半可加、不可加事實
2.2.3 事實錶中的空值
2.2.4 一緻性事實
2.2.5 事務事實錶
2.2.6 周期快照事實錶
2.2.7 纍積快照事實錶
2.2.8 無事實的事實錶
2.2.9 聚集事實錶或OLAP多維數據庫
2.2.1 0閤並事實錶
2.3 維度錶技術基礎
2.3.1 維度錶結構
2.3.2 維度代理鍵
2.3.3 自然鍵、持久鍵和**自然鍵
2.3.4 下鑽
2.3.5 退化維度
2.3.6 非規範化扁平維度
2.3.7 多層次維度
2.3.8 文檔屬性的標識與指示器
2.3.9 維度錶中的空值屬性
2.3.10 日曆日期維度
2.3.11 扮演角色的維度
2.3.12 雜項維度
2.3.13 雪花維度
2.3.14 支架維度
2.4 使用一緻性維度集成
2.4.1 一緻性維度
2.4.2 縮減維度
2.4.3 跨錶鑽取
2.4.4 價值鏈
2.4.5 企業數據倉庫總綫架構
2.4.6 企業數據倉庫總綫矩陣
2.4.7 總綫矩陣實現細節
2.4.8 機會/利益相關方矩陣
2.5 處理緩慢變化維度屬性
2.5.1 類型0:原樣保留
2.5.2 類型1:重寫
2.5.3 類型2:增加新行
2.5.4 類型3:增加新屬性
2.5.5 類型4:增加微型維度
2.5.6 類型5:增加微型維度及類型1支架
2.5.7 類型6:增加類型1屬性到類型2維度
2.5.8 類型7:雙類型l和類型2維度
2.6 處理維度層次關係
2.6.1 固定深度位置的層次
2.6.2 輕微參差不齊/可變深度層次
2.6.3 具有層次橋接錶的參差不齊/可變深度層次
2.6.4 具有路徑字符屬性的可變深度層次
2.7 **事實錶技術
2.7.1 事實錶代理鍵
2.7.2 蜈蚣事實錶
2.7.3 屬性或事實的數字值
2.7.4 日誌/持續時間事實
2.7.5 頭/行事實錶
2.7.6 分配的事實
2.7.7 利用分配建立利潤與損失事實錶
2.7.8 多種貨幣事實
2.7.9 多種度量事實單位
2.7.1 0年.日事實
2.7.1 1多遍SQL以避免事實錶間的連接
2.7.1 2針對事實錶的時間跟蹤1
2.7.1 3遲到的事實
2.8 **維度技術
2.8.1 維度錶連接
2.8.2 多值維度與橋接錶
2.8.3 隨時間變化的多值橋接錶
2.8.4 標簽的時間序列行為
2.8.5 行為研究分組
2.8.6 聚集事實作為維度屬性
2.8.7 動態值範圍
2.8.8 文本注釋維度
2.8.9 多時區
2.8.10 度量類型維度.........
評分
評分
評分
評分
評分
評分
評分
評分
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有