《大數據技術概論:從虛幻走嚮真實的數據世界》從初學者易於理解的角度,以通俗易懂的語言、豐富的實例、簡潔的圖錶、傳統和現代數據特徵的對比,將大數據這一計算機前沿科學如數傢珍地娓娓道來。既介紹瞭大數據和相關的基礎知識,又與具體應用有機結閤起來,並藉助可視化圖錶的畫麵感立體地為讀者剖析瞭大數據的技術和原理,非常便於自學。
本書內容包括大數據概論、大數據采集及預處理、大數據分析、大數據可視化、Hadoop概論、HDFS和Common概論、MapReduce概論、NoSQL技術介紹、Spark概論、雲計算與大數據、大數據相關案例等內容。
本書既可以作為想瞭解大數據技術和應用的初學者的教材,也適閤作為培訓中心、IT人員、企業策劃和管理人員的參考書。
第1章大數據概論
1.1大數據技術概述
1.1.1大數據的基本概念
1.1.2IT産業的發展簡史
1.1.3大數據的來源
1.1.4大數據産生的三個發展階段
1.1.5大數據的特點
1.1.6大數據處理流程
1.1.7大數據的數據格式特性
1.1.8大數據的特徵
1.1.9大數據的應用領域
1.2大數據技術架構
1.3大數據的整體技術和關鍵技術
1.4大數據分析的五種典型工具簡介
1.5大數據未來發展趨勢
1.5.1數據資源化
1.5.2數據科學和數據聯盟的成立
1.5.3大數據隱私和安全問題
1.5.4開源軟件成為推動大數據發展的動力
1.5.5大數據在多方位改善我們的生活
本章小結
第2章大數據采集及預處理
2.1大數據采集
2.1.1大數據采集概述
2.1.2大數據采集的數據來源
2.1.3大數據采集的技術方法
2.2大數據的預處理
2.3大數據采集及預處理的工具
本章小結
第3章大數據分析概述
3.1大數據分析簡介
3.1.1什麼是大數據分析
3.1.2大數據分析的基本方法
3.1.3大數據處理流程
3.2大數據分析的主要技術
3.2.1深度學習
3.2.2知識計算
3.2.3可視化
3.3大數據分析處理係統簡介
3.3.1批量數據及處理係統
3.3.2流式數據及處理係統
3.3.3交互式數據及處理係統
3.3.4圖數據及處理係統
3.4大數據分析的應用
本章小結
第4章大數據可視化
4.1大數據可視化概述
4.1.1大數據可視化與數據可視化
4.1.2大數據可視化的過程
4.2大數據可視化工具
4.2.1常見大數據可視化工具簡介
4.2.2Tableau數據可視化入門
本章小結
第5章Hadoop概論
5.1Hadoop簡介
5.1.1Hadoop的發展簡史
5.1.2Hadoop應用現狀和發展趨勢
5.2Hadoop的架構與組成
5.2.1Hadoop架構
5.2.2Hadoop組成模塊介紹
5.3Hadoop的應用
5.3.1Hadoop平颱搭建
5.3.2Hadoop的開發方式
5.3.3Hadoop應用分析
本章小結
第6章HDFS和Common概論
6.1HDFS概述
6.1.1HDFS相關概念
6.1.2HDFS特點
6.1.3HDFS體係結構
6.1.4HDFS工作原理
6.1.5HDFS相關技術
6.1.6HDFS源代碼結構
6.1.7HDFS接口
6.2Common概述
本章小結
第7章MapReduce概論
7.1MapReduce簡介
7.1.1如何理解MapReduce
7.1.2MapReduce功能和技術特徵
7.2MapReduce的Map和Reduce任務
7.2.1Map與Reduce
7.2.2Map任務原理
7.2.3Reduce任務原理
7.3MapReduce架構和工作流程
7.3.1MapReduce的架構
7.3.2MapReduce工作流程
7.4MapReduce編程源碼範例
7.5MapReduce接口
本章小結
第8章NoSQL技術介紹
8.1NoSQL基礎知識
8.1.1NoSQL的産生
8.1.2NoSQL的特點
8.1.3NoSQL的技術基礎
8.2NoSQL的種類
8.2.1鍵值存儲
8.2.2列存儲
8.2.3麵嚮文檔存儲
8.2.4圖形存儲
8.3典型的NoSQL工具
8.3.1Redis
8.3.2Bigtable
8.3.3CouchDB
8.3.4Neo4j
本章小結
第9章Spark概論
9.1Spark概述
9.1.1Spark簡介
9.1.2Spark發展
9.1.3Scala語言
9.2Spark與Hadoop
9.2.1Hadoop的局限與不足
9.2.2Spark的優點
9.2.3Spark速度比Hadoop快的原因分解
9.3Spark大數據處理架構及其生態係統
9.3.1底層的Cluster Manager和Data Manager
9.3.2中間層的Spark Runtime
9.3.3高層的應用模塊
9.4Spark的應用
9.4.1Spark的應用場景
9.4.2應用Spark的成功案例
本章小結
第10章雲計算與大數據
10.1雲計算概論
10.1.1雲計算定義
10.1.2雲計算與大數據的關係
10.1.3雲計算基本特徵
10.1.4雲計算服務模式
10.2雲計算核心技術
10.2.1虛擬化技術
10.2.2虛擬化軟件及應用
10.2.3資源池化技術
10.2.4雲計算部署模式
10.3雲計算仿真
10.4雲計算的安全
10.4.1雲計算安全現狀
10.4.2雲計算安全服務體係
10.5雲計算應用案例
本章小結
第11章大數據解決方案及相關案例
11.1大數據解決方案基礎
11.2Intel大數據
11.2.1Intel大數據解決方案
11.2.2Intel大數據相關案例——中國移動廣東公司詳單、賬單
查詢係統
11.3百度大數據
11.3.1百度大數據引擎
11.3.2百度大數據+平颱
11.3.3相關應用
11.3.4百度預測的使用方法
11.4騰訊大數據
11.4.1騰訊大數據解決方案
11.4.2相關實例——廣點通
本章小結
參考文獻
前言
IT産業在其發展曆程中,經曆過幾次技術浪潮。如今,大數據浪潮正在迅速朝我們湧來,並將觸及各個行業和生活的許多方麵。大數據浪潮將比之前發生過的浪潮更大、觸及麵更廣,給人們的工作和生活帶來的變化和影響也更大。
毋庸置疑,大數據的應用激發瞭一場思想風暴,也悄然改變瞭我們的生活方式和思維習慣。大數據正以前所未有的速度顛覆人們探索世界的方法,引起工業、商業、醫學、軍事等領域的深刻變革。因此,在當前大數據浪潮的猛烈衝擊下,人們迫切需要充實和完善自己原有的IT知識結構,掌握兩種全新的技能: 一是掌握大數據基本技術與應用,使大數據為我們所用的技能; 二是掌握數據之間隱藏的規律與關係,以及可視化方法,使大數據更好地服務於社會發展的技能。
本書注重實用性,圍繞大數據及其相關技術這一主題,采用深入淺齣、圖文並茂的敘述方式,簡明扼要地闡述瞭大數據及其相關技術的基本理論和發展趨勢,使廣大讀者通過閱讀本書,深入瞭解和掌握大數據的理論和應用,從而更好地把握時代發展的脈搏和曆史賦予的機遇。
本書的目標是給廣大讀者提供一個既通俗易懂,又具有嚴謹、完整、結構化特徵的書籍。其獨到之處是既闡明瞭大數據技術的係統性和理論性,又對傳統數據和大數據在來源、結構、特徵、存儲方式、使用方法等方麵,通過大量的錶格和圖形方式進行瞭有針對性的對比和闡述,使讀者對兩者的區彆一目瞭然,對理解和掌握大數據理技術具有事半功倍的效果。另外,考慮到大數據技術涉及許多新名詞和專業性極強的詞匯,故在全書的每一章中均附有相關術語的注釋,方便讀者查閱和自學。
本書還力求將大數據技術晦澀難懂的理論知識以通俗易懂的語言和方式,由淺入深地展現在讀者麵前,便於讀者理解和掌握。本書內容重點突齣,語言精練易懂,非常便於自學,可作為想瞭解、使用大數據技術的相關人員,如工程技術人員、IT工作者、企業策劃和管理人員的參考書,也可作為相關學習班的培訓教材。
全書共分成11章: 第1章大數據概論,第2章大數據采集及預處理,第3章大數據分析概論,第4章大數據可視化,第5章Hadoop概論,第6章HDFS和Common概論,第7章MapReduce概論,第8章NoSQL技術介紹,第9章Spark概論,第10章雲計算與大數據,第11章大數據解決方案相關案例。
本書在寫作過程中參閱瞭大量的中外書籍和相關資料,在此對各位作者錶示真誠的謝意。另外本書得到瞭中國醫科大學沙憲政教授和東北大學楊廣明教授的大力支持,清華大學齣版社對這本書的齣版做瞭精心策劃及充分論證,特此感謝!由於作者水平有限,加之時間倉促,書中難免存在疏漏之處,懇請廣大讀者批評斧正!
婁岩2016年6月
這本書給我的第一印象,是它充滿瞭探索和發現的意味。“從虛幻走嚮真實”這個錶述,恰恰擊中瞭許多人在麵對“大數據”這一概念時的睏惑。我個人一直覺得,大數據聽起來很宏偉,但具體操作起來,卻像是一個黑箱。我希望這本書能夠揭開這個黑箱的蓋子,讓我們看到裏麵究竟是什麼。我想知道,大數據究竟是如何被“看見”的?是通過哪些工具和方法,將那些海量、異構的數據轉化為可以被分析的對象?我尤其期待書中對於數據可視化部分的講解。畢竟,一張圖錶勝過韆言萬語,如果能將復雜的數據關係通過直觀的可視化呈現齣來,那將是學習和理解大數據的絕佳方式。我希望能看到一些經典的、有代錶性的數據可視化案例,它們是如何通過圖像和圖錶,講述數據背後的故事,並引發人們的思考。我希望這本書能讓我不僅理解“大數據是什麼”,更能理解“大數據能做什麼”,並且,我希望它能引導我思考“大數據能為我做什麼”。
評分我對這本書的期待,主要集中在它對於“真實”世界的描繪。我總覺得,大數據之所以能從“虛幻”走嚮“真實”,一定離不開一係列強大的技術支撐。我迫切地想瞭解,這些支撐技術究竟是什麼?是分布式存儲技術?是並行計算框架?還是各種各樣的機器學習算法?我希望書中能夠用一種循序漸進的方式,將這些復雜的概念一一剖析。或許,它會從最基礎的數據處理技術開始,然後逐步深入到更高級的算法和應用。我期待的,不僅僅是理論的介紹,更希望看到一些實際的應用案例,例如,大數據是如何在醫療、金融、交通、零售等各個領域發揮作用的。我希望通過這些案例,我能夠更直觀地感受到大數據帶來的變革和影響。我希望這本書能夠成為我的一個“導航儀”,幫助我在紛繁復雜的大數據世界中,找到一條清晰的路徑,去理解和掌握這項關鍵技術。我期待它能讓我不再對大數據感到陌生,而是能以一種積極和開放的心態去擁抱它。
評分讀瞭書名,我腦海中立刻勾勒齣一個畫麵:從最初的零散數據,如同一片片飄渺的雲,經過層層技術的打磨,最終匯聚成一股股強大的數據洪流,驅動著現實世界的進步。我特彆期待書中對於“虛幻”部分的處理。究竟是什麼樣的“虛幻”,讓我們覺得大數據是遙不可及的?是那些聽起來高深的統計模型?還是那些復雜的分布式計算框架?我希望作者能夠打破這些“虛幻”的壁壘,用最直觀的方式,讓我們理解這些技術是如何從理論走嚮實踐的。有沒有可能,書中會穿插一些曆史性的敘述,講述大數據技術是如何一步步發展演變至今的?從最初的統計學,到後來的數據庫技術,再到如今的雲計算和人工智能,這條發展脈絡,對我而言,將是理解“真實”的關鍵。我設想,作者會用一種“故事敘述”的方式,而不是枯燥的公式堆砌,來闡述這些技術概念。我希望讀完這本書,我能夠自信地迴答,大數據究竟解決瞭哪些人類社會麵臨的難題,它又為我們創造瞭怎樣的價值。
評分我對這本書的期望,更多地聚焦於它在“真實數據世界”這一部分的闡述。畢竟,我們每天都在創造和消費海量的數據,但對於這些數據的“旅程”,我卻知之甚少。我希望作者能夠深入淺齣地剖析,數據是如何被采集、存儲、處理和分析的。我尤其關心那些看似神秘的算法,它們是如何從龐雜的數據中提煉齣有價值的信息,並最終轉化為 actionable insights 的。有沒有可能,書中會穿插一些有趣的“數據偵探”故事,展示如何利用數據來解決實際問題?比如,如何通過分析交通流量數據來優化城市規劃,或者如何利用用戶行為數據來預測疾病爆發。我腦海中浮現的是,作者會用通俗易懂的語言,講解那些復雜的機器學習模型,或許還會用一些形象的比喻來解釋神經網絡的工作原理。我希望這本書能讓我對數據的生命周期有一個全麵的瞭解,不僅僅是知道“大數據”這個名詞,更是能理解它背後的運作機製。如果能有一些實際操作的指導,或者相關的工具介紹,那就更好瞭,盡管我不是技術專業人士,但對嘗試性的學習總是充滿熱情。
評分這本書,我早就覬覦它的大名瞭,畢竟“大數據”這三個字,在這幾年裏,幾乎是無處不在。尤其是“從虛幻走嚮真實的數據世界”這個副標題,著實點燃瞭我內心深處的求知欲。我一直覺得,大數據這個概念,雖然聽起來高大上,但離我們普通人的生活,總有一種隔著一層紗的距離感。這本書的齣現,似乎就是為瞭打破這層迷霧,讓那些曾經隻存在於新聞報道和技術論壇上的概念,變得觸手可及。我特彆好奇,它究竟是如何將那些抽象的技術原理,轉化為生動的故事和易於理解的圖示的。我設想,它可能會從我們日常生活中經常接觸到的數據應用開始,比如電商平颱的個性化推薦,或者社交媒體上的熱點話題分析,一步步地揭示背後隱藏的大數據技術。我想知道,它會不會用一些具體的案例,來證明大數據並非遙不可及,而是真正影響著我們的決策,改變著我們的生活。我期待它能讓我明白,大數據究竟是什麼,它能做什麼,以及它將如何塑造我們未來的世界。這種將理論與實踐相結閤的寫作方式,對我來說,是學習復雜技術最有效的方式之一。我希望這本書能成為我的“數據啓濛書”,讓我對這個領域有一個紮實而清晰的認知。
評分哈哈哈哈哈好好好好好
評分好好好好好好
評分不錯的書,挺適閤我的足球的
評分在jd買的書都堆滿一書架瞭,慢慢看(/≧▽≦)/~┴┴
評分哈哈哈哈哈好好好好好
評分好
評分很不錯。
評分價格有點貴,沒什麼優惠
評分好書,包裝很好。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有