基本信息
书名:大數據
定价:200.10元
作者:麦尔荀伯格,库基耶,林俊宏
出版社:天下文化
出版日期:2013-05-30
ISBN:9789863201915
字数:
页码:318
版次:1
装帧:軟精裝
开本:
商品重量:0.4kg
编辑推荐
内容提要
汽車烤漆的顏色能告訴你,這輛二手車的故障率高低嗎?
市要怎樣清查,才能迅速找出有致命危險的人孔蓋?
從谷歌的搜尋字眼,怎麼預測流感疫情的蔓延?
要回答這些問題,關鍵就在於巨量資料(俗稱大數據)。
「巨量資料分析」是一門新興科技,能夠解讀和預測無數的現象,
包括預測機票的價格、好萊塢新片的票房、你家裡的青少年是否未婚懷孕!
也能協助診斷早產兒的健康情況,探查收入高低與幸福快樂的相關程度,
幫忙規劃快遞的送貨路線、電動車的充電站應該設置在哪裡,
還能用來發展自動導航的無人駕駛汽車、
以及「從駕駛人的臀部形態判斷是否為車主」的防盜系統,
也能夠快速進行多種語文的互譯……
兩位頂尖的大數據專家,真正掌握到巨量資料思維的精髓,
在這本書裡,清晰曉暢的解釋了巨量資料是什麼,
它將如何改變我們的生活,對經濟、社會和科學會帶來什麼影響,
我們又能夠做些什麼,趕搭上這波新潮流,
同時也懂得保護自己,避免個人資料和隱私受到侵害。
目录
章 現在
該讓巨量資料說話了
第2章 更多資料
「樣本=母體」的時代來臨
第3章 雜亂
擁抱不精確,宏觀新世界
第4章 相關性
不再拘泥於因果關係
第5章 資料化
當一切成為資料,用途無窮無盡
第6章 價值
不在乎擁有,只在乎充分運用
第7章 蘊涵
資料價值鏈的三個環節
第8章 風險
巨量資料也有黑暗面
第9章 管控
打破巨量資料的黑盒子
0章 未來
巨量資料只是工具,勿忘謙卑與人性
資料來源
延伸閱讀
謝辭
作者介绍
麥爾荀伯格(Viktor Mayer-Schonberger)
牛津大學網路研究所教授,
並擔任微軟、世界經濟論壇等大公司和組織的顧問,
是大數據(巨量資料)領域公認的權威,
寫過八本書以及上百篇專論。
庫基耶(Kenh Cukier)
《經濟學人》雜誌資料編輯,巨量資料思潮評論員,
經常於《紐約時報》、《金融時報》、
以及《外交事務》期刊發表財經文章。
譯者介紹
林俊宏
師範大學翻譯研究所碩士。
喜好電影、音樂、閱讀、閒晃,
覺得把話講清楚比什麼都重要。
譯有《英語的秘密家譜》、《建築為何重要》、
《大科學》、《群的智慧》、《天空的女兒》等書。
現就讀於師大譯研所博士班。
文摘
章
現在:該讓巨量資料說話了
2009年又冒出了一種新的流感病毒,稱為H1N1。這種新菌株結合了禽流感和豬流感病毒,迅速蔓延。短短幾星期內,全球的公共衛生機構都憂心忡忡,擔心即將爆發流感大流行。有些人發出警訊,認為這次爆發可能與1918年的西班牙流感不相上下,當時感染人數達到五億人,後奪走數千萬人的性命。雪上加霜的是,面對流感可能爆發,卻還沒有能派上用場的疫苗,公共衛生當局能努力的,就是減緩其蔓延的速度。為了達到這項目的,必須先知道當前流行感染的範圍及程度。
在美國,疾病管制局(CDC)要求醫生一碰到新流感病例,就必須立刻通報。即使如此,通報的速度仍然總是慢了病毒一步,大約是慢上一到兩星期。畢竟,民眾覺得身體不舒服之後,通常還是會過個幾天才就醫,而層層通報回到疾管局也需要時間,更別提疾管局要每星期才整理一次通報來的資料。但是面對迅速蔓延的疫情,拖個兩星期簡直就像是拖了一個世紀,會在關鍵的時刻,讓公共衛生當局完全無法掌握真實情況。
巨量資料初試啼聲
說巧不巧,就在H1N1躍上新聞頭條的幾星期前,網路巨擘谷歌(Google)旗下的幾位工程師,在的《自然》科學期刊發表了一篇重要的論文,當時並未引起一般人的注意,只在衛生當局和電腦科學圈裡引起討論。該篇論文解釋了谷歌能如何「預測」美國在冬天即將爆發流感,甚至還能精準定位到是哪些州。谷歌的祕訣,就是看看民眾在網路上搜尋些什麼。由於谷歌每天會接收到超過三十億筆的搜尋,而且會把它們儲存起來,那就會有大量的資料得以運用。
谷歌先挑出美國人常使用的前五千萬個搜尋字眼,再與美國疾病管制局在2003年到2008年之間的流感傳播資料,加以比對。谷歌的想法,是想靠著民眾在網路上搜尋什麼關鍵詞,找出那些感染了流感的人。雖然也曾有人就網路搜尋字眼做過類似的努力,但是從來沒人能像谷歌一樣掌握巨量資料(big data,直譯為大數據),並具備強大的處理能力和在統計上的專業技能。
雖然谷歌已經猜到,民眾的搜尋字眼可能與流感有關,像是「止咳退燒」,但相不相關其實不是真正的重點,他們設計的系統也不是從這個角度出發。谷歌這套系統真正做的,是要針對搜尋字眼的搜尋頻率,找出和流感傳播的時間、地區,有沒有統計上的相關性(correlation)。他們總共用上了高達4億5千萬種不同的數學模型,測試各種搜尋字眼,再與疾管局在2007年與2008年的實際流感病例加以比較。他們可挖到寶了!這套軟體找出了一組共四十五個搜尋字眼,放進數學模型之後,預測結果會與官方公布的全美真實資料十分符合,有強烈的相關性。
於是,他們就像疾管局一樣能夠掌握流感疫情,但可不是一、兩星期之後的事,而是幾近即時同步的掌握!
因此,在2009年發生H1N1危機的時候,比起手中的資料(以及無可避免的通報延遲),谷歌系統能提供更有用、更及時的資訊。公衛當局有了這種寶貴的資訊,控制疫情如虎添翼。
驚人的是,谷歌的這套方法並不需要去採集檢體、也不用登門造訪各家醫院診所,而只是好好利用了巨量資料,也就是用全新的方式來使用資訊,以取得實用且價值非凡的見解、商機或服務。有了谷歌這套系統,下次爆發流感的時候,全球就有了更佳的工具能夠加以預測、並防止疫情蔓延。
巨量資料功能強大,可以讓許多領域改頭換面,公共衛生領域不過是其中之一,而商業領域也正在經歷這個過程。例如買飛機票就是個很好的例子。
序言
这本书的阅读体验堪称“丝滑”。我是一个对枯燥文字有天然排斥的人,很多技术书籍对我来说都是一场意志力的考验,但这本书的语言风格却非常活泼且贴近生活。作者善于运用生动的比喻和引人入胜的故事来解释复杂的算法原理。比如,他将“机器学习”的过程比作一位厨师学习新菜谱,从最初的生疏模仿,到最终的举一反三,这个比喻让我一下子就明白了模型的迭代和优化的核心概念。书中穿插的那些小故事,大多取材于真实世界中的数据失败案例,读起来让人既感到震撼,又学到了宝贵的教训——数据质量的重要性远超我们的想象。这种寓教于乐的写作手法,极大地降低了阅读门槛,即使是对技术背景不深的读者,也能轻松跟上作者的思路,并且在不知不觉中,对数据分析的底层逻辑形成了直观的感受。我甚至将其中一些章节推荐给了正在上大一的表弟,希望他能尽早建立起正确的“数据观”。
评分这本书的封面设计得非常引人注目,那种深邃的蓝色调和其中若隐若现的数字流光,一下子就抓住了我的眼球。我原本以为这会是一本晦涩难懂的技术手册,毕竟“大数据”这三个字听起来就让人头大,但翻开第一页,我就被作者流畅的叙事风格给吸引住了。它不是那种堆砌术语的教科书,更像是一位经验丰富的向导,带着你穿梭于数据的海洋之中。书中详细阐述了数据采集、清洗、存储和分析的完整流程,但最让我惊喜的是,作者并没有止步于技术层面,而是深入探讨了大数据在商业决策、社会治理乃至个人生活中的实际应用案例。那些关于如何利用用户行为数据优化产品迭代的章节,简直是为我量身定做的工作指南,每一个案例都经过了细致的剖析,让我能清晰地看到理论如何落地生根,开出实际的效益之花。对于我这种渴望将理论知识转化为实战能力的人来说,这本书提供的视角是极其宝贵的,它不仅仅是知识的传递,更像是一场思维方式的升级,让我对未来数据驱动的世界有了更清晰、更具操作性的认知框架。
评分我最欣赏这本书的一点,是它在“未来展望”部分所展现出的宏大格局。很多同类书籍写到最后就戛然而止,停留在当前的技术应用层面,但这本书的后记部分,描绘了一幅令人振奋的图景:物联网、人工智能与大数据深度融合后的智慧城市、个性化医疗等前沿领域。作者并没有将这些描述得过于科幻和遥不可及,而是基于当前的技术发展曲线,理性地推测了未来五到十年可能发生的颠覆性变革。特别是关于“边缘计算”如何与大数据平台协同工作,以应对海量实时数据流的部分,分析得极其透彻,提供了大量可供研究者和创业者参考的切入点。这种前瞻性和战略高度,让这本书的价值远远超越了一本工具书的范畴,它更像是一张通往未来行业的路线图,为那些希望站在浪尖上的人指明了方向。
评分说实话,我买这本书的时候,是抱着一种“试试看”的心态,因为市面上关于“大数据”的书籍实在太多了,很多都像是旧闻的拼凑,缺乏新意和深度。然而,《满28包邮 大數據》这本书的视角相当独特,它没有过多纠缠于那些已经过时的工具和框架,而是将重点放在了“数据伦理”和“隐私保护”这个至关重要的话题上。在数据爆炸的时代,我们享受着便利,却也日益担忧着个人信息的安全。作者用非常犀利且富有洞察力的笔触,剖析了数据滥用的风险,并提出了诸多富有建设性的防范措施。书中引用的法律案例和行业标准对比分析,让我对数据治理的复杂性有了更深刻的理解。阅读过程中,我多次停下来深思,感觉这不仅仅是一本技术读物,更是一本关于现代社会责任的探讨。它促使我从一个单纯的数据使用者,转变为一个更具批判性思维的参与者,这一点,远超出了我对一本技术书籍的期待。
评分这本书的排版和校对工作做得非常出色,这是我作为一个细节控必须点赞的地方。在阅读技术书籍时,图表、公式和代码块的清晰度直接影响阅读效率。这本书在处理复杂的数据流程图时,线条清晰,逻辑分明,每一个节点之间的关系都一目了然。特别是那些需要对照阅读的术语对照表,设计得非常人性化,使得在回顾某些专业概念时,查找速度大大提高。而且,纸张的质感也很好,长时间阅读下来,眼睛的疲劳感也相对较轻。可以看得出,出版社在制作这本书时投入了极大的心力,确保了阅读的物理体验与内容的深度相匹配。在如今很多书籍都追求快速出版而忽略细节的当下,这本书对于品质的坚持,实在难能可贵,这让阅读过程本身也成了一种享受。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有