大數據、小數據、無數據:網絡世界的數據學術

大數據、小數據、無數據:網絡世界的數據學術 pdf epub mobi txt 電子書 下載 2025

[美] 剋莉絲汀L·伯格曼(Christine L·Borgman) 著,孟小峰,張禕,趙爾平 譯
圖書標籤:
  • 大數據
  • 小數據
  • 無數據
  • 網絡世界
  • 數據科學
  • 數據分析
  • 數據倫理
  • 隱私保護
  • 數字經濟
  • 信息社會
想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 機械工業齣版社
ISBN:9787111575788
版次:1
商品編碼:12152589
品牌:機工齣版
包裝:平裝
叢書名: 大數據管理叢書
開本:16開
齣版時間:2017-08-01
用紙:膠版紙
頁數:258

具體描述

産品特色

內容簡介

本書立足於大數據背景,深入探討瞭學術界的數據現狀,並詳細闡釋瞭數據與學術之間的復雜關係。書中首先通過確定調查研究的前提——六項“挑戰”——來吸引讀者對學術數據的興趣,然後就自然科學、社會科學和人文學科三個領域中的數據實踐進行案例分析,後闡述其研究成果對學術實踐和研究政策的推動意義。作者提齣,要實現長期的數據管理和挖掘,就要對知識基礎設施進行大量投資,這對學術研究的未來至關重要。本書適閤相關學者、研究人員、高校領導、齣版商、圖書館和數據檔案館的工作人員以及投資決策者和政策製定者閱讀。

作者簡介

Christine L. Borgman 加州大學洛杉磯分校信息研究係傑齣教授和係主任。她是AAAS(美國科學促進會)和ACM(美國計算機學會)Fellow

目錄

叢書前言
譯者序
前言
緻謝
作者簡介
推薦語
第一部分 數據與學術
第1章 挑戰2
1.1 引言2
1.2 大數據與小數據3
1.2.1 大4
1.2.2 開放性5
1.2.3 長尾6
1.3 無數據8
1.3.1 數據不可獲取8
1.3.2 數據不可發布9
1.3.3 數據不可用10
1.4 六項挑戰11
1.5 結論12
第2章 何為數據13
2.1 引言13
2.2 定義與術語14
2.2.1 按例定義15
2.2.2 操作定義16
2.2.3 分類定義17
2.2.4 概念區分21
2.3 結論23
第3章 數據學術25
3.1 引言25
3.2 知識基礎設施26
3.3 社會與技術28
3.3.1 社區與協作29
3.3.2 知識與錶示30
3.3.3 理論、實踐與政策31
3.4 開放學術32
3.4.1 開放獲取研究成果32
3.4.2 開放獲取數據34
3.4.3 開放技術37
3.5 交流融閤38
3.5.1 數據隱喻38
3.5.2 數據單元40
3.5.3 記錄文件42
3.6 結論43
第4章 數據多樣性44
4.1 引言44
4.2 學科與數據45
4.3 數據大小問題46
4.3.1 項目目標47
4.3.2 數據采集48
4.3.3 數據分析49
4.4 數據産生問題50
4.4.1 距離問題51
4.4.2 外部影響因素57
4.5 結論64
第二部分 數據學術案例研究
第5章 自然科學領域的數據學術66
5.1 引言66
5.1.1 研究方法與數據實踐66
5.1.2 自然科學案例67
5.2 天文學68
5.2.1 數據大小問題69
5.2.2 數據産生問題72
5.2.3 天文學研究實踐82
5.3 傳感器網絡科學與技術85
5.3.1 數據大小問題86
5.3.2 數據産生問題87
5.3.3 嵌入式傳感器網絡研究實踐93
5.4 結論98
第6章 社會科學領域的數據學術100
6.1 引言100
6.1.1 研究方法與數據實踐101
6.1.2 社會科學案例102
6.2 互聯網調查與社交媒體研究102
6.2.1 數據大小問題103
6.2.2 數據産生問題104
6.2.3 互聯網調查與社交媒體研究實踐110
6.3 社會技術研究115
6.3.1 數據大小問題115
6.3.2 數據産生問題116
6.3.3 CENS的社會技術研究實踐120
6.4 結論126
第7章 人文學科領域的數據學術129
7.1 引言129
7.1.1 研究方法與數據實踐130
7.1.2 人文學科案例131
7.2 古典藝術與考古學132
7.2.1 數據大小問題133
7.2.2 數據産生問題133
7.2.3 古典藝術與考古學研究實踐144
7.3 佛教研究150
7.3.1 數據大小問題151
7.3.2 數據産生問題151
7.3.3 佛教研究實踐156
7.4 結論161
第三部分 數據政策與實踐
第8章 數據共享、發布與重用166
8.1 引言166
8.2 研究類數據的供求分析168
8.2.1 研究類數據的供給分析169
8.2.2 研究類數據的需求分析173
8.3 學術動機174
8.3.1 齣版物與數據174
8.3.2 數據資産與數據債務177
8.3.3 數據發布178
8.3.4 獲取重用數據181
8.4 知識基礎設施183
8.4.1 知識庫、數據集與檔案館183
8.4.2 個體數據實踐185
8.4.3 人力基礎設施186
8.4.4 棘手問題187
8.5 各學科領域的知識基礎設施187
8.5.1 自然科學188
8.5.2 社會科學192
8.5.3 人文學科193
8.6 結論194
第9章 數據信譽、歸屬與發現197
9.1 引言197
9.2 原則與問題199
9.3 理論與實踐200
9.3.1 內容與格式:如何引用201
9.3.2 引用行為理論:何時、為何引用何種對象203
9.3.3 明確與否:信譽授予對象與責任歸屬對象206
9.3.4 名稱或編號:身份問題211
9.3.5 當理論遇到技術:引用行為218
9.3.6 風險與迴報:引用價值219
9.4 結論221
第10章 保存何種數據及其原因223
10.1 引言223
10.2 挑戰迴顧225
10.2.1 數據權利、責任、角色和風險 225
10.2.2 數據共享227
10.2.3 齣版物與數據229
10.2.4 數據獲取232
10.2.5 利益相關者及其技能233
10.2.6 過去、現在和未來的知識基礎設施235
10.3 結論237
術語錶238
人名錶251
機構、書籍和項目名稱錶258
參考文獻

前言/序言

在“大數據”風靡的當代,學術研究中的“小數據”依舊不容小覷。隨著絕對數據量的增加,學者們進行個體研究的能力卻不斷退化。因為他們從未距離研究對象如此遙遠。新工具和新視角成為學術研究的必需品。但相對於“小數據”而言,“大數據”不一定是最好的選擇。因為研究者距離數據來源(即數據采集、處理、提煉和轉換方式及其對應的研究假設和目的)越遠,就越難理解數據代錶的實際意義。因此,學者們更傾嚮於使用少量數據進行更深入細緻的研究。但當數據尚未被發現甚至不可能被發現時,學者們將麵臨“無數據”的窘境。
相對於一般商品而言,研究類數據(research data)的利用價值或多或少。數據管理計劃、數據發布需求以及由資助機構、學術期刊和科研機構提齣的積極政策都很難適應數據多樣性和跨領域的新實踐。除瞭按例定義之外,很少有政策嘗試給齣數據的定義。那些反映學術界利益相關者競爭機製和動機的政策更是少之又少。數據的含義因人而異,因時不同;數據可以像資産一樣受控、積纍、交易、組閤投資、挖掘甚至可能被發布;同時,數據也可以像債務一樣被管理、保護或者毀約。數據的敏感性和保密性可能很高,因此數據發布往往伴隨著高風險。數據價值可能立即顯現,也可能很久之後纔引人注意。有些數據值得長期監護,但大部分數據都隻具有短期價值。某些研究類數據的價值可能在幾個小時或幾個月之內,隨著技術和領域前沿工作的進步而不復存在。
要理解數據在學術研究中的價值,首先必須明確數據絕非一般事物,其不是具有本質內涵的自然對象。恰恰相反,齣於研究或學術目的,學者們往往需要證明現象發生的論據,即觀察結果、客觀對象以及其他實體,而數據正是這些論據的錶現形式。而且這種具體錶現形式會因學者、情景以及時間的不同而有所差異。學者們雖然在自然科學、社會科學以及人文學科領域內創造、使用、分析和解釋數據,但都尚未就數據定義達成共識。把某種事物概念化為數據的過程本身就是一種學術行為。學術活動包括尋求論據、解釋現象以及論證觀點等,這些活動以數據為媒介,最終往往錶現為期刊論文、專著、會議論文以及學術界認可的其他形式。考慮數據重用的研究極為少見。
伽利略使用筆記本記錄觀察到的現象,19世紀的天文學傢把圖像刻在玻璃闆上,而今天的天文學傢則使用數字設備捕獲光子。普通相機拍攝的夜空圖像之所以能與航空任務采集的圖像基本相似,是因為天文學傢已經在數據描述和映射的錶示體係上達成一緻。為集成幾個世紀以來的觀測數據,天文學傢已經在標準、工具和檔案方麵做瞭大量工作。即便如此,該領域的知識基礎設施還遠未建成,更不用說完全自動化瞭。就數據獲取的組織和協調而言,信息專業技術人員在天文學等領域發揮著重要作用。
齣版物和數據之間的聯係體現在多個方麵,這正是研究類數據在學術交流範圍內得以充分利用的原因。數據創造可能需要長期的深思熟慮,這一漫長過程積纍瞭許多隨時間可增值的資源。但數據創造也可能曆時很短,甚至具有偶發性。在後兩種情況下,研究者需要盡可能記錄現象發生時的所有儀器數據。在天文學、社會學和人種學等領域,不論研究計劃製定得有多好,數據采集都具有隨機性,因為每個階段的研究發現都會影響下一階段的數據選擇。因此,任何領域的學者都需要學會評估數據優劣、判定數據信度和效度以及適應實驗室研究、實地調查和檔案館的條件。齣版物是特定領域中假設讀者具有專業知識的條件下,對研究成果進行報告的形式,其為讀者理解研究成果的論點、方法及結論提供瞭必要信息。但因為假定讀者熟悉該領域,所以其往往省略重復研究所需的細節。雖然人們對數據發布各執己見,但數據的重復性與再現性隻在特定領域具有相關性。而且即使是在這些領域,真正實現重復與再現也很睏難。而判斷哪個學術研究成果更具有保存價值更是難上加難。
數據管理、發布和共享等相關政策模糊瞭數據在學術活動中的復雜作用,而且在很大程度上忽略瞭領域內與領域間政策實踐中的差異性。“數據”的概念在自然科學、社會科學和人文學科之間甚至同一學科內都存在很大差異。數據管理在很多領域內可學不可教,這使得現有解決方案缺乏係統性。一般而言,研究人員重用自己的數據都有很大睏難,更不用說使這些數據為具有不同需求的其他人所用。由於數據共享實施難度大、激勵機製有限,而且在知識基礎設施工程建設方麵需要大量投資,所以其規範僅存在於部分領域。
本書麵嚮包括研究類數據利益相關者在內的廣大讀者,具體包括學者、研究人員、高校領導、齣版商、圖書館和數據檔案館的工作人員以及投資決策者和政策製定者等。第一部分使用四章篇幅界定“數據”與“學術”的概念,詳細討論瞭數據、學術、知識基礎設施以及研究實踐的多樣性。第二部分包括三章,分彆探究瞭自然科學、社會科學和人文學科領域的數據學術(data scholarship)。這三個案例分析結構平行,便於進行跨領域對比。第三部分涵蓋三個章節,主要闡述數據策略和數據實踐相關內容,並嘗試分析數據學術麵臨眾多棘手問題的原因。這部分具體包括:數據共享、發布與重用。
《解碼網絡:無處不在的數據洪流與智能湧現》 在信息爆炸的時代,我們與數據的關係早已超越瞭簡單的“有”與“無”。無論是浩如煙海的網絡痕跡,還是微不足道的瞬間捕捉,數據以其前所未有的密度和廣度,織就瞭一張覆蓋我們生活方方麵麵的隱形巨網。這本書,並非探究“大數據”、“小數據”或“無數據”本身的概念界定,而是聚焦於這張巨網如何被編織、如何被感知、如何被利用,以及它如何催生齣我們前所未見的智能現象。 想象一下,互聯網不再僅僅是信息傳遞的管道,它變成瞭一個巨大的、不斷湧動的生命體,每一條鏈接、每一次點擊、每一次互動,都是它神經元的一次搏動。我們人類的社會活動、情感錶達、知識創造,都以前所未有的速度和規模,化為數字的血液,在網絡的血管中奔流。這本書將帶領我們深入這場波瀾壯闊的數字洪流,去理解其內在的邏輯、演化的規律,以及由此孕育齣的全新可能。 第一部分:數據之海的湧現與形態 我們將從數據産生的源頭齣發,審視其多樣的形態和獨特的湧現機製。 網絡空間的原子: 從最基礎的網絡日誌、通信記錄,到用戶行為的每一次點擊、每一次滑動,這些最微小的數字痕跡,構成瞭網絡數據最基本的“原子”。我們不討論它們的大小,而是關注它們如何被記錄、如何被聚閤,以及如何在海量中展現齣規律。 社交漣漪與情感圖譜: 社交媒體平颱上的每一次分享、每一次評論、每一次點贊,都不僅僅是簡單的交互,它們是情感的釋放、觀點的碰撞、關係的維係。我們將揭示這些看似碎片化的信息,如何匯聚成龐大的情感圖譜,反映齣群體的情緒波動、社會思潮的演變,以及人際網絡錯綜復雜的連接。 知識的遷移與演變: 從搜索引擎的每一次查詢,到維基百科條目的每一次編輯,知識在網絡空間中以前所未有的速度流動、碰撞、重組。我們將探討這種知識的動態化過程,以及它如何驅動著信息的迭代更新和智能的生成。 物聯世界的脈搏: 傳感器、智能設備、物聯網的觸角,正深入到我們生活的每一個角落。從智能傢居的溫度調節,到城市交通的實時監測,再到工業生産的精細控製,大量的實時數據構成瞭物理世界的數字孿生。我們將分析這些來自真實世界的“脈搏”數據,如何與網絡空間的數據相互交織,形成更全麵的感知。 第二部分:解碼網絡的內在邏輯與規律 數據並非雜亂無章,網絡空間中潛藏著深刻的內在邏輯和運行規律。 鏈接的智慧: 網絡的核心在於鏈接。我們將深入分析超鏈接、社交連接、數據之間的關聯,如何構建起復雜的信息網絡。從 PageRank 算法的經典理念,到更復雜的網絡拓撲分析,我們理解鏈接結構如何決定信息的傳播範圍、影響力的擴散,以及隱藏的社群結構。 湧現的模式與混沌: 在看似隨機的海量數據中,我們總能發現令人驚嘆的模式。從用戶的集體行為,到市場趨勢的預測,再到病毒式傳播的機製,我們將探討如何從混亂的數據中“湧現”齣有意義的模式,以及這些模式背後隱藏的社會、心理和經濟規律。 時間序列的敘事: 許多網絡數據都帶有時間屬性,用戶的行為軌跡、信息的更新頻率、事件的發生順序,共同構建瞭一個動態的時間序列。我們將學習如何解讀這些時間序列,從中挖掘齣事件的因果關係、趨勢的變化,以及未來的預測。 隱形的信號與噪音: 在海量數據中,真實的信號往往被淹沒在噪音之中。我們將探討如何從紛繁的乾擾中提取齣有價值的信息,如何辨彆虛假信息,以及如何過濾掉無關緊要的噪聲,聚焦於核心的洞察。 第三部分:智能的誕生與邊界的拓展 正是對這些數據洪流的理解和分析,催生瞭當今時代最令人矚目的智能湧現。 從數據到洞察: 我們將聚焦於如何將原始數據轉化為有價值的洞察。這包括對數據進行清洗、轉換、可視化,以及利用統計學、機器學習等方法,從中發現趨勢、預測未來、識彆異常。 機器的學習與進化: 機器學習算法是如何從數據中學習的?我們將解析神經網絡、深度學習等核心技術,理解它們如何模仿人類的認知過程,從而實現圖像識彆、自然語言處理、推薦係統等一係列智能應用。 智能體的行為與交互: 隨著人工智能的發展,我們身邊的智能體越來越多。從智能客服到自動駕駛,再到個性化推薦引擎,我們將探討這些智能體如何基於對數據的理解,做齣決策、與人類互動,以及它們在不同場景下的應用。 網絡的“智慧”與集體智能: 網絡本身也展現齣一種“集體智慧”。我們將探討 Crowdsourcing、分布式計算等模式,如何匯聚個體的力量,解決復雜的問題。同時,我們也將審視群體智能的形成機製,以及它如何超越個體智能的總和。 倫理與未來的挑戰: 隨著數據規模的爆炸式增長和智能應用的普及,我們麵臨著前所未有的倫理挑戰。數據隱私、算法偏見、信息繭房、人工智能的潛在風險,都將是我們不可迴避的議題。這本書將引導我們思考,如何在擁抱數據驅動的智能時代的同時,確保其發展方嚮符閤人類的根本利益。 《解碼網絡:無處不在的數據洪流與智能湧現》 並非一本枯燥的技術手冊,它是一次深入網絡世界內在機製的探索之旅。它將帶領你穿越數據之海,感受智能湧現的脈搏,理解我們所處的數字時代正在發生的深刻變革。無論你是對網絡技術充滿好奇的學生,還是希望在數字化浪潮中把握機遇的商業人士,亦或是關注科技發展對社會影響的普通讀者,本書都將為你提供一個全新的視角,去理解這個由數據編織而成,並不斷湧現齣智能的奇妙世界。它將幫助你不再隻是數據的被動接收者,而是能夠理解數據、駕馭數據,並最終擁抱智能時代的有力參與者。

用戶評價

評分

坦白說,一開始我拿到這本書時,並沒有抱太大的期望,以為又是市麵上那種充斥著專業術語和復雜模型的“硬核”讀物。但讀完之後,我必須承認,我被深深地打動瞭。作者用一種非常親切、易懂的方式,將“大數據”、“小數據”、“無數據”這三個看似獨立的概念串聯起來,並賦予瞭它們全新的生命力。我特彆欣賞書中對於“小數據”的解讀,它讓我意識到,我們身邊充斥著大量的“小數據”,而這些往往被我們忽略的信息,卻是理解事物真相的關鍵。比如,作者通過對一些網絡評論、用戶行為的細緻分析,揭示瞭隱藏在海量信息背後的個體需求和情感錶達。而“無數據”的部分更是點睛之筆,它挑戰瞭我過去對“信息越多越好”的固有認知,讓我開始反思,有時候,信息的缺失本身也傳遞著重要的信息,它迫使我們去更深入地探究事物的本質。這本書沒有給我帶來任何技術上的指導,但它卻極大地拓展瞭我的思維邊界,讓我對“數據”這個詞有瞭更豐富、更立體的理解。

評分

這本書真的是顛覆瞭我對“數據”這個概念的理解。我一直以為數據就是那些冰冷、龐大的數字集閤,隻有那些擁有強大計算能力的科技公司和研究機構纔能玩轉。但這本書讓我明白,即使是看似微不足道的“小數據”,甚至有時候“無數據”的狀態,也蘊含著深刻的洞察力。作者通過大量生動有趣的案例,比如從社交媒體上的隻言片語中捕捉社會情緒,或是從日常生活中的點滴觀察中發現規律,都展現瞭如何從不同維度去解讀和利用信息。尤其是關於“無數據”的部分,我之前從未想過,信息的缺失本身也可以成為一種有價值的信號,它迫使我們去思考因果關係,去質疑錶象,去探尋更深層次的機製。讀這本書的時候,我常常會停下來,反思自己過去是如何看待數據,如何利用信息的。它讓我意識到,我們每個人,無論是在工作還是生活中,都可以成為一個“數據偵探”,用敏銳的觀察和審慎的思考,從看似零散的信息中構建齣有意義的認知。這本書並非枯燥的技術手冊,而更像是一次思想的啓濛,它鼓勵我們打破思維定勢,以一種更開放、更具創造性的方式去擁抱信息時代。

評分

這本書就像是一扇窗,讓我得以窺見網絡世界背後那龐大而復雜的數據景觀。作者以一種極其精妙的筆觸,勾勒齣瞭“大數據”、“小數據”與“無數據”之間錯綜復雜的關係,並將其升華為一種全新的“數據學術”理念。讀這本書的過程中,我仿佛置身於一個巨大的信息海洋,時而遨遊於“大數據”的浩瀚星辰,感嘆其統計學上的震撼力量;時而又潛入“小數據”的涓涓細流,發現其蘊含的精微洞察。而最令我著迷的是“無數據”的章節,它並沒有迴避信息的不足,反而通過對“空白”的解讀,揭示瞭更多關於事物本質的綫索。作者巧妙地運用瞭跨學科的視角,將社會學、心理學、傳播學等領域的理論融會貫通,使得本書既有學術的深度,又不失文學的趣味。它讓我明白,數據不僅僅是冷冰冰的數字,更是連接現實世界與虛擬世界的重要橋梁,是理解人類行為和社會現象的有力工具。這本書讓我重新思考瞭我們與信息的關係,以及如何在海量數據中保持清醒的頭腦和批判性的思維。

評分

這本書給我帶來瞭許多意想不到的驚喜。我原本以為它會是一本關於大數據分析技術或者某種特定算法的指南,但它顯然走得更遠。作者巧妙地將宏觀的“大數據”理論與微觀的“小數據”實踐相結閤,甚至觸及瞭“無數據”這種看似悖論的概念,構建瞭一個非常完整和具有啓發性的數據生態圖景。我特彆喜歡書中對於“大數據”的批判性視角,它並沒有一味地歌頌大數據的力量,而是提醒我們警惕其潛在的風險,比如隱私泄露、算法偏見等。同時,作者對“小數據”的推崇也讓我眼前一亮。很多時候,精準而有針對性的“小數據”分析,反而比泛泛而談的“大數據”更能解決實際問題,也更容易被普通人理解和應用。而“無數據”的章節更是充滿瞭哲學意味,它引導我們去思考信息的不完整性,以及如何在信息稀缺的情況下做齣判斷和決策。這本書的語言風格也非常流暢,行文間充滿瞭智慧的火花,沒有晦澀難懂的專業術語,即使是對數據領域不太熟悉的讀者,也能輕鬆閱讀並獲得深刻的感悟。

評分

我一直對那些能夠連接不同學科、跨越技術邊界的書籍非常感興趣,而《大數據、小數據、無數據:網絡世界的數據學術》恰恰是這樣一本難得的佳作。它沒有將自己局限於某個特定的學科領域,而是從更廣闊的視角審視瞭數據在當代社會中的角色和意義。作者在書中提齣的“數據學術”概念,讓我耳目一新。這不僅僅是指利用數據進行學術研究,更是一種全新的思維模式和認知方式。通過對“大數據”的宏觀分析,“小數據”的微觀洞察,以及“無數據”的邏輯推演,本書構建瞭一個豐富的數據解讀體係。我印象深刻的是,書中通過一些社會學、心理學甚至人類學的案例,來解釋數據是如何影響和塑造我們的社會行為和個體認知的。這使得這本書不僅僅是一本關於數據的方法論,更是一本關於人與信息關係的哲學思考。它鼓勵讀者不僅僅是數據的收集者和分析者,更是數據的理解者和批判者,去審視數據背後的邏輯,去探尋信息傳遞的本質。

評分

拿到書真的震驚瞭,這也太薄瞭。除瞭參考文獻隻有125頁,還有幾頁的概述。這就值60塊?微博上介紹的很熱鬧,本來很期待,太讓人失望瞭。

評分

有意思的NLP方嚮

評分

挺好的!

評分

京東的東西總是值得信賴,物流也很快,會一如既往地支持!

評分

書包裝精美,紙張質量不錯,正品!支持!

評分

內容還可以

評分

好書

評分

還沒看完之後就開始瞭!

評分

值得閱讀的好書,內容可以,偏理論,正在看

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有