编辑推荐
适读人群 :科学政策分析机构、投资机构、咨询公司的管理人员、技术人员和高校相关专业师生 这是一本关于信息可视化的著作,涉及许多方面,而尤其侧重于科学知识图谱绘制。绘制科学图谱作为一个新兴领域,还处在他的婴儿阶段,还要面对许多理论和实践上的挑战。新的修订版中有很多精辟的内容,该书不仅可以作为入门者的初级读本,也可以帮助资深专家学者全面了解这一领域的**进展。
内容简介
《科学前沿图谱:知识可视化的探索(第二版)》从跨学科的视角探索了知识可视化的历史进程及其新进展。从无形学院和库恩竞争范式,到运用可视化技术绘制知识结构图谱,再到科学发展进程中的各种兴盛与衰落。通过大量色彩丰富的图片,深入浅出地将绘制科学知识图谱的原理、方法及技术娓娓道来。
作者简介
陈超美,美国德雷克赛尔大学信息科学与技术学院副教授,Information Visualization期刊主编,大连理工大学长江学者讲座教授。主要研究领域包括信息可视化、科学前沿发展模式及科学发现理论、网络分析和信息计量学等。主要著作有lnformation Visualization:Beyond the Horizon和Mapping Scientific Frontjers:The Ouest for Knowledge Visualization,开发并推广了文献可视化分析软件CiteSpace。
内页插图
目录
CONTENTS目录
译序 刘则渊
序 亨利 斯莫尔
自序 陈超美
第一章 科学知识的动态特征 1
1.1 科学前沿 2
1.1.1 竞争范式 6
1.1.2 无形学院 10
1.1.3 概念革命 11
1.1.4 追溯 17
1.2 视觉思维 20
1.2.1 格式塔理论 20
1.2.2 著名的地图 22
1.2.3 巴别塔 24
1.2.4 外层空间的信息 26
1.2.5 “这不是一个烟斗” 29
1.2.6 格式塔心理学 32
1.2.7 信息可视化与可视化分析 33
1.3 绘制科学前沿 38
1.3.1 科学图谱 39
1.3.2 竞争范式的案例 40
1.4 本书的结构 41
第二章 宇宙图谱 45
2.1 绘图学 47
2.1.1 主题图 50
2.1.2 地形图和照相绘图法 51
2.2 陆地地图 52
2.3 天体图 55
2.3.1 天体模型 55
2.3.2 星座图 60
2.3.3 宇宙图谱 63
2.4 生物图谱 74
2.4.1 DNA双螺旋结构 74
2.4.2 针灸图谱 76
2.4.3 基因组图谱 78
2.4.4 流感病毒蛋白质序列图 79
第三章 关联映射 81
3.1 关联的作用 82
3.1.1 我们可以试想 83
3.1.2 认知图的起源 84
3.1.3 信息可视化 87
3.2 结构识别 87
3.2.1 主题模型 88
3.2.2 寻径网络尺度 39
3.2.3 图像间相似性的测度 92
3.2.4 抽象结构的可视化 96
3.2.5 知识演进模式和趋势的可视化 102
3.3 降维 106
3.3.1 几何相似 106
3.3.2 多维尺度分析 107
3.3.3 个体差异分析 113
3.3.4 线性近似——等距映射 115
3.3.5 局部线性嵌入 118
3.4 概念图 119
3.4.1 卡片分类法 119
3.4.2 聚类 120
3.5 网络模型 122
3.5.1 六度分离理论 123
3.5.2 随机网络模型理论 124
3 5.3 厄多斯数 125
3.5.4 语义网络 126
3.5.5 网络可视化 127
3.6 小结 130
第四章 探寻轨迹 131
4.1 信息空间的足迹 132
4.1.1 旅行推销员问题 132
4.1.2 虚拟世界中的搜索 134
4.1.3 信息觅食 135
4.1.4 觅食过程建模 136
4.1.5 用户的轨迹 142
4.2 小结 147
第五章 科学知识的结构和动态 149
5.1 马太效应 151
5.2 词的图谱 154
5.2.1 共词图谱 154
5.2.2 包容指数和包容图谱 156
5.2.3 RISC个体发生学 157
5.3 共被引分析 159
5.3.1 文献共被引分析 160
5.3.2 作者共被引分析 167
5.4 HistCite 176
5.5 专利共被引 177
5.6 水结 179
第六章 跟踪竞争范式 183
6.1 信息科学中的领域分析 184
6.2 对胶原蛋白研究的纵向研究 186
6.3 大灭绝争论 188
6.3.1 白垩纪-第三纪界线事件 189
6.3.2 物种大灭绝 192
6.4 超大黑洞 199
6.4.1 活跃星系核范式 200
6.4.2 AGN范式的发展 201
6.5 小结 205
第七章 寻迹潜在知识领域 207
7.1 主流知识与潜在知识 209
7.2 知识发现 210
7.2.1 未被发现的公开知识 210
7.2.2 潜在知识领域的可视化 216
7.3 案例一:斯沃森的影响 218
7.4 案例二:寻径网络的影响 219
7.4.1 主流知识领域 220
7.4.2 潜在知识领域 224
7.5 案例三:疯牛病(BSE)和变异型克雅氏病(VCJD) 229
7.5.1 主流知识领域 229
7.5.2 锰-铜假说 233
7.6 小结 234
第八章 绘制科学图谱 237
8.1 系统摄动与结构变化 238
8.1.1 早期迹象 238
8.1.2 结构变化模型 241
8.1.3 结构变化指标 243
8.1.4 统计模型 247
8.1.5 复杂网络分析(1996~2004) 249
8.2 再生医学 253
8 2.1 科学计量学评论 254
8.2.2 结构与动态 256
8.2.3 系统级指标 261
8 2.4 新趋势 268
8.2.5 经验教训 271
8.3 论文撤销分析 272
8.3.1 撤销文献的研究 275
8 3.2 撤销的时间 278
8.3.3 被撤销文章的内容 279
8.3.4 自闭症和疫苗 283
8 3.5 小结 286
8.4 全域科学图谱和叠加图 286
8.4.1 科学学科图谱 287
8.4.2 跨学科和相互叠加 292
8.4.3 双图叠加 295
第九章 可视化分析 299
9.1 CiteSpace软件 300
9.2 Jigsaw软件 304
9.3 Carrot软件 307
9.4 电力网络分析 308
9.5 Action Science Explorer (iOpener)软件 309
9.6 对2002年“十大挑战”的修改 311
9.7 展望未来 316
参考文献 319
致谢 345
精彩书摘
科学图谱已经普遍采用的设计隐喻是一个抽象的景观图,即用合理的轮廓显示出虚拟的山谷和山峰。类似的景观隐喻也出现在许多早期的信息可视化设计中。这种隐喻自然是来源于探险和导航的意图,如山峰的地标是用来吸引探险家的注意。如果景观的外形与隐含景观系统的显著特征相符,那么就可以通过这些易于找到的路标来研究这个系统,使这一探索过程变成直观、有趣的航行。许多早期的信息可视化系统充分利用这样一个假设,即一个事件发生的概率越大,让用户易于找到这一事件就越发重要。相比之下,用户很少主动游览山谷,或注意那些小概率的事件。例如,主流系统常常强调高频主题,突出卓越作者,而不是那些低频者。
另一个同样引人深思的例子来自进化生物学。现在家喻户晓的达尔文自然选择论反映出适应和生存之问的深刻关系。适应度景观(illnesslandscape)的概念为广泛的有关态势感知(situationalawareness)、缺口分析(gapanalysis)、组合分析(porffolioanalysis)、发现过程(discoveryprocesses)和战略规划(strategicplanning)研究提供了直观且适应可持续的研究框架。穿越适应度景观图体现为最优化处理过程。旅行者的最终目的是移动到适应度总体最大化的一点上。适应度景观范式的巨大潜力不仅体现在生物学中,也体现在许多其他学科中。它可能帮助我们处理许多共性问题,如在某个学科背景下,我们究竟位于何处?为达到目的,要做哪些必要的移动?能否找到一条持续向前的道路?我们需要承担何种程度的短期损失才能最大限度地获得最终收益?可视化分析为解决这些问题提供了有前途的平台。
曼弗雷德·科肯(ManfredKochen)建议每个信息科学家都阅读《巴比伦以来的科学》这本书,因为它建立了信息科学的范式基础(Kochen,1984)。社会学家罗伯特·默顿(RobertMerton)和信息科学家加菲尔德认为《科学文献网络》一书是普赖斯对信息科学的最大贡献,此书中首次提出的科学出版物的引文使用法,为后来关于科学内容与研究前沿周期的研究奠定了基础。普赖斯首先提出引文分析可以获取科学文献发展的概念图,尤为重要的是,它还可以绘制科学前沿的主题图谱。这种科学文献的拓扑图可以在显示图形位置的同时综合提供相关的期刊、作者及文献信息。
一代又一代的信息科学家和大部分的科学工作者都深受哲学和科学史的影响,尤其是库恩(ThomasKuhn,1922~1996)的科学革命结构理论(Kuhn,l962)、保罗·萨加德(PaulThagard)的概念革命(conceotualrevolution)理论(Thazard,1992),以及克兰的无形学院理论(crane,1972)。追踪科学范式的研究也不例外。美国科学信息研究所([nstituteforScientificInformation,ISI)的加菲尔德和斯莫尔通过引文分析绘制了科学图谱。米歇尔·卡隆(MichelCallow)和他的同事用共词分析追踪科学文献的变化。实际上,共词分析应用非常广泛,可以应用于包括技术报告、演讲笔录、资助申请等科学记录,以及学术期刊论文和会议论文。关于这些记录的具体分析将在后面的章节中提及。当前,新的研究趋势更倾向于科学前沿的动态研究:长时间内科学争论的焦点到底是什么?主流理论都涉及什么知识?究竟如何将范式转移可视化?竞争范式是如何在科学前沿的内容中兴起和衰落的?科学前沿动态可视化的最佳方式是什么?
在以科学整体作为研究对象的复兴研究趋势中,科学前沿的可视化领域经历着前所未有的变革。用科学来研究科学,我们需要了解科学活动的本质、科学的哲学屙陛和社会屙陛。本书将从科学界所谓的视觉主义(Visualism)开始讲起,视觉主义认为,当代科学家每天所做的工作,实际上就是绘图、解读和说明(Ihde.1998)。我们可以使用什么样的隐喻来描述科学前沿可视化呢?我们从自然界中的天体和地理现象入手,到概念图的绘制和科学文献的知识结构分析,再到科学前沿的静态“快照”和历时性动态特征图来探讨知识域可视化的问题。
科学知识增长有三种简单的模式。第一种是最常见的累积性增长模式,即指新知识是按旧知识逻辑递进的方式增长。第二种模式是指新的理论假设,经过与传统理论的较量,或被接受或被证伪,不存在模棱两可的证明,因此结果会被科学家们接受。大部分科学本质模型的讨论都基于这种模式。第三种模式是指新的科学理论不是源于近期的科学发展,而是得到科学历史进程中某一阶段理论的启发。这种模式,是整个文化历史领域的随机性选择。普赖斯指出,这种非结构性的增长具有人文科学的特点。
三种模式进行比较,第一种模式强调了持续性累积增长;第二种不具备这种累积性;第三种模式既包含阶段性的累积增长又包含阶段性的跳跃增长。最著名的代表就是库恩的科学革命结构理论。在该理论中,阶段性累积模式是常规科学,而累积增长的间断则被视为是科学危机或革命。
……
前言/序言
科学前沿图谱:知识可视化的探索(第二版) 一部揭示知识脉络、洞察科学演进的视觉盛宴 在信息爆炸的时代,浩如烟海的科学文献如同无垠的宇宙,蕴藏着无尽的智慧与奥秘。然而,如何从中找到我们所需的星辰,理解学科间的千丝万缕,洞悉前沿领域的瞬息万变,却成了一项极具挑战的任务。《科学前沿图谱:知识可视化的探索(第二版)》正是应此而生,它不仅仅是一本书,更是一扇通往科学知识可视化世界的窗户,一次深入探索信息结构、发现知识规律的非凡旅程。 相较于初版的惊艳亮相,《科学前沿图谱》第二版在内容深度、广度以及可视化技术的应用上都进行了全面升级。本书以严谨的学术态度,结合前沿的计算科学与信息艺术,为读者呈现了一幅幅精妙绝伦的科学知识图谱。这些图谱并非简单的图表堆砌,而是通过对海量科研数据的挖掘、分析与重构,将抽象的知识具象化,让读者能够直观地感知科学研究的动态、关联与演进。 一、 知识的脉络:看见科学的生长轨迹 本书的核心魅力在于其对“知识可视化”这一前沿领域的深刻剖析。它跳出了传统的文献检索与阅读模式,将科学知识的生成、传播与演变过程,转化为一幅幅动态、多维度的视觉图景。想象一下,你不再需要大海捞针般地翻阅成千上万篇论文,而是能通过一张张精美的地图,清晰地看到某个学科是如何从萌芽走向繁荣,哪些研究方向是当前的热点,哪些领域的研究者正在进行着突破性的探索。 《科学前沿图谱》第二版深入浅出地阐述了构建这些知识图谱的底层逻辑与关键技术。读者将了解到,这些图谱是如何基于文献的引用关系、作者的合作网络、概念的语义关联等多种数据维度构建而成。书中详尽介绍了图谱的生成原理,包括但不限于: 引文网络分析: 通过分析文献之间的引用关系,揭示研究的传承与发展脉络,识别开创性工作与后续关键性研究。读者可以清晰地看到,一篇 seminal work(开创性著作)是如何被后续研究者反复引用,形成一个不断扩展的研究领域。 合作网络分析: 揭示科研人员之间的合作模式,洞察不同研究团队的优势互补与协同创新。这有助于理解跨学科研究的形成机制,以及不同机构在推动科学进步中的作用。 概念与主题挖掘: 利用自然语言处理与机器学习技术,从海量文本中提取核心概念、主题标签,并揭示它们之间的关联强度与演变趋势。这使得读者能够掌握一个学科的核心议题,以及研究热点的转移方向。 时间序列分析: 将知识的演进过程置于时间轴上进行可视化,展现学科的兴衰起伏,预测未来的发展趋势。读者将能直观地看到,哪些概念在历史长河中逐渐被遗忘,哪些新的思想正在迅速崛起。 本书通过大量的实际案例,生动地展示了这些可视化方法在不同科学领域中的应用。从物理学、化学、生物学等基础学科,到计算机科学、人工智能、医学等应用学科,再到社会科学、经济学等交叉领域,每一张图谱都讲述着一个引人入胜的科学故事。读者将有机会“看见”量子力学的诞生与发展,感受基因组学研究的爆发式增长,洞悉人工智能技术的迭代演进,甚至理解全球经济一体化的复杂网络。 二、 探索的工具:开启洞察的智慧之门 《科学前沿图谱》不仅仅是对知识可视化成果的展示,更是一本教授读者如何运用这些工具进行深度探索的指南。本书强调,知识可视化并非终点,而是开启深度洞察的起点。通过掌握这些可视化方法,读者将具备一种全新的科研思维模式。 本书为读者提供了多维度、多层次的探索视角: 宏观视角: 读者可以借助学科全景图,快速了解一个领域的整体研究格局,识别出主要的子领域、研究热点以及潜在的未被充分探索的区域。这对于初入某个研究领域的研究者而言,如同获得了一张精准的导航图,能够迅速定位自己的研究方向。 中观视角: 通过对特定主题或研究方向的图谱进行细致分析,读者可以深入理解该方向的研究现状、主要参与者、关键文献以及研究瓶颈。这有助于研究者发现研究空白,避免重复劳动,并找到潜在的合作机会。 微观视角: 针对具体的科研文献或研究成果,本书展示了如何通过引用关系、合作者网络等信息,深入挖掘其研究价值与潜在影响。这对于评估一篇论文的重要性,或是理解某个研究团队的创新能力,都具有极大的参考意义。 第二版更是增加了许多互动性的可视化案例,甚至引导读者思考如何运用这些工具进行自己的研究。书中可能包含一些关于如何使用开源可视化工具(如 Gephi、Cytoscape 等)生成简单图谱的入门介绍,或是提供一些案例研究,展示科学家如何利用可视化工具发现新的研究思路,或是解决复杂的科学难题。 三、 前沿的脉动:感受科学的生命力 本书最令人兴奋之处在于,它能够让读者感受到科学研究的“生命力”。科学并非 static(静态)的知识集合,而是一个充满活力、不断演进的动态过程。《科学前沿图谱》通过可视化手段,将这种动态过程呈现在读者眼前。 读者将能够: 追踪新兴领域: 识别那些正在快速兴起的新兴研究领域,了解它们的核心概念、代表性研究与未来发展方向。这对于投资科研、选择毕业课题、或是把握行业发展趋势,都具有重要的指导意义。 理解学科交叉: 揭示不同学科之间的联系与融合,展现跨学科研究的创新潜力。例如,通过可视化,读者可以清晰地看到,生物信息学是如何将生命科学与计算机科学相结合,催生出全新的研究范式。 预测未来趋势: 基于对历史数据与当前研究热点的分析,本书会提供一些对未来科学发展趋势的预测。这并非是简单的猜测,而是基于数据驱动的科学分析,为读者提供前瞻性的洞察。 认识关键人物与机构: 通过可视化分析,读者可以识别出在各个研究领域做出杰出贡献的科学家、研究团队以及顶尖的研究机构。这有助于建立对科学界生态的认知,并了解哪些“大脑”正在驱动着科学的进步。 四、 视觉的盛宴:智慧与艺术的融合 《科学前沿图谱》第二版在视觉设计上也达到了新的高度。每一张图谱都经过精心设计,力求在信息量与美学之间取得最佳平衡。本书采用了多种色彩、节点大小、连线粗细等视觉元素,将复杂的科学信息以直观、易懂的方式呈现。 这些图谱本身就是艺术品,它们将抽象的科学概念转化为具象的视觉语言,让科学探索过程变得更加引人入胜。书中可能包含大量精美的全彩图谱,每一张图都值得细细品味。作者在图谱设计上的用心,不仅是为了传达信息,更是为了激发读者的好奇心与探索欲。 五、 目标读者:为何这本书值得您拥有? 《科学前沿图谱:知识可视化的探索(第二版)》面向广泛的读者群体: 科研人员: 无论是经验丰富的学者,还是初涉科研的研究生,都能从中获得新的研究思路、优化研究方向、发现潜在的合作者,并更有效地掌握领域内的最新进展。 学生: 希望深入了解某一学科的研究现状与发展趋势的学生,可以通过本书直观地构建学科知识体系,为未来的学术生涯打下坚实基础。 政策制定者与科研管理者: 需要宏观把握科研全局、评估科研投资方向、优化资源配置的决策者,将从本书提供的可视化洞察中获益匪浅。 对科学发展充满好奇心的公众: 任何对科学知识的演进、学科间的联系以及未来的科技趋势感兴趣的读者,都将在这本书中找到激发思考的火花。 总而言之,《科学前沿图谱:知识可视化的探索(第二版)》是一部集学术严谨性、技术前沿性、艺术表现力与实用指导性于一体的重量级著作。它不仅是科研工作者必备的参考工具,更是每一位渴望理解科学世界、洞察未来趋势的读者不可错过的精神食粮。翻开这本书,您将开启一段前所未有的科学探索之旅,看见知识的脉络,感受科学的脉动,并最终找到属于您的那片知识星空。