计算语言学与语言科技原文丛书·本体与词汇库:自然语言处理角度的解析(英文影印版) [Ontology and the Lexicon: a Natural Lan-Guage Processing Perspective]

计算语言学与语言科技原文丛书·本体与词汇库:自然语言处理角度的解析(英文影印版) [Ontology and the Lexicon: a Natural Lan-Guage Processing Perspective] pdf epub mobi txt 电子书 下载 2025

典居仁(Chu-Ren Huang),[意] Nicoletta Calzolari,[意] Aldo Gangemi 等 编
图书标签:
  • 计算语言学
  • 自然语言处理
  • 本体
  • 词汇库
  • 语言科技
  • 英文影印版
  • NLP
  • 知识表示
  • 语义分析
  • 信息抽取
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 北京大学出版社
ISBN:9787301249543
版次:1
商品编码:11622292
包装:平装
丛书名: 计算语言学与语言科技原文丛书
外文名称:Ontology and the Lexicon: a Natural Lan-Guage Processing Perspective
开本:16开
出版时间:2014-12-01###

具体描述

编辑推荐

  《本体与词汇库:自然语言处理角度的解析(英文影印版)》关注如何整合词典资源和语义手段,内容涵盖理论和实践两个方面的研究成果,适用于对自然语言处理、计算语言学、心理语言学等感兴趣的研究者。

内容简介

  《计算语言学与语言科技原文丛书·本体与词汇库:自然语言处理角度的解析(英文影印版)》是全面论述本体知识库、词汇库以及两者界面建构的第1本专著,内容涵盖理论和实践两个方面的研究成果,对研究语言语义学、计算语言学和通过自然语言处理进行知识挖据以及本体建构的研究人员有重要参考价值。

作者简介

  Chu-Ren Huang,香港理工大学教授,文学院院长。

内页插图

目录

导读
Contributors
Preface
Part Ⅰ Fundamental aspects
1 Ontology and the lexicon: a multidisciplinary perspective
1.1 Situating ontologies and lexical resources
1.2 The content of ontologies
1.3 Theoretical framework for the ontologies/lexicons interface
1.4 From ontologies to the lexicon and back
1.5 Outline of chapters
2 Formal ontology as interlingua: the SUMO and WordNet linking project and global WordNet
2.1 WordNet
2.2 Principles of construction of formal ontologies and lexicons
2.3 Mappings
2.4 Interpreting language
2.5 Global WordNet
2.6 SUMO translation templates
3 Interfacing WordNet with DOLCE: towards OntoWordNet
3.1 Introduction
3.2 WordNet's preliminary analysis
3.3 The DOLCE upper ontology
3.4 Mapping WordNet into DOLCE
3.5 Conclusion
4 Reasoning over natural language text by means of FrameNet and ontologies
4.1 Introduction
4.2 An introduction to the FrameNet lexicon
4.3 Linking FrameNet to ontologies for reasoning
4.4 Formalizing FrameNet in OWL DL
4.5 Reasoning over FrameNet-annotated text
4.6 Linking FrameNet to SUMO
4.7 Discussion
4.8 Conclusion and outlook
5 Synergizing ontologies and the lexicon: a roadmap
5.1 Formal mappings between ontologies
5.2 Evaluation of ontolex resources
5.3 Bridging different lexical models and resources
5.4 Technological framework

Part Ⅱ Discovery and representation of conceptual systems
6 Experiments of ontology construction with Formal Concept Analysis
6.1 Introduction
6.2 Basic concepts and related work
6.3 Dataset selection and design of experiments
6.4 Evaluation and discussion
6.5 Conclusion and future work
7 Ontology, lexicon, and fact repository as leveraged to interpret events of change
7.1 Introduction
7.2 A snapshot of OntoSem
7.3 Motivation for pursuing deep analysis of events of change
7.4 Increase
7.5 Content divorced from its rendering
7.6 NLP with reasoning and for reasoning
7.7 Conclusion
8 Hantology: conceptual system discovery based on orthographic convention
8.1 Introduction: hanzi and conventionalized
conceptualization
8.2 General framework
8.3 Conceptualization and classification of the radicals system
8.4 The ontology of a radical as a semantic symbol
8.5 The architecture of Hantology
8.6 OWL encoding of Hantology
8.7 Summary
8.8 Conclusion
9 What's in a schema?
9.1 Introduction
9.2 An ontology for cognitive linguistics
9.3 The c.DnS ontology
9.4 Schemata, mental spaces, and constructions
9.5 An embodied semiotic metamodel
9.6 Applying Semion to FrameNet and related resources
9.7 Conclusion

Part Ⅲ Interfacing ontologies and lexical resources
10 Interfacing ontologies and lexical resources
10.1 Introduction
10.2 Classifying experiments in ontologies and lexical resources
10.3 Ontologies and their construction
10.4 How actual resources fit the classification
10.5 Two practical examples
10.6 Available tools for the ontology lexical resource interface
10.7 Conclusion
11 Sinica BOW (Bilingual Ontological WordNet):integration of bilingual WordNet and SUMO
11.1 Background and motivation
11.2 Resources and structure required in the BOW approach
11.3 Interfacing multiple resources: a lexicon-driven approach
11.4 Integration of multiple knowledge sources
11.5 Updating and future improvements
11.6 Conclusion
12 Ontology-based semantic lexicons:mapping between terms and object descriptions
12.1 Introduction
12.2 Why we need semantic lexicons
12.3 More semantics than we need
12.4 The semantics we need is in ontologies
12.5 Conclusion
13 Merging global and specialized linguistic ontologies
13.1 Introduction
13.2 Linguistic ontologies versus formal ontologies
13.3 Specialized linguistic ontologies
13.4 The plug-in approach
13.5 Experiments
13.6 Applications and extensions
13.7 Conclusion

Part Ⅳ Learning and using ontological knowledge
14 The life cycle of knowledge
14.1 Introduction
14.2 Using ontolexical knowledge in NLP
14.3 Creating ontolexical knowledge with NLP
14.4 Conclusion
15 The Omega ontology
15.1 Introduction
15.2 Constituents of Omega
15.3 Structure of Omega
15.4 Construction of Omega via merging
15.5 Omega's auxiliary knowledge sources
15.6 Applications
15.7 Omega 5 and the OntoNotes project
15.8 Discussion and future work
15.9 Conclusion
16 Automatic acquisition of lexico-semantic knowledge for question answering
16.1 Introduction
16.2 Lexico-semantic knowledge for QA
16.3 Related work
16.4 Extracting semantically similar words
16.5 Using automatically acquired role and function words
16.6 Using automatically acquired categorized NEs
16.7 Evaluation
16.8 Conclusion and future work
17 Agricultural ontology construction and maintenance in Thai
17.1 Introduction
17.2 A framework of ontology construction and maintenance
17.3 Ontology acquisition from texts
17.4 Ontology acquisitions from a dictionary and a thesaurus
17.5 Integration into an ontological tree
17.6 Conclusion
References
Index

前言/序言



《本体与词汇库:自然语言处理视角下的解析》 自然语言处理(NLP)的基石:深入理解语言的结构与意义 《本体与词汇库:自然语言处理视角下的解析》一书,精选并汇集了本体论和词汇库研究领域中具有里程碑意义的经典论文。本书以自然语言处理(NLP)为核心视角,系统地梳理了这两个关键概念在NLP发展中的重要作用、演进历程以及它们如何共同构成了理解和处理人类语言的坚实基础。本书不仅为NLP领域的学者和研究人员提供了宝贵的学术参考,也为对人工智能、计算语言学以及语言信息处理感兴趣的读者打开了一扇深入探索的窗口。 本体论:知识的组织与推理 本体论(Ontology)在人工智能和信息科学领域,指的是对现实世界概念及其相互关系的正式、显式的建模。它不仅仅是词汇的集合,更是一种描述概念、属性、关系和规则的框架,旨在实现知识的共享和重用。在自然语言处理中,本体论扮演着至关重要的角色,它为机器理解文本的深层含义提供了结构化的知识支撑。 本书对本体论在NLP中的应用进行了详尽的剖析。它首先从本体论的理论基础出发,介绍了不同流派的本体构建思想,包括逻辑基础、语义网以及知识图谱等。读者将了解到,本体的构建需要对特定领域的概念进行细致的划分、定义以及它们之间关系的明确描述,例如“is-a”关系(继承)、“part-of”关系(组成)以及各种属性关系等。 接着,本书深入探讨了本体在NLP任务中的实际应用。例如,在信息抽取(Information Extraction)任务中,本体可以指导机器识别文本中的实体(如人名、地名、组织机构)及其属性,并将这些信息按照本体定义的结构进行组织。在问答系统(Question Answering)中,本体能够帮助系统理解用户问题的语义,并从知识库中检索相关的答案。在文本分类(Text Classification)和情感分析(Sentiment Analysis)等任务中,本体可以提供领域特定的词汇和概念,从而提高模型的准确性和鲁棒性。 此外,本书还讨论了本体构建的挑战和方法。包括手工构建的优点和局限性,以及自动化或半自动化的本体学习(Ontology Learning)技术。这些技术利用机器学习和自然语言处理的方法,从大规模文本数据中自动提取概念、关系和属性,从而加速本体的构建过程,并使其能够适应不断变化的知识领域。本书通过精选的论文,展示了本体在不同NLP应用中的创新实践,以及研究人员如何克服本体构建中的复杂性,使其在实际系统中发挥作用。 词汇库:语言的原子单位与语义网络 词汇库(Lexicon),在自然语言处理的语境下,远不止是一个简单的单词列表。它包含了词汇的形态信息、句法信息、语义信息以及词语之间的各种关系。一个丰富的、结构化的词汇库是NLP系统进行语言理解和生成的关键资源。 本书对词汇库在NLP中的功能和构建进行了全面的介绍。它首先阐述了词汇库的多层面信息: 形态学信息: 包括词的词性(名词、动词、形容词等)、单复数、时态、语态等。 句法信息: 词语在句子中的搭配方式、语法功能以及与其他词语的组合规则。 语义信息: 词语的含义、同义词、反义词、多义词的解释,以及词语在不同语境下的语义变化。 词汇关系: 如上位词(hypernyms)、下位词(hyponyms)、同义词(synonyms)、反义词(antonyms)、部分-整体关系(meronymy)等。 本书重点介绍了词汇库如何支撑NLP的各项任务。例如,在词性标注(Part-of-Speech Tagging)任务中,词汇库提供了词语的可能词性信息,帮助模型做出准确的判断。在命名实体识别(Named Entity Recognition)中,词汇库可以包含预定义的实体列表,加速识别过程。在语义角色标注(Semantic Role Labeling)中,词汇库可以提供动词的语义参数,帮助识别句子中谓语动词的施事者、受事者等。 更重要的是,本书深入探讨了词汇库的构建方法。它介绍了传统的词典式构建方式,以及基于大规模语料库的统计学习方法。读者将了解到,如何利用共现统计、词向量(Word Embeddings)等技术,从海量文本中挖掘词语之间的语义关联,构建动态的、可扩展的词汇资源。本书精选的论文展示了不同类型词汇库的构建实例,包括通用词汇库、领域特定词汇库以及情感词汇库等,并分析了它们在不同NLP应用中的有效性。 本体与词汇库的协同:构建强大的语言理解系统 《本体与词汇库:自然语言处理视角下的解析》一书最核心的贡献在于,它强调了本体和词汇库并非孤立的概念,而是相互依存、协同工作的。本体提供了概念的框架和关系的结构,而词汇库则填充了具体的词语及其语义细节。 本书通过一系列精选论文,展示了本体和词汇库如何有机地结合,为NLP系统提供更深层次的语言理解能力。例如: 本体驱动的词汇扩展: 当一个本体定义了一个新的概念时,可以利用词汇库中的现有词语以及其语义关系,来为新概念寻找合适的表达方式,或者为现有词语赋予新的本体角色。 词汇库支持的本体构建: 现有的词汇库可以作为构建本体的起点。通过分析词汇库中词语之间的语义关系,可以逐步推导出本体中的概念层级和关系类型。 语义搜索与推理: 当用户进行搜索时,本体能够提供搜索词背后的深层含义和相关概念,而词汇库则能够识别搜索词的各种表达方式,从而实现更精准、更全面的语义搜索。在问答系统中,本体和词汇库的结合能够让机器理解复杂问题,并进行逻辑推理,找到非直接的答案。 语境感知与消歧: 词语的含义往往依赖于语境。本体可以提供一个词语可能出现的语境信息,而词汇库则能够列出该词语在不同语境下的不同含义,从而实现词义消歧(Word Sense Disambiguation)。 知识图谱的构建与应用: 现代的知识图谱(Knowledge Graph)是本体和词汇库结合的典范。本体定义了知识图谱的模式(Schema),即实体类型、属性和关系类型,而词汇库则提供了构成知识图谱中节点的具体词语及其语义信息。本书中的论文展示了如何利用本体和词汇库构建和丰富知识图谱,并将其应用于各种NLP任务,如信息检索、智能推荐、以及对话系统等。 本书的价值与意义 《本体与词汇库:自然语言处理视角下的解析》一书的价值体现在其系统性、前沿性和实践性。它不仅汇集了该领域中最具代表性的研究成果,更从NLP的实用角度出发,深入浅出地阐释了本体和词汇库的重要性。 对于NLP的研究者而言,本书提供了丰富的理论框架和实证案例,可以启发新的研究思路,并在实际项目中加以应用。对于从事人工智能、信息科学、语言学等相关领域的学者和工程师来说,本书也是不可多得的参考资料,有助于他们理解语言处理的底层逻辑和关键技术。 随着人工智能技术的飞速发展,语言理解能力正成为衡量人工智能水平的重要标准。本体和词汇库作为理解语言的关键要素,其重要性日益凸显。本书的出版,为推动NLP技术的发展,特别是为构建更智能、更人性化的语言处理系统,提供了坚实的理论支撑和实践指导。它以一种严谨而清晰的方式,揭示了构成语言智能的深层结构,为我们理解和驾驭语言的奥秘打开了新的大门。 本书的英文影印版,忠实地保留了原文的精髓,为读者提供了直接接触前沿学术成果的机会,使其能够更深刻地理解这些基础概念的演进和发展。无论您是希望深入了解自然语言处理的核心技术,还是对如何让机器真正理解人类语言充满好奇,本书都将是您不可或缺的指引。

用户评价

评分

作为一名侧重于人机交互(HCI)和可用性研究的学者,我更关注的是如何让复杂的计算语言学成果转化为用户友好的界面和功能。这本书恰好从“词汇库”这一用户直接接触的层面提供了深刻的洞察。我们常说用户界面要符合用户的“心智模型”,而这本书则探讨了机器的“心智模型”——即本体是如何构建和映射的。书中关于词汇层级结构对自然语言生成(NLG)质量影响的案例分析,让我耳目一新。它展示了当机器在生成长篇文本时,如果底层知识库的本体结构不清晰,很容易导致逻辑跳跃或主题不连贯。这种分析方式超越了单纯的BLEU分数或ROUGE指标,进入了对生成文本“语义连贯性”的深层评估。此外,对于多模态信息融合背景下的词汇表征问题,本书也给出了早期的、具有前瞻性的讨论,尽管当时的技术条件不如现在,但其提出的原则性指导思想依然适用。这本书的价值在于,它提供了一个超越单一算法的视角,去审视整个语言科技系统的健壮性。

评分

拿到这本书时,我最直观的感受是它的知识密度非常高,对于初学者来说可能需要多次阅读才能完全消化。它的英文原版风格保留得非常纯粹,行文流畅但逻辑链条紧密,几乎没有冗余的修饰性语句。我关注的重点在于它对“词汇库”这一概念的重新定义。在当前深度学习主导的时代,很多人倾向于认为词嵌入(Word Embeddings)已经完全取代了传统词典和本体的职能。然而,本书坚定地站在了另一种立场上,详细论证了在需要高度可解释性、跨语言迁移或处理低资源语种时,明确的结构化词汇知识的不可替代性。书中对于词义消歧(WSD)中如何利用本体层级结构来指导消歧过程的论述,简直是教科书级别的范例。我尤其欣赏其对“本体冲突解决”这一实际工程难题的深入剖析,这通常是理论书籍中容易被一笔带过的内容。它不仅指出了问题,还细致地对比了不同自动化对齐策略的优缺点和适用条件,这对于正在搭建大规模知识库的团队来说,是直接可操作的指导。整体而言,它迫使读者重新审视那些被“黑箱”模型掩盖的知识结构问题。

评分

这本《计算语言学与语言科技原文丛书·本体与词汇库:自然语言处理角度的解析》的英文影印版,从一个跨学科学习者的角度来看,确实提供了一个非常扎实的基础框架。我特别欣赏它在阐述复杂概念时所展现出的那种严谨性。书中对于“本体论”在现代NLP中所扮演角色的探讨,远非停留在表面描述,而是深入挖掘了其背后的哲学根源以及在知识表示层面的技术挑战。举例来说,它对不同本体构建范式(如自上而下与自下而上)的对比分析,即便对于一个已有数年NLP经验的从业者而言,也能提供新的审视视角。作者似乎非常注重理论与实践的平衡,每一次概念的引入,都能迅速对应到具体的技术应用场景,比如语义搜索或信息抽取中的具体操作流程。这种叙事方式,使得原本可能枯燥的理论部分变得生动起来,读者能够清晰地看到,一个精心设计的词汇库或知识图谱,是如何直接影响最终模型性能的。此外,本书在对经典文献的引用和整合上也做得非常到位,它不是简单地罗列,而是将不同学派的观点巧妙地编织在一起,形成一个连贯的知识网络。对于希望系统性掌握NLP底层知识,而不仅仅停留在调用API层面的读者来说,这本书无疑是一份极具价值的案头参考。

评分

这本书的阅读过程更像是一次精妙的“考古挖掘”。它没有追逐最新的技术热点,而是沉下心来,深挖了计算语言学数十年发展中那些被时间冲刷但依然坚固的理论基石。我最欣赏的是作者对“词汇库维护”的现实问题的坦诚。在实际部署中,本体的更新和知识的消亡是不可避免的,书中对增量本体学习和知识库的持续演化提出了切实可行的框架,这在很多主流教材中是被轻描淡写带过的。它不仅关注“如何构建”,更关注“如何持续地保持其有效性”。对于我这种长期致力于将学术研究转化为企业级产品的人来说,关于“本体冲突消解”和“知识产权与许可协议在词汇库共享中的影响”等章节,提供了宝贵的工程伦理和法律视角的参考。总的来说,这本书的价值不在于教你最新的技巧,而在于为你提供一个稳固的、能够抵御未来技术迭代冲击的理论地基,让每一个NLP从业者都能理解自己正在使用的工具链的深层逻辑,而不是仅仅停留在表面的操作层面。

评分

这本书的排版和装帧虽然是影印版,但阅读体验尚可,不过内容的广度让我有些意外。我原本以为它会集中在某一两个特定领域,比如知识图谱的构建。但实际上,它的覆盖面更像是一部“计算语义学”的缩影。从早期的符号主义方法论,到与统计学习方法结合的过渡阶段,再到现代的神经符号混合模型,作者似乎想通过这本书,为读者构建一个完整的历史地图。对于那些想了解ACL/EMNLP等顶级会议中,最新研究成果背后的理论基石的读者来说,这本书提供了必要的历史纵深感。比如,它对“概念漂移”(Concept Drift)在本体维护中的讨论,将语言的动态变化与静态知识表示的矛盾进行了深刻的剖析。我花了大量时间去理解其中关于“本体约束的语言模型训练”的章节,那里的数学推导虽然略显晦涩,但一旦理解,就能明白为什么有些结合了外部知识的模型,在特定推理任务上表现得比纯粹的大型语言模型更为稳定和可靠。这不仅仅是一本技术书,更像是一部关于“知识如何被机器理解和表示”的哲学思辨录。

评分

书还是挺不错的,趁着特价买的,就是英文的看着应该比较费劲!

评分

还行吧,封面有点脏,感觉像摩擦过

评分

内容深度有限

评分

学习中,书还不错,很有用

评分

学习中,书还不错,很有用

评分

看清楚再买,是英文的

评分

还没有仔细看,日后再说吧

评分

Good!

评分

专业性比较强的一本书,内容丰富,讲解清楚。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有