编辑推荐
《本体与词汇库:自然语言处理角度的解析(英文影印版)》关注如何整合词典资源和语义手段,内容涵盖理论和实践两个方面的研究成果,适用于对自然语言处理、计算语言学、心理语言学等感兴趣的研究者。
内容简介
《计算语言学与语言科技原文丛书·本体与词汇库:自然语言处理角度的解析(英文影印版)》是全面论述本体知识库、词汇库以及两者界面建构的第1本专著,内容涵盖理论和实践两个方面的研究成果,对研究语言语义学、计算语言学和通过自然语言处理进行知识挖据以及本体建构的研究人员有重要参考价值。
作者简介
Chu-Ren Huang,香港理工大学教授,文学院院长。
内页插图
目录
导读
Contributors
Preface
Part Ⅰ Fundamental aspects
1 Ontology and the lexicon: a multidisciplinary perspective
1.1 Situating ontologies and lexical resources
1.2 The content of ontologies
1.3 Theoretical framework for the ontologies/lexicons interface
1.4 From ontologies to the lexicon and back
1.5 Outline of chapters
2 Formal ontology as interlingua: the SUMO and WordNet linking project and global WordNet
2.1 WordNet
2.2 Principles of construction of formal ontologies and lexicons
2.3 Mappings
2.4 Interpreting language
2.5 Global WordNet
2.6 SUMO translation templates
3 Interfacing WordNet with DOLCE: towards OntoWordNet
3.1 Introduction
3.2 WordNet's preliminary analysis
3.3 The DOLCE upper ontology
3.4 Mapping WordNet into DOLCE
3.5 Conclusion
4 Reasoning over natural language text by means of FrameNet and ontologies
4.1 Introduction
4.2 An introduction to the FrameNet lexicon
4.3 Linking FrameNet to ontologies for reasoning
4.4 Formalizing FrameNet in OWL DL
4.5 Reasoning over FrameNet-annotated text
4.6 Linking FrameNet to SUMO
4.7 Discussion
4.8 Conclusion and outlook
5 Synergizing ontologies and the lexicon: a roadmap
5.1 Formal mappings between ontologies
5.2 Evaluation of ontolex resources
5.3 Bridging different lexical models and resources
5.4 Technological framework
Part Ⅱ Discovery and representation of conceptual systems
6 Experiments of ontology construction with Formal Concept Analysis
6.1 Introduction
6.2 Basic concepts and related work
6.3 Dataset selection and design of experiments
6.4 Evaluation and discussion
6.5 Conclusion and future work
7 Ontology, lexicon, and fact repository as leveraged to interpret events of change
7.1 Introduction
7.2 A snapshot of OntoSem
7.3 Motivation for pursuing deep analysis of events of change
7.4 Increase
7.5 Content divorced from its rendering
7.6 NLP with reasoning and for reasoning
7.7 Conclusion
8 Hantology: conceptual system discovery based on orthographic convention
8.1 Introduction: hanzi and conventionalized
conceptualization
8.2 General framework
8.3 Conceptualization and classification of the radicals system
8.4 The ontology of a radical as a semantic symbol
8.5 The architecture of Hantology
8.6 OWL encoding of Hantology
8.7 Summary
8.8 Conclusion
9 What's in a schema?
9.1 Introduction
9.2 An ontology for cognitive linguistics
9.3 The c.DnS ontology
9.4 Schemata, mental spaces, and constructions
9.5 An embodied semiotic metamodel
9.6 Applying Semion to FrameNet and related resources
9.7 Conclusion
Part Ⅲ Interfacing ontologies and lexical resources
10 Interfacing ontologies and lexical resources
10.1 Introduction
10.2 Classifying experiments in ontologies and lexical resources
10.3 Ontologies and their construction
10.4 How actual resources fit the classification
10.5 Two practical examples
10.6 Available tools for the ontology lexical resource interface
10.7 Conclusion
11 Sinica BOW (Bilingual Ontological WordNet):integration of bilingual WordNet and SUMO
11.1 Background and motivation
11.2 Resources and structure required in the BOW approach
11.3 Interfacing multiple resources: a lexicon-driven approach
11.4 Integration of multiple knowledge sources
11.5 Updating and future improvements
11.6 Conclusion
12 Ontology-based semantic lexicons:mapping between terms and object descriptions
12.1 Introduction
12.2 Why we need semantic lexicons
12.3 More semantics than we need
12.4 The semantics we need is in ontologies
12.5 Conclusion
13 Merging global and specialized linguistic ontologies
13.1 Introduction
13.2 Linguistic ontologies versus formal ontologies
13.3 Specialized linguistic ontologies
13.4 The plug-in approach
13.5 Experiments
13.6 Applications and extensions
13.7 Conclusion
Part Ⅳ Learning and using ontological knowledge
14 The life cycle of knowledge
14.1 Introduction
14.2 Using ontolexical knowledge in NLP
14.3 Creating ontolexical knowledge with NLP
14.4 Conclusion
15 The Omega ontology
15.1 Introduction
15.2 Constituents of Omega
15.3 Structure of Omega
15.4 Construction of Omega via merging
15.5 Omega's auxiliary knowledge sources
15.6 Applications
15.7 Omega 5 and the OntoNotes project
15.8 Discussion and future work
15.9 Conclusion
16 Automatic acquisition of lexico-semantic knowledge for question answering
16.1 Introduction
16.2 Lexico-semantic knowledge for QA
16.3 Related work
16.4 Extracting semantically similar words
16.5 Using automatically acquired role and function words
16.6 Using automatically acquired categorized NEs
16.7 Evaluation
16.8 Conclusion and future work
17 Agricultural ontology construction and maintenance in Thai
17.1 Introduction
17.2 A framework of ontology construction and maintenance
17.3 Ontology acquisition from texts
17.4 Ontology acquisitions from a dictionary and a thesaurus
17.5 Integration into an ontological tree
17.6 Conclusion
References
Index
前言/序言
《本体与词汇库:自然语言处理视角下的解析》 自然语言处理(NLP)的基石:深入理解语言的结构与意义 《本体与词汇库:自然语言处理视角下的解析》一书,精选并汇集了本体论和词汇库研究领域中具有里程碑意义的经典论文。本书以自然语言处理(NLP)为核心视角,系统地梳理了这两个关键概念在NLP发展中的重要作用、演进历程以及它们如何共同构成了理解和处理人类语言的坚实基础。本书不仅为NLP领域的学者和研究人员提供了宝贵的学术参考,也为对人工智能、计算语言学以及语言信息处理感兴趣的读者打开了一扇深入探索的窗口。 本体论:知识的组织与推理 本体论(Ontology)在人工智能和信息科学领域,指的是对现实世界概念及其相互关系的正式、显式的建模。它不仅仅是词汇的集合,更是一种描述概念、属性、关系和规则的框架,旨在实现知识的共享和重用。在自然语言处理中,本体论扮演着至关重要的角色,它为机器理解文本的深层含义提供了结构化的知识支撑。 本书对本体论在NLP中的应用进行了详尽的剖析。它首先从本体论的理论基础出发,介绍了不同流派的本体构建思想,包括逻辑基础、语义网以及知识图谱等。读者将了解到,本体的构建需要对特定领域的概念进行细致的划分、定义以及它们之间关系的明确描述,例如“is-a”关系(继承)、“part-of”关系(组成)以及各种属性关系等。 接着,本书深入探讨了本体在NLP任务中的实际应用。例如,在信息抽取(Information Extraction)任务中,本体可以指导机器识别文本中的实体(如人名、地名、组织机构)及其属性,并将这些信息按照本体定义的结构进行组织。在问答系统(Question Answering)中,本体能够帮助系统理解用户问题的语义,并从知识库中检索相关的答案。在文本分类(Text Classification)和情感分析(Sentiment Analysis)等任务中,本体可以提供领域特定的词汇和概念,从而提高模型的准确性和鲁棒性。 此外,本书还讨论了本体构建的挑战和方法。包括手工构建的优点和局限性,以及自动化或半自动化的本体学习(Ontology Learning)技术。这些技术利用机器学习和自然语言处理的方法,从大规模文本数据中自动提取概念、关系和属性,从而加速本体的构建过程,并使其能够适应不断变化的知识领域。本书通过精选的论文,展示了本体在不同NLP应用中的创新实践,以及研究人员如何克服本体构建中的复杂性,使其在实际系统中发挥作用。 词汇库:语言的原子单位与语义网络 词汇库(Lexicon),在自然语言处理的语境下,远不止是一个简单的单词列表。它包含了词汇的形态信息、句法信息、语义信息以及词语之间的各种关系。一个丰富的、结构化的词汇库是NLP系统进行语言理解和生成的关键资源。 本书对词汇库在NLP中的功能和构建进行了全面的介绍。它首先阐述了词汇库的多层面信息: 形态学信息: 包括词的词性(名词、动词、形容词等)、单复数、时态、语态等。 句法信息: 词语在句子中的搭配方式、语法功能以及与其他词语的组合规则。 语义信息: 词语的含义、同义词、反义词、多义词的解释,以及词语在不同语境下的语义变化。 词汇关系: 如上位词(hypernyms)、下位词(hyponyms)、同义词(synonyms)、反义词(antonyms)、部分-整体关系(meronymy)等。 本书重点介绍了词汇库如何支撑NLP的各项任务。例如,在词性标注(Part-of-Speech Tagging)任务中,词汇库提供了词语的可能词性信息,帮助模型做出准确的判断。在命名实体识别(Named Entity Recognition)中,词汇库可以包含预定义的实体列表,加速识别过程。在语义角色标注(Semantic Role Labeling)中,词汇库可以提供动词的语义参数,帮助识别句子中谓语动词的施事者、受事者等。 更重要的是,本书深入探讨了词汇库的构建方法。它介绍了传统的词典式构建方式,以及基于大规模语料库的统计学习方法。读者将了解到,如何利用共现统计、词向量(Word Embeddings)等技术,从海量文本中挖掘词语之间的语义关联,构建动态的、可扩展的词汇资源。本书精选的论文展示了不同类型词汇库的构建实例,包括通用词汇库、领域特定词汇库以及情感词汇库等,并分析了它们在不同NLP应用中的有效性。 本体与词汇库的协同:构建强大的语言理解系统 《本体与词汇库:自然语言处理视角下的解析》一书最核心的贡献在于,它强调了本体和词汇库并非孤立的概念,而是相互依存、协同工作的。本体提供了概念的框架和关系的结构,而词汇库则填充了具体的词语及其语义细节。 本书通过一系列精选论文,展示了本体和词汇库如何有机地结合,为NLP系统提供更深层次的语言理解能力。例如: 本体驱动的词汇扩展: 当一个本体定义了一个新的概念时,可以利用词汇库中的现有词语以及其语义关系,来为新概念寻找合适的表达方式,或者为现有词语赋予新的本体角色。 词汇库支持的本体构建: 现有的词汇库可以作为构建本体的起点。通过分析词汇库中词语之间的语义关系,可以逐步推导出本体中的概念层级和关系类型。 语义搜索与推理: 当用户进行搜索时,本体能够提供搜索词背后的深层含义和相关概念,而词汇库则能够识别搜索词的各种表达方式,从而实现更精准、更全面的语义搜索。在问答系统中,本体和词汇库的结合能够让机器理解复杂问题,并进行逻辑推理,找到非直接的答案。 语境感知与消歧: 词语的含义往往依赖于语境。本体可以提供一个词语可能出现的语境信息,而词汇库则能够列出该词语在不同语境下的不同含义,从而实现词义消歧(Word Sense Disambiguation)。 知识图谱的构建与应用: 现代的知识图谱(Knowledge Graph)是本体和词汇库结合的典范。本体定义了知识图谱的模式(Schema),即实体类型、属性和关系类型,而词汇库则提供了构成知识图谱中节点的具体词语及其语义信息。本书中的论文展示了如何利用本体和词汇库构建和丰富知识图谱,并将其应用于各种NLP任务,如信息检索、智能推荐、以及对话系统等。 本书的价值与意义 《本体与词汇库:自然语言处理视角下的解析》一书的价值体现在其系统性、前沿性和实践性。它不仅汇集了该领域中最具代表性的研究成果,更从NLP的实用角度出发,深入浅出地阐释了本体和词汇库的重要性。 对于NLP的研究者而言,本书提供了丰富的理论框架和实证案例,可以启发新的研究思路,并在实际项目中加以应用。对于从事人工智能、信息科学、语言学等相关领域的学者和工程师来说,本书也是不可多得的参考资料,有助于他们理解语言处理的底层逻辑和关键技术。 随着人工智能技术的飞速发展,语言理解能力正成为衡量人工智能水平的重要标准。本体和词汇库作为理解语言的关键要素,其重要性日益凸显。本书的出版,为推动NLP技术的发展,特别是为构建更智能、更人性化的语言处理系统,提供了坚实的理论支撑和实践指导。它以一种严谨而清晰的方式,揭示了构成语言智能的深层结构,为我们理解和驾驭语言的奥秘打开了新的大门。 本书的英文影印版,忠实地保留了原文的精髓,为读者提供了直接接触前沿学术成果的机会,使其能够更深刻地理解这些基础概念的演进和发展。无论您是希望深入了解自然语言处理的核心技术,还是对如何让机器真正理解人类语言充满好奇,本书都将是您不可或缺的指引。