自然语言计算机形式分析的理论与方法

自然语言计算机形式分析的理论与方法 pdf epub mobi txt 电子书 下载 2025

冯志伟 著
图书标签:
  • 自然语言处理
  • 计算语言学
  • 形式语言
  • 句法分析
  • 语义分析
  • 机器翻译
  • 语言模型
  • 信息抽取
  • 文本分析
  • 人工智能
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 中国科学技术大学出版社
ISBN:9787312041303
版次:1
商品编码:12060549
包装:精装
开本:16开
出版时间:2017-01-01
用纸:胶版纸

具体描述

编辑推荐

  (1)国家出版基金项目
  (2)“十三五”国家重点图书出版规划项目
  (3)100多万字的集大成之作

内容简介

  自然语言计算机形式分析是横跨语言学、计算机科学和数学的一个交叉研究领域,是自然语言计算机处理的关键。自然语言是信息主要的负荷者,在当今信息网络时代,计算机已经日益普及,普通计算机用户可以使用的语言资源正以惊人的速度飞快增长。互联网主要是由自然语言构成的,它已经成为了极为丰富的语言信息资源;移动通信也是以自然语言为媒介的,它已经渗透到日常生活的各个领域。因此,自然语言计算机形式分析对于国家的信息化建设,对于互联网和移动通信的安全具有重要作用。
  本书对自然语言处理中的各种理论和方法进行了系统的总结和梳理。首先讨论了自然语言处理的学科定位;接着介绍了语言计算的一些先驱研究;然后以主要的篇幅讨论自然语言处理中的各种形式模型,包括基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于格语法的形式模型、基于词汇主义的形式模型、语义自动处理的形式模型、系统功能语法、语用自动处理的形式模型、概率语法、Bayes公式与动态规划算法、N元语法和数据平滑、隐Markov模型(HMM)、语音自动处理的形式模型、统计机器翻译的形式模型;同时还讨论了自然语言处理系统的评测问题;最后从哲学的角度讨论了自然语言处理中的理性主义和经验主义,探索理性主义方法和经验主义方法相结合的途径。
  本书说理透彻、语言流畅、实例丰富、深入浅出,适合从事自然语言处理研究的科研人员、大学师生阅读,也可以作为人工智能、计算语言学等课程的教学参考书。

作者简介

  冯志伟,1939年出生,计算语言学家,先后在北京大学和中国科学技术大学研究生院获文科和理科硕士学位。精通英语、德语、法语、俄语、日语等多门外语,具有宽厚、坚实的语言学、数学和计算机科学功底,是一位难得的横跨文理科的复合型专家。50多年来一直从事语言学、数学和计算机科学的跨学科研究,是我国从事自然语言处理和计算语言学研究的学者之一。

内页插图

目录


第1章自然语言处理的学科定位
1.1从自然语言处理的过程来考察其学科定位
1.2从自然语言处理的范围来考察其学科定位
1.3从自然语言处理的历史来考察其学科定位
1.4当前自然语言处理发展的几个特点
参考文献
第2章语言计算研究的先驱
2.1Markov链
2.2Zipf定律
2.3Shannon关于“熵”的研究
2.4Bar-Hillel的范畴语法
2.5Harris的语言串分析法
2.6О.С.Кулагина的语言集合论模型
参考文献
第3章基于短语结构语法的形式模型
3.1语法的Chomsky层级
3.2有限状态语法和它的局限性
3.3短语结构语法
3.4递归转移网络和扩充转移网络
3.5自底向上分析和自顶向下分析
3.6通用句法处理器和线图分析法
3.7Earley算法
3.8左角分析法
3.9CYK算法
3.10Tomita算法
3.11管辖约束理论与最简方案
3.12Joshi的树邻接语法
3.13汉字结构的形式描述
3.14Hausser的左结合语法
参考文献
第4章基于合一运算的形式模型
4.1中文信息MMT模型
4.2Kaplan的词汇功能语法
4.3Martin Kay的功能合一语法
4.4Gazdar的广义短语结构语法
4.5Shieber的PATR
4.6Pollard的中心语驱动的短语结构语法
4.7Pereira和Warren的定子句语法
参考文献
第5章基于依存和配价的形式模型
5.1配价观念的起源
5.2Tesnière的依存语法
5.3依存语法在自然语言处理中的应用
5.4配价语法
5.5配价语法在自然语言处理中的应用
参考文献
第6章基于格语法的形式模型
6.1Fillmore的格语法
6.2Fillmore的框架网络
参考文献
第7章基于词汇主义的形式模型
7.1Gross的词汇语法
7.2链语法
7.3词汇语义学
7.4知识本体
7.5词网
7.6知网
7.7Pustejovesky的生成词库理论
参考文献
第8章语义自动处理的形式模型
8.1义素分析法
8.2语义场
8.3语义网络
8.4Montague语法
8.5Wilks的优选语义学
8.6Schank的概念依存理论
8.7Mel’chuk的意义文本理论
8.8词义排歧方法
参考文献
第9章系统功能语法
9.1系统功能语法的基本概念
9.2系统功能语法在自然语言处理中的应用
参考文献
第10章语用自动处理的形式模型
10.1Mann和Thompson的修辞结构理论
10.2文本连贯中的常识推理技术
10.3言语行为理论和会话智能代理
参考文献
第11章 概率语法
11.1概率上下文无关语法与句子的歧义
11.2概率上下文无关语法的基本原理
11.3概率上下文无关语法的三个假设
11.4概率词汇化上下文无关语法
参考文献
第12章Bayes公式与动态规划算法
12.1拼写错误的检查与更正
12.2Bayes公式与噪声信道模型
12.3最小编辑距离算法
12.4发音问题研究中的Bayes方法
12.5发音变异的决策树模型
12.6加权自动机
12.7向前算法
12.8Viterbi算法
附录
参考文献
第13章N元语法和数据平滑
13.1N元语法
13.2数据平滑
参考文献
第14章隐Markov模型(HMM)
14.1HMM概述
14.2HMM在语音识别中的应用
参考文献
第15章语音自动处理的形式模型
15.1语音和音位的形式描述方法
15.2声学语音学和信号
15.3语音自动合成的方法
15.4语音自动识别的方法
参考文献
第16章统计机器翻译中的形式模型
16.1机器翻译与噪声信道模型
16.2最大熵模型
16.3基于平行概率语法的形式模型
16.4基于短语的统计机器翻译
16.5基于句法的统计机器翻译
参考文献
第17章自然语言处理系统的评测
17.1评测的一般原则和方法
17.2语音合成和文语转换系统的评测
17.3机器翻译系统的评测
17.4语料库系统的评测
17.5国外自然语言处理系统的评测
参考文献
第18章自然语言处理中的理性主义与经验主义
18.1哲学中的理性主义和经验主义
18.2自然语言处理中理性主义和经验主义的消长
18.3理性主义方法和经验主义方法的利弊得失
18.4探索理性主义方法和经验主义方法结合的途径
参考文献
附录走在文理结合的道路上——记自然语言处理专家冯志伟先生


探索语言的内在秩序:认知科学、逻辑学与人工智能的交汇点 人类语言,作为思想的载体、交流的桥梁,其背后蕴藏着一套精妙而复杂的内在秩序。理解这套秩序,不仅是认知科学领域的终极目标之一,也是人工智能实现真正智能的关键所在。本书并非直接探讨“自然语言计算机形式分析的理论与方法”这一特定学科领域,而是将目光投向一个更为宏大而深邃的范畴:人类认知系统如何构建、处理和生成语言,以及我们如何从这些认知过程的普适性原则中汲取灵感,构建能够理解和运用自然语言的计算模型。 我们将从人类心智运作的视角出发,深入剖析语言理解的底层机制。语言并非孤立存在的符号序列,它与我们对世界的感知、概念的形成、推理的进行以及情感的体验紧密相连。因此,本书的第一部分将聚焦于人类认知的基础结构与语言的关联。我们会审视信息处理模型如何解释人类的注意、记忆和学习过程,并探讨这些过程如何共同作用于我们接收和解析语言信息。例如,当我们听到或读到一个句子时,我们的大脑并非逐字逐句机械地处理,而是会根据已有的知识、上下文信息以及预期的语义结构,动态地构建理解。这涉及到从音素到词汇、从词汇到短语、从短语到句子,乃至从句子到篇章的层层递进的认知加工。 我们将深入研究概念表征与语义网络的构建。人类如何将零散的感官经验抽象为具有代表性的概念?这些概念之间又如何相互关联,形成庞大而精密的知识网络?本书将回顾认知心理学中关于范畴化、原型理论以及联想网络的研究,并以此为基础,探讨构建富有层次和深度的语义表征的可能途径。理解语言的含义,本质上是对概念及其之间关系的理解。一个词语的意义,并非其本身固有的属性,而是其在整个概念系统中的位置和与其他概念的联系所赋予的。例如,“椅子”的意义,不仅在于它是一个可以坐的物体,更在于它与“桌子”、“房间”、“家具”等概念的关联,以及其在“座位”这一更高层级范畴下的位置。 接着,我们将把目光转向语言的逻辑基础与推理机制。人类语言的结构往往蕴含着丰富的逻辑信息,而我们对语言的理解,离不开强大的逻辑推理能力。本书将探讨形式逻辑的几种主要分支,如命题逻辑、谓词逻辑,以及它们在解释自然语言句子结构和含义方面的潜力。然而,自然语言的表达远比形式逻辑复杂,它充满了歧义、隐含信息和语用色彩。因此,我们还将深入研究非单调推理、模态逻辑以及概率推理等更具表现力的逻辑框架,探讨它们如何捕捉自然语言中“可能”、“必然”、“原因”、“结果”等更为细致的逻辑关系。例如,当我们听到“如果下雨,地面就会湿”这句话时,我们不仅理解了条件与结果的联系,还会推理出“如果没下雨,地面不一定不湿”(存在其他原因导致地面湿),这便是非单调推理的体现。 从认知科学的土壤中,我们将自然而然地过渡到人工智能领域对语言智能的探索。人工智能的终极目标之一,便是让机器能够像人类一样理解和运用自然语言。本书将回顾人工智能早期在符号主义和连接主义范式下的语言处理尝试。符号主义强调通过显式的规则和符号操作来模拟语言的句法和语义结构,而连接主义则致力于构建能够从数据中学习语言模式的神经网络。我们将重点关注基于统计学习和深度学习的自然语言处理模型的最新进展。这包括但不限于循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)以及近年来席卷整个AI领域的Transformer模型及其衍生架构(如BERT、GPT系列)。 我们将详细阐述这些深度学习模型如何通过大规模语料库的学习,自动提取语言的统计规律,并在此基础上实现诸如词语嵌入(Word Embeddings)、句子向量(Sentence Embeddings)、文本分类、机器翻译、问答系统、文本生成等一系列复杂的自然语言处理任务。我们会深入剖析这些模型在处理语言的句法分析(理解句子成分的结构关系)和语义理解(把握句子所表达的意义)方面的优势与局限。例如,Transformer模型通过自注意力机制(Self-Attention Mechanism)能够有效捕捉长距离依赖关系,这对于理解复杂的句子结构和篇章连贯性至关重要。 然而,仅仅掌握统计规律并不足以实现真正意义上的语言理解。人类的语言理解是情境化(Contextualized)的,它受到对话历史、语境信息、说话人的意图以及社会文化背景的深刻影响。因此,本书的后半部分将重点探讨语用学与对话系统的研究。我们将审视如何将语用学的理论,如合作原则、会话含义、言语行为理论等,融入到计算模型中,以提升机器对隐含意义和说话人意图的识别能力。 我们将探讨对话管理的关键技术,包括如何追踪对话状态、理解用户意图、生成恰当的回应,以及如何在多轮对话中维持连贯性和一致性。这涉及到如何构建能够进行自然、流畅、有意义对话的智能体,而不仅仅是执行孤立的任务。例如,一个成功的对话系统需要能够理解用户的反问、纠正,以及在必要时主动澄清模棱两可的陈述,这些都是语用理解的体现。 此外,我们还将触及语言生成的艺术。从理解到生成,是人工智能在语言领域迈向更高层次的关键一步。本书将探讨如何利用深度学习模型,不仅能够理解现有的文本,还能生成流畅、连贯、富有创意的文本。这包括新闻报道的自动撰写、故事的创作、诗歌的生成,甚至是以人类难以分辨的水平进行写作。我们将分析这些生成模型在多样性、事实准确性、风格模仿等方面的挑战,以及当前的研究趋势。 最后,本书将展望未来自然语言处理的发展方向。随着人工智能技术的不断演进,我们距离构建真正能够理解人类思想、进行深度交流的智能体,又近了一步。我们将探讨多模态语言理解(结合文本、图像、声音等信息)、常识推理(赋予机器理解世界的基本常识)、情感计算(理解和生成情感化的语言)以及可解释AI(让机器的语言决策过程更透明)等前沿领域。我们相信,通过融合认知科学的深刻洞察、逻辑学的严谨分析以及人工智能的计算能力,我们将能更有效地解锁自然语言的奥秘,并最终创造出更智能、更具理解力的人工智能系统。 本书旨在为有志于深入理解人类语言智能的读者提供一个广阔的视野和坚实的理论基础,它不仅仅是关于如何“处理”语言,更是关于如何“理解”语言,以及如何基于对理解的深入探索,构建真正智能的机器。

用户评价

评分

这本书的书名,——《自然语言计算机形式分析的理论与方法》,让我联想到的是,它可能是一本能让人“静下心来”阅读的书。我之所以这么想,是因为“理论与方法”这几个字,往往意味着需要细致的思考和耐心的钻研。我猜想,这本书会从最基础的概念讲起,一步步构建起一个完整的知识体系。在理论层面,它可能会详细介绍形式语言、文法、句法分析树等核心概念,并解释它们在自然语言处理中的意义。在方法层面,我期待它能给出具体的算法实现思路,比如如何将自然语言的歧义性通过形式化的手段进行建模,以及如何设计出高效的算法来处理大规模的文本数据。我设想,这本书的语言可能会比较精炼,但每一句话都蕴含着深刻的意义,需要读者仔细体会。对于那些希望从根本上理解自然语言处理机制的读者来说,这本书或许能提供一条清晰的学习路径,帮助他们打下坚实的基础。

评分

《自然语言计算机形式分析的理论与方法》,听起来就像一本可以“啃”的书。我之所以这么说,是因为它触及的“理论与方法”这两个词,往往意味着需要花费大量时间和精力去消化。我脑海里勾勒出的是一本充满数学符号、算法流程图和逻辑推演的书,每一个概念都可能需要反复咀嚼才能领会其精髓。我希望这本书能够提供扎实的理论基础,例如,它会不会深入讲解形式文法的不同流派,它们的优劣势是什么?在方法论上,它又会如何展现从理论到实践的转化过程?比如,对于分词、词性标注、句法分析等核心任务,会给出怎样的形式化模型和相应的算法?我猜想,这本书的作者一定是在这个领域深耕多年的专家,能够以一种系统、全面的方式,将复杂的知识体系化地呈现出来,让读者在掌握基本原理的同时,也能对整个领域的发展脉络有所认识。

评分

这本书的书名《自然语言计算机形式分析的理论与方法》,让我联想到的是那些在学术界流传的经典著作,它们往往是打开某一研究领域大门的钥匙。我非常好奇,这本书将如何阐释“形式分析”这一核心概念?是会从经典的乔姆斯基形式语言理论出发,还是会涵盖更多现代的统计学和机器学习方法?我期待它能够提供清晰的理论框架,帮助我理解不同形式化方法之间的联系与区别。在“方法”层面,我更希望看到具体的算法和技术细节,例如,如何通过形式化的手段来处理语言中的歧义性问题,如何构建高效的解析器,以及如何评估这些方法的性能。我设想,这本书或许会用大量图表和公式来展示其内容,并且会涉及一些经典的自然语言处理任务,比如语义角色标注、指代消 Resolve等,并给出相应的形式化解决方案。

评分

这本书的书名——《自然语言计算机形式分析的理论与方法》,本身就充满了学术的严谨和探索的野心。作为一个对此领域略有涉猎的读者,我拿到这本书时,脑海中浮现的首先是那些经典论文中的晦涩公式,是那些为理解人类语言如何被机器解读所付出的巨大努力。我期待着在这本书中找到一条清晰的脉络,能够将复杂的理论概念一一梳理,并辅以详实的案例分析,帮助我理解那些抽象的数学模型和逻辑推理是如何一步步构建起来,最终指向对自然语言的深度洞察。我希望作者能够带领我穿越语言学的迷雾,深入到计算的海洋,看到形式化方法的强大力量,它如何将那些看似随意、多变的语言现象,转化为可计算、可处理的结构。这本书的出现,或许能填补我在理解这一领域核心原理时的知识鸿沟,让我能够更自信地探讨自然语言处理的前沿问题。

评分

《自然语言计算机形式分析的理论与方法》,光看书名就感觉它是一部“硬核”学术著作。我猜想,这本书的阅读门槛可能不低,它需要读者具备一定的计算机科学和语言学背景。我尤其关注它在“理论”部分会涉及哪些前沿性的模型和框架,例如,是否会介绍基于深度学习的神经网络模型如何被形式化地理解和表示?在“方法”上,我期望它能深入讲解一些具体的算法,比如如何利用概率图模型来解决自然语言处理中的复杂问题,或者如何设计高效的算法来解析复杂的句法结构。我设想,这本书的叙述风格会非常严谨,逻辑性强,并且会引用大量相关的研究成果。对于那些希望深入理解自然语言处理底层原理的读者来说,这本书无疑是一份宝贵的参考资料,它或许能帮助我构建一个更加坚实的理论基础,从而更好地理解和应用现有的自然语言处理技术。

评分

印刷和内容都非常好,就是价格偏高

评分

好厚的一本书,先收藏以后读

评分

买的第一本关于nlp方面的书籍,希望能在工作中有所作用。期待!!!!

评分

计算语言学、NLP专业的老师学生必备书。

评分

很好不错,值得一用呵呵

评分

包装完好,好厚的一本书啊……两年内读的完不?

评分

封皮被划伤了

评分

很厚的一本书,把来龙去脉都讲了,适合打基础

评分

我喜欢

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有