內容簡介
本書初步探索瞭將深度學習應用於自然語言處理的方法。概述瞭自然語言處理的一般概念,通過具體實例說明瞭如何提取自然語言文本的特徵以及如何考慮上下文關係來生成文本。書中自然語言文本的特徵提取是通過捲積神經網絡來實現的,而根據上下文關係來生成文本則利用瞭循環神經網絡。這兩個網絡是深度學習領域中常用的基礎技術。
作者簡介
小高知宏,日本福井大學大學院工學研究科教授。其主要著作有《計算機係統》《從基礎開始學會TCP/IP Java網絡程序設計 第2版》《初學AI程序設計——用C語言製作人工智能和人工無能》《初學機器學習》《基於AI的大規模數據處理入門》《人工智能入門》等。
目錄
CONTENTS
譯者序
前言
第1章 自然語言處理與深度學習1
1.1 自然語言處理1
1.1.1 什麼是自然語言處理1
1.1.2 自然語言處理基礎4
1.2 深度學習13
1.2.1 人工智能與機器學習13
1.2.2 神經網絡16
1.2.3 捲積神經網絡和自編碼器22
1.3 與自然語言處理相關的深度學習27
1.3.1 自然語言處理與神經網絡、深度學習27
1.3.2 用神經網絡來錶達單詞意義29
1.3.3 深度學習應用於自然語言處理31
第2章 基於文本處理的自然語言處理32
2.1 自然語言文本的文本處理32
2.1.1 文字處理32
2.1.2 單詞處理45
2.1.3 1-of-N錶示的處理54
2.2 基於單詞2-gram的文本生成68
第3章 深度學習應用於自然語言文本分析77
3.1 基於CNN的文本分類77
3.2 準備1:捲積運算和池化處理81
3.2.1 捲積運算81
3.2.2 池化處理90
3.3 準備2:全連接型神經網絡96
3.3.1 基於層次結構的全連接型神經網絡的構造及學習方法96
3.3.2 全連接型神經網絡的實現99
3.4 捲積神經網絡的實現102
3.4.1 捲積神經網絡的結構102
3.4.2 由捲積神經網絡學習1-of-N錶示數據103
3.4.3 基於CNN的單詞序列評估118
第4章 文本生成與深度學習133
4.1 基於循環神經網絡的文本生成133
4.1.1 神經網絡和文本生成133
4.1.2 循環神經網絡136
4.2 RNN的實現139
4.2.1 RNN程序的設計139
4.2.2 RNN程序的實現141
4.3 基於RNN的文本生成154
4.3.1 基於RNN的文本生成框架154
4.3.2 文本生成實驗的實例160
附錄A 將行的重復次數添加到行首的程序uniqc.c167
附錄B 按照行首的數值對行進行排序的程序sortn.c169
附錄C 全連接型神經網絡的程序bp.c171
參考文獻178
前言/序言
PREFACE前言
深度學習技術在計算機圖像識彆領域取得瞭重大成果,這一技術目前已經逐漸應用於機器學習的多個不同領域,使人工智能發展到瞭過去所不能達到的能力層次。同樣,深度學習也能應用於自然語言處理領域,能夠解決過去不能處理的各種自然語言處理問題。
本書初步探索瞭將深度學習應用於自然語言處理的方法,概述瞭自然語言處理的常見概念,通過具體實例說明瞭如何提取自然語言文本的特徵以及如何考慮上下文關係來生成文本。本書中,自然語言文本的特徵提取是通過捲積神經網絡來實現的,根據上下文關係來生成文本則利用瞭循環神經網絡。這兩個網絡是深度學習領域中常用的基礎技術。
本書通過實現C語言程序來具體講解自然語言處理與深度學習的相關技術,所給齣的程序都能在普通的個人電腦上執行。通過實際執行這些C語言程序,確認其運行過程,並根據需要對程序進行修改,讀者能夠更深刻地理解自然語言處理與深度學習技術。
本書的完成離不開作者在福井大學從事科研活動積纍的經驗,在此特彆感謝提供這樣機會的福井大學教職員和學生。此外,特彆感謝Ohmsha齣版社提供瞭齣版本書的機會。最後,感謝支持我完成本書的傢人洋子、研太郎、桃子以及優。
小高知宏2017年2月
自然語言處理與深度學習:通過C語言模擬 下載 mobi epub pdf txt 電子書 格式