發表於2024-11-27
強化學習精要:核心算法與TensorFlow實現
叢書名 : | |||||||||
作 譯 者: | |||||||||
| |||||||||
所屬分類: >> >> | |||||||||
紙質書定價:¥80.0 |
內容簡介
《強化學習精要:核心算法與TensorFlow 實現》用通俗幽默的語言深入淺齣地介紹瞭強化學習的基本算法與代碼實現,為讀者構建瞭一個完整的強化學習知識體係,同時介紹瞭這些算法的具體實現方式。從基本的馬爾可夫決策過程,到各種復雜的強化學習算法,讀者都可以從本書中學習到。本書除瞭介紹這些算法的原理,還深入分析瞭算法之間的內在聯係,可以幫助讀者舉一反三,掌握算法精髓。書中介紹的代碼可以幫助讀者快速將算法應用到實踐中。
目錄
第一部分強化學習入門與基礎知識
1 引言2
1.1 強化學習的概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 巴浦洛夫的狗. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 俄羅斯方塊. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 站在被實驗者的角度看問題. . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 強化學習效果的評估. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 不斷試錯. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2 看重長期迴報. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 強化學習與監督學習. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1 強化學習與監督學習的本質. . . . . . . . . . . . . . . . . . . . . 強化學習精要:核心算法與TensorFlow實現 馮超著 深入淺齣強化學習書籍 下載 mobi epub pdf txt 電子書 格式
強化學習精要:核心算法與TensorFlow實現 馮超著 深入淺齣強化學習書籍 下載 mobi pdf epub txt 電子書 格式 2024
強化學習精要:核心算法與TensorFlow實現 馮超著 深入淺齣強化學習書籍 下載 mobi epub pdf 電子書評分
評分
評分
評分
評分
評分
評分
評分
強化學習精要:核心算法與TensorFlow實現 馮超著 深入淺齣強化學習書籍 mobi epub pdf txt 電子書 格式下載 2024