Deep Learning 4|用 Python 進行強化學習的開發實作
斎藤康毅 著 吳嘉芳 譯
- 出版商: 歐萊禮
 - 出版日期: 2023-09-14
 - 定價: $680
 - 售價: 7.9 折 $537
 - 語言: 繁體中文
 - 頁數: 344
 - 裝訂: 平裝
 - ISBN: 6263246111
 - ISBN-13: 9786263246119
 - 
    相關分類:
    
      Reinforcement、DeepLearning、Reinforcement
 - 
    
Deep Learning|用 Python 進行深度學習的基礎理論實作 Deep Learning 2|用 Python 進行自然語言處理的基礎理論實作 Deep Learning 3|用 Python 進行深度學習框架的開發實作 Deep Learning 4|用 Python 進行強化學習的開發實作 Deep Learning 5|生成模型開發實作
 
立即出貨 (庫存 > 10)
買這商品的人也買了...
- 
                
                  
                  
                Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 - 
                
                  
                  
                Deep Learning 2|用 Python 進行自然語言處理的基礎理論實作$680$537 - 
                
                  
                  
                動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 - 
                
                  
                  
                機器學習的數學基礎 : AI、深度學習打底必讀$580$458 - 
                
                  
                  
                深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)$580$458 - 
                
                  
                  
                深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 - 
                
                  
                  
                Deep Learning 3|用 Python 進行深度學習框架的開發實作$780$616 - 
                
                  
                  
                Reinforcement Learning|強化學習深度解析 (繁體中文版) (Reinforcement Learning: An Introduction, 2/e)$1,200$948 - 
                
                  
                  
                跟著 Docker 隊長,修練 22天就精通 - 搭配 20小時作者線上教學,無縫接軌 Microservices、Cloud-native、Serverless、DevOps 開發架構$880$695 - 
                
                  
                  
                $403Python 深度強化學習 : 基於 Chainer 和 OpenAI Gym - 
                
                  
                  
                黑帽 Python|給駭客與滲透測試者的 Python 開發指南, 2/e (Black Hat Python : Python Programming for Hackers and Pentesters, 2/e)$450$356 - 
                
                  
                  
                Keras 大神歸位:深度學習全面進化!用 Python 實作 CNN、RNN、GRU、LSTM、GAN、VAE、Transformer$1,200$948 - 
                
                  
                  
                深度強化學習$779$740 - 
                
                  
                  
                深度強化學習實戰 用 OpenAI Gym 構建智能體$419$398 - 
                
                  
                  
                精通嵌入式 Linux 程式設計, 3/e (上)$750$585 - 
                
                  
                  
                精通嵌入式 Linux 程式設計, 3/e (下)$450$351 - 
                
                  
                  
                Docker 實戰 6堂課:56個實驗動手做,掌握 Linux 容器核心技術(iThome鐵人賽系列書)【軟精裝】$720$562 - 
                
                  
                  
                AI GNN 再進化 -- 圖神經網路完整學習及應用大全$1,200$948 - 
                
                  
                  
                親手開發推薦系統 - PyTorch 全方位實作最重要演算法$780$616 - 
                
                  
                  
                約耳再談軟體 (More Joel on Software)$580$458 - 
                
                  
                  
                流暢的 Python|清晰、簡潔、高效的程式設計, 2/e (Fluent Python: Clear, Concise, and Effective Programming, 2/e)$1,200$948 - 
                
                  
                  
                微服務開發指南|使用 Spring Cloud 與 Docker$580$458 - 
                
                  
                  
                演算法導論, 4/e (Introduction to Algorithms, 4/e)$1,800$1,422 - 
                
                  
                  
                讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 - 
                
                  
                  
                Deep Learning 5|生成模型開發實作$780$616 
商品描述
本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。
從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
作者簡介
斎藤康毅
1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。
目錄大綱
第 1 章 吃角子老虎機問題
第 2 章 馬可夫決策過程
第 3 章 貝爾曼方程式
第 4 章 動態規劃法
第 5 章 蒙地卡羅法
第 6 章 TD 法
第 7 章 類神經網路與 Q 學習
第 8 章 DQN
第 9 章 策略梯度法
第 10 章 進階內容
附錄 A 離線策略蒙地卡羅法
附錄 B n 步 TD 法
附錄 C 理解 Double DQN
附錄 D 驗證策略梯度法









