實戰人工智慧之深度強化學習|使用PyTorch x Python

台灣風情茄芷袋Supercard造型悠遊卡-台灣(裁型)

可愛ｘ實用ｘ好旅伴，台味悠遊卡熱銷中！

喜歡+1
寫評價
賺金幣

9折 450元
~~500~~元
認購希望書包，幫助弱勢孩童上學不中斷！

預計最高可得金幣20點 ? 可100%折抵
活動加倍另計
HAPPY GO享100累1點 4點抵1元 折抵無上限

分類：
中文書＞電腦資訊＞APP開發/程式設計＞Python
追蹤

? 追蹤分類後，您會在第一時間收到分類新品通知。
作者：株式?社電通?際情報???? 追蹤 ? 追蹤作者後，您會在第一時間收到作者新書通知。
譯者：許郁文
出版社：碁峰資訊追蹤 ? 追蹤出版社後，您會在第一時間收到出版社新書通知。
出版日：2019/07/19

立即結帳

加入購物車

預計 2026/07/10 出貨購買後進貨　

預訂門市商品

門市庫存

大量採購

內容簡介

以step by step的方式學習人工智慧的程式撰寫

最近，「人工智慧」、「深度學習」這類的關鍵字出現在的機會非常多，但能夠實際動手做的人卻非常少。本書以非研究者的一般讀者為主要族群，希望帶著各位讀者邊做邊了解強化
學習與深度強化學習，也會盡量介紹與解說可實際操作的程式碼。只要您具備粗淺的程式設計經驗以及初階的線性代數知識，就能看懂本書的內容。

透過本書，您將可以：

．認識強化學習的概念與術語
．學到策略梯度法、Sarsa、Q學習演算法的撰寫方式
．了解Anaconda的設定方法
．利用PyTorch撰寫深度學習的程式碼，解決分類手寫數字影像的MNIST課題
．了解DQN演算法的撰寫方法
．利用深度學習演算法撰寫倒立單擺系統
．利用深度強化學習的A2C撰寫打磚塊遊戲
．利用AWS的GPU建置深度學習環境的方法

作者

小川雄太郎

隸屬於株式會社電通國際資訊服務技術本部開發技術部，從事深度學習的機械學習相關技術研發、技術支援，也負責工作型態創新室的HR資料剖析業務。從明石工業高等專門學校、東京大學工學部畢業後，進入東京大學研究所神保、小谷研究室研究腦機能測量與計算理論的神經科學，2016年取得博士學位（科學）。曾擔任東京大學特聘研究員，從2017年4月開始擔任現職。

．GitHub：https://github.com/YutaroOgawa/
．Qiita：https://qiita.com/sugulu

第1章強化學習的概要
1.1 機械學習的分類（監督式學習、非監督式學習、強化學習）
1.2 強化學習、深度強化學習的歷史
1.3 深度強化學習的應用實例

第2章以強化學習建置迷宮課題
2.1 Try Jupter的使用方法
2.2 建置迷宮與智能體
2.3 建置策略迭代法
2.4 整理價值迭代法的專業術語
2.5 建置Sarsa
2.6 建置Q學習

第3章利用倒立單擺課題學習強化學習
3.1 於本地端電腦建置強化學習執行環境的方法
3.2 解說倒立單擺課題「CartPole」
3.3 說明多變數、連續值狀態的表格表示法
3.4 撰寫Q學習

第4章利用PyTorch建置深度學習
4.1 神經網路與深度學習的歷史
4.2 解說深度學習的計算方式
4.3 利用PyTorch撰寫分類手寫數字影像的MNIST課題

第5章建置深度強化學習DQN
5.1 深度強化學習DQN（Deep Q-Network）的解說
5.2 建置DQN的四項重點
5.3 建置DQN（上篇）
5.4 建置DQN（下篇）

第6章建置深度強化學習的進階版
6.1 深度強化學習的演算法地圖
6.2 建置DDQN（Double-DQN）
6.3 建置Dueling Network
6.4 建置Prioritized Experience Replay
6.5 建置A2C

第7章於AWS的GPU環境建置打磚塊遊戲
7.1 解說打磚塊遊戲「Breakout」
7.2 於AWS建置使用GPU的深度學習的執行環境
7.3 學習Breakout之際的四項重要事項
7.4 A2C的建置（上篇）
7.5 A2C的建置（下篇）

序／導讀

序

近年來，聽到強化學習、深度強化學習這些關鍵字的機會真的非常多，但「實際建置強化學習」的人卻非常少。現在已是第三波AI的時代，市面上也有許多關於「深度學習」的書籍，但是將焦點放在強化學習或深度學習的書籍，內容往往偏向研究人員的學術研究。學術性的解說重視理論，也會仔細地說明公式與證明過程，但可供實際操作的程式碼卻不多，所以讓非研究者的讀者覺得難以一窺強化學習、深度強化學習的殿堂。

本書以非研究者的一般讀者為主要族群，希望帶著各位讀者邊做邊了解強化學習與深度強化學習，也會盡量介紹與解說可實際操作的程式碼。本書的程式碼皆可下載，希望大家能夠跟著本書的程式碼實作學習。

強化學習與深度強化學習主要有兩大用途，一者是建立機器人的控制規則，一者是建立如圍棋、將棋這類對戰遊戲的戰略。本書介紹的是控制規則的建置，而非圍棋這類對戰遊戲的戰略，不過對於想要建置對戰遊戲戰略的讀者而言，本書的內容雖然基本，卻也能幫上不少忙。

讀者需具備的背景知識
本書的讀者應該都對強化學習、深度強化學習有興趣，卻不知道細節與建置的方法。要讀懂本書的內容需要具備下列三項知識：
．能看懂if、for陳述句
．能自訂方法（函數）
．了解向量與矩陣的乘法

換言之，只要具備粗淺的程式設計經驗以及初階的線性代數知識，就能讀懂本書的內容。本書使用的程式語言為Python。雖然本書的內容連Python初學者都能看得懂，但有時礙於版面，無法一一說明瑣碎的Python基礎知識，建議Python初學者可另行參考網路資訊或Python入門書。

配送方式

台灣
- 國內宅配：本島、離島
- 到店取貨：
  
  不限金額免運費
海外
- 國際快遞：全球
- 港澳店取：

詳細資料

- 語言
- 中文繁體
- 裝訂
- 紙本平裝
- ISBN
- 9789865021900
- 分級
- 普通級
- 頁數
- 256
- 商品規格
- 18開17*23cm
- 出版地
- 台灣
- 適讀年齡
- 全齡適讀
- 注音
- 級別

中文書＞電腦資訊＞APP開發/程式設計＞Python

商品評價

訂購/退換貨須知

加入金石堂 LINE 官方帳號『完成綁定』，隨時掌握出貨動態：

提醒您！！
金石堂及銀行均不會請您操作ATM! 如接獲電話要求您前往ATM提款機，請不要聽從指示，以免受騙上當！

退換貨須知：

**提醒您，鑑賞期不等於試用期，退回商品須為全新狀態**

依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」，以下商品購買後，除商品本身有瑕疵外，將不提供7天的猶豫期：
1. 易於腐敗、保存期限較短或解約時即將逾期。（如：生鮮食品）
2. 依消費者要求所為之客製化給付。（客製化商品）
3. 報紙、期刊或雜誌。（含MOOK、外文雜誌）
4. 經消費者拆封之影音商品或電腦軟體。
5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務，經消費者事先同意始提供。（如：電子書、電子雜誌、下載版軟體、虛擬商品…等）
6. 已拆封之個人衛生用品。（如：內衣褲、刮鬍刀、除毛刀…等）
若非上列種類商品，均享有到貨7天的猶豫期（含例假日）。
辦理退換貨時，商品（組合商品恕無法接受單獨退貨）必須是您收到商品時的原始狀態（包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等），請勿直接使用原廠包裝寄送，或於原廠包裝上黏貼紙張或書寫文字。
退回商品若無法回復原狀，將請您負擔回復原狀所需費用，嚴重時將影響您的退貨權益。

實戰人工智慧之深度強化學習|使用PyTorch x Python

內容簡介

作者

目錄

序／導讀

配送方式

詳細資料

詳細資料

商品評價

訂購/退換貨須知

加入金石堂 LINE 官方帳號『完成綁定』，隨時掌握出貨動態：

退換貨須知：