书籍作者:小川雄太郎(Yutaro ogawa)著,申富饶 于僡 译 | ISBN:9787111650140 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:9955 |
创建日期:2021-02-14 | 发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
边做边学深度强化学习:PyTorch程序设计实践 [つくりながら学ぶ!深層強化学習 PyTorchによる実践プログラミング]
读者只需要具备一些基本的编程经验和基本的线性代数知识即可,指导读者以PyTorch为工具实践深度强化学习。
Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的 GPU 能力,提供极高的灵活性和速度。本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现。、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。
适读人群 :本书面向普通大众,指导读者以PyTorch为工具,在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。
本书面向普通大众,指导读者以PyTorch为工具,在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。
本书内容:
介绍监督学习、非监督学习和强化学习的基本知识。
通过走迷宫任务介绍三种不同的算法(策略梯度法、Sarsa和Q学习)。
使用Anaconda设置本地PC,在倒立摆任务中实现强化学习。
使用PyTorch实现MNIST手写数字分类任务。
实现深度强化学习的最基本算法DQN。
解释继DQN之后提出的新的深度强化学习技术(DDQN、Dueling Network、优先经验回放和A2C等)。
使用GPU与AWS构建深度学习环境,采用A2C再现消砖块游戏。