猜你喜欢
用Python动手学强化学习

用Python动手学强化学习

书籍作者:久保隆宏 ISBN:9787115564221
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6110
创建日期:2021-10-07 发布日期:2021-10-07
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

从基础到应用:一本书快速入门

基本概念×算法详解×前沿应用×弱点及对策

基于Python实现:直观理解运作过程

132张图表×大量示例:通俗易懂

源代码可下载

1.系统全面

涵盖从基本概念到前沿应用的各种知识,系统整理强化学习的研究体系。

2.实践导向

从实用性出发设计示例代码,并介绍强化学习的弱点及克服方法,以使读者能够将强化学习应用到工作中。

3.有趣有料

没有枯燥的公式推导,借助132张全彩图、大量示例和可以直接运行的代码,将强化学习问题化繁为简,即使是初学者也可轻松读懂。

作者简介

[日]久保隆宏(作者)

任职于日本大型系统集成商TIS,具有丰富的机器学习研究和开发经验。论文共享网站站arXivTimes运营者,积极致力于技术普及,著有《TensorFlow应用指南》(合著)。

梁垿(译者)

硕士毕业于日本早稻田大学,研究方向为机器学习。目前在日本大型系统集成商TIS任自然语言处理工程师。热爱长跑与读书,喜欢科幻、蒸汽朋克、克苏鲁等题材的作品。

程引(译者)

工学博士学位,毕业于上海交通大学。目前在日本BizReach公司(Visional Group)AI部门任算法工程师。业务方向为推荐系统与自然语言处理,研究兴趣包括强化学习与自动控制。

目录
1.1 强化学习与各关键词之间的关系 1
1.2 强化学习的优点和弱点 8
1.3 强化学习的问题设定:马尔可夫决策过程 9
第 2章 强化学习的解法(1):根据环境制订计划 21
2.1 价值的定义和计算:贝尔曼方程 22
2.2 基于动态规划法的价值近似的学习:价值迭代 28
· · · · · · ()
短评

好评

2021-07-21 13:37:56

good book for reinforced learning

2021-07-19 10:18:58