返回书架
强化学习领域的奠基性教材,系统介绍马尔可夫决策过程、动态规划、蒙特卡洛方法、时序差分学习及深度强化学习等核心内容。
强化学习机器学习教材
与作者对话
假如书会说话与作者对话
《Reinforcement Learning: An Introduction(第二版)》
Richard S. Sutton, Andrew G. Barto
选一个开始,或直接输入自己的问题
或直接问 Richard S. Sutton, Andrew G. Barto
这段对话
核心观点3 条
1
提出了强化学习区别于其他机器学习范式的核心思想
2
清晰阐述了探索与利用、值函数与策略之间的权衡
3
介绍了从表格方法到函数逼近、深度Q网络的发展脉络
读者笔记
还没有笔记,成为第一个分享感悟的人
《Reinforcement Learning: An Introduction(第二版)》读书笔记 · Richard S. Sutton, Andrew G. Barto
强化学习领域的奠基性教材,系统介绍马尔可夫决策过程、动态规划、蒙特卡洛方法、时序差分学习及深度强化学习等核心内容。
3 条核心观点
- 提出了强化学习区别于其他机器学习范式的核心思想
- 清晰阐述了探索与利用、值函数与策略之间的权衡
- 介绍了从表格方法到函数逼近、深度Q网络的发展脉络
以上是《Reinforcement Learning: An Introduction(第二版)》(Richard S. Sutton, Andrew G. Barto著)的核心观点AI解读。点击上方「与作者对话」,可以直接向Richard S. Sutton, Andrew G. Barto提问,深入了解这本书。