TAGS
7 PAGE
强化学习数学基础
7-TD-learning(上半部分)
6-随机近似与随机梯度下降
5-蒙特卡洛方法(Monte Carlo)
4-值迭代与策略迭代
3-贝尔曼最优公式
2-贝尔曼公式
1-强化学习基本概念