Quartz 4
Search
Search
Dark mode
Light mode
Explorer
Home
❯
ai
❯
rl
Folder: ai/rl
11 items under this folder.
Oct 13, 2025
1-基本概念
rl
Oct 13, 2025
10-Actor-Critic方法
Oct 13, 2025
2-贝尔曼公式
rl
Oct 13, 2025
3-贝尔曼最优公式
rl
Oct 13, 2025
4-值迭代与策略迭代
rl
Oct 13, 2025
5-蒙特卡洛方法
rl
Oct 13, 2025
6-随机近似与随机梯度下降
Oct 13, 2025
7-时序差分方法
Oct 13, 2025
8-值函数近似
Oct 13, 2025
9-策略梯度方法
Oct 13, 2025
强化学习大纲