Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: convergence-theory
此标签下有4条笔记。
2026年5月17日
策略梯度方法全局收敛理论
reinforcement-learning
policy-gradient
convergence-theory
average-reward-mdp
2026年5月17日
PPO收敛性理论 全局收敛与Fisher-Rao几何
reinforcement-learning
ppo
convergence-theory
optimization
fisher-rao
2026年5月17日
PPO Fisher-Rao几何理论与全局收敛性
reinforcement-learning
ppo
policy-gradient
convergence-theory
2026年5月10日
自适应优化器收敛性理论
optimization
adaptive-optimizer
convergence-theory
adam
deep-learning-theory