Metaphor

标签: convergence-theory

此标签下有4条笔记。

  • 2026年5月17日

    策略梯度方法全局收敛理论

    • reinforcement-learning
    • policy-gradient
    • convergence-theory
    • average-reward-mdp
  • 2026年5月17日

    PPO收敛性理论 全局收敛与Fisher-Rao几何

    • reinforcement-learning
    • ppo
    • convergence-theory
    • optimization
    • fisher-rao
  • 2026年5月17日

    PPO Fisher-Rao几何理论与全局收敛性

    • reinforcement-learning
    • ppo
    • policy-gradient
    • convergence-theory
  • 2026年5月10日

    自适应优化器收敛性理论

    • optimization
    • adaptive-optimizer
    • convergence-theory
    • adam
    • deep-learning-theory

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community