Metaphor

标签: exploration

此标签下有2条笔记。

  • 2026年5月05日

    探索与利用权衡

    • reinforcement-learning
    • exploration
    • exploitation
    • bandits
  • 2026年5月05日

    最大熵强化学习理论

    • reinforcement-learning
    • maximum-entropy
    • theory
    • exploration

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community