Metaphor

标签: offline-rl

此标签下有11条笔记。

  • 2026年5月02日

    离线强化学习

    • offline-rl
    • reinforcement-learning
  • 2026年5月17日

    可扩展多智能体RL:序列模型与新基准

    • multi-agent-rl
    • transformer
    • sequence-modeling
    • benchmark
    • scalable
    • offline-rl
  • 2026年5月17日

    非均匀覆盖下的Offline强化学习

    • reinforcement-learning
    • offline-rl
    • nonuniform-coverage
    • theoretical-ml
  • 2026年5月17日

    Offline RL统计复杂度与Minimax下界

    • reinforcement-learning
    • offline-rl
    • statistical-complexity
    • minimax-theory
  • 2026年5月17日

    Offline强化学习统计复杂度理论

    • reinforcement-learning
    • offline-rl
    • statistical-complexity
    • minimax-theory
    • function-approximation
  • 2026年5月16日

    Oryx - 可扩展多智能体序列模型

    • multi-agent-rl
    • sequence-modeling
    • scalable
    • offline-rl
    • coordination
  • 2026年5月05日

    离线强化学习理论新进展

    • reinforcement-learning
    • offline-rl
    • theoretical-ml
    • function-approximation
  • 2026年5月02日

    离线强化学习算法分类

    • offline-rl
    • reinforcement-learning
    • algorithm
    • cql
    • iql
  • 2026年5月02日

    Decision Transformer与序列建模方法

    • offline-rl
    • decision-transformer
    • sequence-modeling
    • transformer
  • 2026年5月02日

    离线强化学习简介

    • offline-rl
    • reinforcement-learning
    • distribution-shift
  • 2026年5月02日

    基于模型的离线强化学习

    • offline-rl
    • model-based-rl
    • mopo
    • combo

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community