Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: offline-rl
此标签下有11条笔记。
2026年5月02日
离线强化学习
offline-rl
reinforcement-learning
2026年5月17日
可扩展多智能体RL:序列模型与新基准
multi-agent-rl
transformer
sequence-modeling
benchmark
scalable
offline-rl
2026年5月17日
非均匀覆盖下的Offline强化学习
reinforcement-learning
offline-rl
nonuniform-coverage
theoretical-ml
2026年5月17日
Offline RL统计复杂度与Minimax下界
reinforcement-learning
offline-rl
statistical-complexity
minimax-theory
2026年5月17日
Offline强化学习统计复杂度理论
reinforcement-learning
offline-rl
statistical-complexity
minimax-theory
function-approximation
2026年5月16日
Oryx - 可扩展多智能体序列模型
multi-agent-rl
sequence-modeling
scalable
offline-rl
coordination
2026年5月05日
离线强化学习理论新进展
reinforcement-learning
offline-rl
theoretical-ml
function-approximation
2026年5月02日
离线强化学习算法分类
offline-rl
reinforcement-learning
algorithm
cql
iql
2026年5月02日
Decision Transformer与序列建模方法
offline-rl
decision-transformer
sequence-modeling
transformer
2026年5月02日
离线强化学习简介
offline-rl
reinforcement-learning
distribution-shift
2026年5月02日
基于模型的离线强化学习
offline-rl
model-based-rl
mopo
combo