Metaphor

标签: offline-rl

此标签下有5条笔记。

  • 2026年5月02日

    离线强化学习

    • offline-rl
    • reinforcement-learning
  • 2026年5月02日

    离线强化学习算法分类

    • offline-rl
    • reinforcement-learning
    • algorithm
    • cql
    • iql
  • 2026年5月02日

    Decision Transformer与序列建模方法

    • offline-rl
    • decision-transformer
    • sequence-modeling
    • transformer
  • 2026年5月02日

    离线强化学习简介

    • offline-rl
    • reinforcement-learning
    • distribution-shift
  • 2026年5月02日

    基于模型的离线强化学习

    • offline-rl
    • model-based-rl
    • mopo
    • combo

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community