Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: preference-learning
此标签下有2条笔记。
2026年5月14日
因果逆强化学习与约束推断
causal-reinforcement-learning
inverse-reinforcement-learning
constraint-inference
causal-irl
preference-learning
2026年5月08日
Constitutional AI 2025新进展
constitutional-ai
ai-alignment
llm-safety
preference-learning