Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: llm-alignment
此标签下有6条笔记。
2026年5月17日
GRPO理论基础与LLM对齐
reinforcement-learning
grpo
llm-alignment
policy-gradient
2026年5月05日
RLHF奖励建模新进展
reinforcement-learning
rlhf
reward-modeling
llm-alignment
2026年5月02日
代理调优与线性对齐方法
proxy-tuning
linear-alignment
llm-alignment
decoding-time
2026年5月02日
无训练In-Decoding对齐方法
llm-alignment
training-free
inference-time
in-decoding
2026年5月02日
训练无关的后解码对齐方法
llm-alignment
training-free
post-decoding
safety
2026年4月30日
RLHF:人类反馈强化学习
reinforcement-learning
rlhf
llm-alignment
instructgpt