Metaphor

标签: llm-alignment

此标签下有6条笔记。

  • 2026年5月17日

    GRPO理论基础与LLM对齐

    • reinforcement-learning
    • grpo
    • llm-alignment
    • policy-gradient
  • 2026年5月05日

    RLHF奖励建模新进展

    • reinforcement-learning
    • rlhf
    • reward-modeling
    • llm-alignment
  • 2026年5月02日

    代理调优与线性对齐方法

    • proxy-tuning
    • linear-alignment
    • llm-alignment
    • decoding-time
  • 2026年5月02日

    无训练In-Decoding对齐方法

    • llm-alignment
    • training-free
    • inference-time
    • in-decoding
  • 2026年5月02日

    训练无关的后解码对齐方法

    • llm-alignment
    • training-free
    • post-decoding
    • safety
  • 2026年4月30日

    RLHF:人类反馈强化学习

    • reinforcement-learning
    • rlhf
    • llm-alignment
    • instructgpt

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community