Metaphor

标签: multi-token-prediction

此标签下有1条笔记。

  • 2026年5月12日

    Medusa:基于多Token预测的LLM推理加速

    • llm-inference
    • multi-token-prediction
    • speculative-decoding
    • acceleration

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community