Metaphor

标签: llm-inference

此标签下有4条笔记。

  • 2026年5月12日

    EAGLEY:连续验证的Speculative Decoding

    • speculative-decoding
    • llm-inference
    • verification
    • inference-optimization
  • 2026年5月12日

    LLM推理加速方法综合指南(2025)

    • llm-inference
    • inference-optimization
    • acceleration
    • kv-cache
    • quantization
    • speculative-decoding
    • long-context
  • 2026年5月12日

    Medusa:基于多Token预测的LLM推理加速

    • llm-inference
    • multi-token-prediction
    • speculative-decoding
    • acceleration
  • 2026年5月12日

    Speculative Decoding理论:LLM推理加速

    • speculative-decoding
    • llm-inference
    • autoregressive-generation
    • inference-optimization

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community