Metaphor

标签: speculative-decoding

此标签下有6条笔记。

  • 2026年5月12日

    EAGLEY:连续验证的Speculative Decoding

    • speculative-decoding
    • llm-inference
    • verification
    • inference-optimization
  • 2026年5月12日

    LLM推理加速方法综合指南(2025)

    • llm-inference
    • inference-optimization
    • acceleration
    • kv-cache
    • quantization
    • speculative-decoding
    • long-context
  • 2026年5月12日

    Medusa:基于多Token预测的LLM推理加速

    • llm-inference
    • multi-token-prediction
    • speculative-decoding
    • acceleration
  • 2026年5月12日

    Speculative Decoding理论:LLM推理加速

    • speculative-decoding
    • llm-inference
    • autoregressive-generation
    • inference-optimization
  • 2026年5月11日

    LLM推理优化

    • llm
    • inference-optimization
    • kv-cache
    • quantization
    • speculative-decoding
    • long-context
  • 2026年5月05日

    LLM推理策略:推理能力提升方法

    • llm
    • inference
    • reasoning
    • test-time-compute
    • tree-search
    • speculative-decoding

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community