Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: llm-inference
此标签下有4条笔记。
2026年5月12日
EAGLEY:连续验证的Speculative Decoding
speculative-decoding
llm-inference
verification
inference-optimization
2026年5月12日
LLM推理加速方法综合指南(2025)
llm-inference
inference-optimization
acceleration
kv-cache
quantization
speculative-decoding
long-context
2026年5月12日
Medusa:基于多Token预测的LLM推理加速
llm-inference
multi-token-prediction
speculative-decoding
acceleration
2026年5月12日
Speculative Decoding理论:LLM推理加速
speculative-decoding
llm-inference
autoregressive-generation
inference-optimization