Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: efficiency
此标签下有10条笔记。
2026年5月17日
NOBLE - 非线性低秩分支加速Transformer
transformer
efficiency
low-rank
acceleration
2026年5月16日
KV Cache压缩技术综述
kv-cache
llm
model-compression
efficiency
2026年5月16日
LeanKV - 统一KV缓存压缩框架
kv-cache
unified-framework
compression
efficiency
2026年5月16日
测试时缩放高原现象分析
test-time-compute
scaling-plateau
efficiency
marginal-diminishing
2026年5月08日
Condensate Theorem(冷凝定理):注意力稀疏性的拓扑本质
attention-mechanism
sparse-attention
condensate-theorem
topological-attention
transformer-theory
efficiency
2026年5月08日
稀疏注意力的Trade-offs:Transformer大语言模型实证研究
sparse-attention
transformer
llm
long-context
efficiency
kv-cache
2026年5月04日
注意力机制变体综合对比
attention
transformer
efficiency
sparse-attention
comparison
2026年5月04日
FlashAttention深度解析
attention
transformer
efficiency
io-complexity
2026年5月03日
SpecReason:推测推理
test-time-compute
reasoning
speculative-reasoning
efficiency
2026年5月01日
注意力矩阵低秩压缩与 KV Cache 优化
attention
kv-cache
low-rank-compression
svd
efficiency