Metaphor

标签: efficiency

此标签下有11条笔记。

2026年6月20日
高级GRPO变体综述：Latent-GRPO、SPPO、BPPO与LamPO
2026年5月17日
NOBLE - 非线性低秩分支加速Transformer
2026年5月16日
KV Cache压缩技术综述
2026年5月16日
LeanKV - 统一KV缓存压缩框架
2026年5月16日
测试时缩放高原现象分析
2026年5月08日
Condensate Theorem（冷凝定理）：注意力稀疏性的拓扑本质
2026年5月08日
稀疏注意力的Trade-offs：Transformer大语言模型实证研究
2026年5月04日
注意力机制变体综合对比
2026年5月04日
FlashAttention深度解析
2026年5月03日
SpecReason：推测推理
2026年5月01日
注意力矩阵低秩压缩与 KV Cache 优化

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community