Metaphor

标签: efficiency

此标签下有10条笔记。

  • 2026年5月17日

    NOBLE - 非线性低秩分支加速Transformer

    • transformer
    • efficiency
    • low-rank
    • acceleration
  • 2026年5月16日

    KV Cache压缩技术综述

    • kv-cache
    • llm
    • model-compression
    • efficiency
  • 2026年5月16日

    LeanKV - 统一KV缓存压缩框架

    • kv-cache
    • unified-framework
    • compression
    • efficiency
  • 2026年5月16日

    测试时缩放高原现象分析

    • test-time-compute
    • scaling-plateau
    • efficiency
    • marginal-diminishing
  • 2026年5月08日

    Condensate Theorem(冷凝定理):注意力稀疏性的拓扑本质

    • attention-mechanism
    • sparse-attention
    • condensate-theorem
    • topological-attention
    • transformer-theory
    • efficiency
  • 2026年5月08日

    稀疏注意力的Trade-offs:Transformer大语言模型实证研究

    • sparse-attention
    • transformer
    • llm
    • long-context
    • efficiency
    • kv-cache
  • 2026年5月04日

    注意力机制变体综合对比

    • attention
    • transformer
    • efficiency
    • sparse-attention
    • comparison
  • 2026年5月04日

    FlashAttention深度解析

    • attention
    • transformer
    • efficiency
    • io-complexity
  • 2026年5月03日

    SpecReason:推测推理

    • test-time-compute
    • reasoning
    • speculative-reasoning
    • efficiency
  • 2026年5月01日

    注意力矩阵低秩压缩与 KV Cache 优化

    • attention
    • kv-cache
    • low-rank-compression
    • svd
    • efficiency

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community