Metaphor

标签: sparse-attention

此标签下有5条笔记。

  • 2026年5月08日

    Condensate Theorem(冷凝定理):注意力稀疏性的拓扑本质

    • attention-mechanism
    • sparse-attention
    • condensate-theorem
    • topological-attention
    • transformer-theory
    • efficiency
  • 2026年5月08日

    稀疏注意力的Trade-offs:Transformer大语言模型实证研究

    • sparse-attention
    • transformer
    • llm
    • long-context
    • efficiency
    • kv-cache
  • 2026年5月04日

    注意力机制变体综合对比

    • attention
    • transformer
    • efficiency
    • sparse-attention
    • comparison
  • 2026年5月02日

    长视频理解

    • long-video
    • video-understanding
    • sparse-attention
    • memory-mechanism
    • temporal-modeling
  • 2026年5月01日

    稀疏注意力与长度外推

    • attention
    • sparse-attention
    • length-extrapolation
    • transformer
    • long-context

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community