Metaphor

标签: model-scaling

此标签下有1条笔记。

  • 2026年5月03日

    Nexusformer:非线性注意力扩展与稳定可继承的Transformer缩放

    • transformer
    • attention
    • nonlinear-attention
    • model-scaling
    • architecture

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community