Metaphor

标签: depth-scaling

此标签下有3条笔记。

  • 2026年5月17日

    Post-LayerNorm回归 - Keel深度模型架构

    • transformer
    • layer-norm
    • depth-scaling
    • architecture
  • 2026年5月03日

    CompleteP Transformer Parameterization

    • transformer
    • parameterization
    • hyperparameter-transfer
    • lazy-learning
    • depth-scaling
  • 2026年5月02日

    Keel:深度可扩展Transformer与Highway连接

    • transformer
    • architecture
    • depth-scaling
    • highway-network

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community