Metaphor

标签: second-order

此标签下有2条笔记。

  • 2026年5月03日

    Transformer Full Block Hessian Analysis

    • transformer
    • hessian
    • optimization
    • layer-normalization
    • second-order
    • convergence
  • 2026年4月30日

    二阶优化方法

    • optimization
    • second-order
    • kfac
    • natural-gradient

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community