Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: training-dynamics
此标签下有22条笔记。
2026年5月14日
多分形损失景观:分数阶扩散理论与训练动力学
deep-learning
loss-landscape
multifractal
fractional-diffusion
training-dynamics
2026年5月14日
训练动态与临界学习率:Edge of Stability
deep-learning
training-dynamics
critical-learning-rate
edge-of-stability
optimization
2026年5月08日
中心流:理解深度学习优化
central-flow
optimization
training-dynamics
edge-of-stability
adaptive-optimizer
theory
2026年5月08日
可证明ICL非线性回归学习
in-context-learning
transformer
theoretical-ml
training-dynamics
2026年5月08日
科学深度学习理论:学习力学框架
deep-learning-theory
learning-mechanics
scientific-theory
training-dynamics
macroscopic-observables
2026年5月08日
SGD到谱:神经网络权重的动力学理论
sgd
spectral-dynamics
random-matrix-theory
training-dynamics
weight-dynamics
dyson-brownian-motion
2026年5月08日
拓扑不变性与学习率临界点
topological-invariance
learning-rate-critical
bi-lipschitz
training-dynamics
theory
2026年5月05日
ICL学习动力学:线性Transformer的精确分析
in-context-learning
transformer
training-dynamics
theoretical-ml
2026年5月05日
Scaling Collapse与Supercollapse理论
scaling-laws
training-dynamics
neural-network
theoretical-ml
2026年5月05日
Scaling Collapse — 计算最优训练的普适动力学
scaling-laws
training-dynamics
neural-networks
optimization
2026年5月03日
神经热力学:深度学习中的熵力
deep-learning-theory
neural-thermodynamics
entropic-force
training-dynamics
2026年5月03日
有限宽度多层神经网络的精确梯度下降训练动力学
gradient-descent
finite-width
state-evolution
neural-network-theory
generalization-error
training-dynamics
2026年5月03日
稀疏MoE密集反向传播:Default MoE
machine-learning
mixture-of-experts
moe
training-dynamics
2026年5月03日
深度学习中的拓扑不变性
deep-learning-theory
topology
training-dynamics
optimization
2026年5月02日
深度学习中的熵力理论
deep-learning-theory
training-dynamics
entropy
parameter-symmetry
2026年5月02日
频率原则:深度学习训练的秘密
frequency-principle
neural-network-theory
training-dynamics
fourier-analysis
2026年5月02日
Grokking 的第一性原理理论
grokking
training-dynamics
generalization
phase-transition
2026年5月02日
深度学习中的相变现象
training-dynamics
phase-transition
deep-learning-theory
grokking
2026年5月02日
有限宽度网络的精确梯度下降动力学
deep-learning-theory
optimization
training-dynamics
2026年5月02日
Spectral Edge Thesis:深度学习训练的相变统一理论
training-dynamics
phase-transition
spectral-theory
deep-learning-theory
2026年5月01日
归一化与梯度流理论
normalization
gradient-flow
lipschitz
training-dynamics
deep-learning-theory
2026年5月01日
训练动力学:Edge of Stability理论与深度网络动态
training-dynamics
edge-of-stability
theory
optimization
deep-learning