反向传播物理理论索引
1. 概述
2026 年涌现的反向传播物理理论新视角,将深度学习训练与经典力学、PDE 理论、Hamilton-Jacobi 方程等建立严格联系。本索引系统整理相关工作、核心概念与跨文档关系。
2. 核心工作
2.1 Lagrangian 视角:反向传播作为物理松弛
[[backpropagation-physical-theory|反向传播的物理理论]]:
Scurria (2026) 证明标准 BP 是对偶状态空间上鞍点动力学的单位步长 Euler 离散化,对 层网络在 步内精确恢复。
核心贡献:
- 对偶状态空间 上的全局能量泛函
- 非保守系统的 Lagrangian 理论处理非对称权重
- 精确有限时间梯度(无需近似)
- 无全局时钟的物理可行性
2.2 Hamilton-Jacobi 视角:神经网络作为 PDE
[[../math/hamilton-jacobi-deep-learning|Hamilton-Jacobi 深度学习理论]]:
Miñoza et al. (2026) 证明训练好的神经网络就是 Hamilton-Jacobi 初值问题,单一参数 统一网络/热带代数/PDE/凸优化四个视角。
核心贡献:
- log-sum-exp 层作为 Maslov 退量化的精确实现
- Hopf-Cole 线性化连接 LSE 与黏性 PDE
- 统一交换图:四个视角通过同一 严格连接
- 现代架构(Transformer、ResNet、RNN、SSM)的 PDE 解释
3. 互补关系
| 维度 | 反向传播物理理论 | Hamilton-Jacobi 理论 |
|---|---|---|
| 核心数学 | Lagrangian 力学 | Hamilton-Jacobi PDE |
| 状态空间 | 对偶 | 正向 + 协态 |
| 动力学 | 鞍点松弛 | Hamiltonian 流 |
| 变换 | — | Legendre 变换( Lagrangian ↔ Hamiltonian) |
| 视角 | 离散-连续桥接 | 代数-PDE 桥接 |
| 应用 | 神经形态硬件、生物可信 | 架构设计、 调节 |
关键观察:两者通过 Legendre 变换互相等价,提供反向传播的完整物理理论。
4. 学习路径
4.1 入门路径
- BP 基础:
[[backpropagation|反向传播]] - 梯度流:
[[backpropagation-gradient-flow-theory|反向传播与梯度流理论]] - 物理反传:
[[backpropagation-physical-theory|反向传播的物理理论]] - HJ 理论:
[[../math/hamilton-jacobi-deep-learning|Hamilton-Jacobi 深度学习理论]]
4.2 进阶路径
- 入门路径完成
- 神经 ODE:
[[../machine-learning/neural-odes-continuous-depth-networks|神经 ODE]] - ResNet 哈密顿:
[[../machine-learning/resnet-hamiltonian-feature-learning|ResNet 哈密顿特征学习]] - 神经热力学:
[[../machine-learning/neural-thermodynamics-statistical-physics|神经热力学]]
5. 相关工作
5.1 其他物理视角
| 视角 | 工作 | 关系 |
|---|---|---|
| 神经 ODE | Chen et al. 2018 | 连续深度网络的 ODE 化 |
| Neural ODE 哈密顿 | ICML 2025 等 | 残差网络作为 ODE 离散 |
| 统计物理 | 神经热力学 | 自由能 ↔ HJ 值函数 |
| 量子物理 | — | 反传作为量子演化 |
5.2 历史脉络
- 2017:Equilibrium Propagation(保守系统)
- 2018:Neural ODE(连续深度)
- 2024-2025:神经形态硬件推动物理反传研究
- 2026:物理反传与 HJ 理论系统性建立
6. 核心概念速查
6.1 Lagrangian ↔ Hamiltonian
其中 。
6.2 鞍点动力学
- 前向 沿下降方向 → 推理
- 反向 沿上升方向 → 信用分配
6.3 Maslov 退量化
6.4 Hopf-Cole 变换
6.5 Pontryagin 最大值原理
ResNet 的反向传播 = Hamiltonian 系统的协态方程
7. 应用
7.1 神经形态硬件
- 物理反传:可在物理系统(光、量子、模拟电路)中实现
- HJ 理论:可通过 PDE 求解器实现网络
7.2 架构设计
- 调节:控制鲁棒性-精度权衡
- 温度退火:训练策略的物理基础
- 灾难性遗忘:fold bifurcation 的物理解释
7.3 训练策略
- 优化器设计:从物理原理推导新方法
- 学习率调度:HJ 视角的最优调度
- 正则化:黏性系数作为正则化强度
8. 关键论文清单
| 论文 | arXiv | 核心贡献 |
|---|---|---|
| Backpropagation as Physical Relaxation | arXiv:2602.02281 | 对偶状态空间、 步精确恢复 |
| Equilibrium Propagation for Non-Conservative | arXiv:2602.03670 | EP 扩展到非保守系统 |
| Hamilton-Jacobi Theory of DL | arXiv:2605.28983 | 统一理论 |
9. 未来方向
9.1 短期
- 在神经形态硬件实现物理反传
- 基于 HJ 理论设计新架构
- 探索 调度算法
9.2 中期
- 物理反传与生物学习的对应
- HJ 视角下的优化器理论
- 与量子机器学习的联系
9.3 长期
- 通用物理学习理论
- 跨学科融合(物理 + 神经科学 + AI)
10. 相关 Wiki 主题
[[backpropagation-algorithm|反向传播算法]]- 基础算法[[../machine-learning/autodiff/index|自动微分索引]]- AD 框架[[../machine-learning/neural-odes-continuous-depth-networks|神经 ODE]][[../machine-learning/resnet-hamiltonian-feature-learning|ResNet 哈密顿特征学习]][[../machine-learning/energy-based-models-deep-learning|能量基础模型]][[../machine-learning/neural-thermodynamics-statistical-physics|神经热力学]]
Last updated: 2026-06-21