2026 Q2 深度学习新进展专题索引
1. 概述
本轮扩充(第一百二十轮,2026-06-21)专注于深度学习领域的新进展:
任务核心要求:“针对现有架构/算法的新洞察、新观点”
围绕四大主题展开:
- MeanFlow 与 Flow Map 家族生成建模(NeurIPS 2025 Oral + 2026 后续)
- 反向传播物理理论 2025-2026 新视角(Lagrangian、波散射、KL 投影)
- Transformer×SSM 混合架构系统化(Meta FAIR 2026、Jamba-1.5 工业级)
- 测试时记忆学习统一理论(Titans、MIRAS、TTT)
2. 文档清单
2.1 MeanFlow 家族生成建模
| 文档 | 核心内容 | 链接 |
|---|---|---|
| MeanFlow 一步生成建模 | NeurIPS 2025 Oral 核心论文解读 | meanflow-one-step-generative-modeling |
| Flow Map 家族对比 | Diffusion/FM/CM/MeanFlow 系统对比 | flow-map-family-comparison |
| MeanFlow 2026 后续进展 | 工业部署、训练动力学、多模态扩展 | meanflow-2026-advances |
2.2 反向传播物理理论新视角
| 文档 | 核心内容 | 链接 |
|---|---|---|
| 反向传播物理理论 2026 新视角 | Lagrangian 学习、波散射、KL 投影 | backprop-physics-2026-new-perspectives |
2.3 混合架构系统化
| 文档 | 核心内容 | 链接 |
|---|---|---|
| 混合架构系统化分析 | Meta FAIR 2026 系统性消融 | hybrid-architecture-systematic-analysis |
| Jamba-1.5 工业级深度解析 | 94B/398B 三合一混合架构 | jamba-1-5-deep-dive |
2.4 测试时记忆学习统一理论
| 文档 | 核心内容 | 链接 |
|---|---|---|
| 测试时记忆学习统一理论 | TTT/Titans/MIRAS 综合视角 | test-time-memory-unified-theory |
3. 核心论文
3.1 生成建模(3 篇核心)
- MeanFlow (NeurIPS 2025 Oral) - arXiv:2505.13447
- Flow Map Self-Distillation - arXiv:2505.18825
- Consistency Flow Matching (ICLR 2025) - arXiv:2407.02398
3.2 反向传播物理理论(5 篇核心)
- Lagrangian Learning (ICLR 2026) - arXiv:2509.21049
- Wave Scattering BP (2026) - arXiv:2602.10461
- KL Projections BP (2026) - arXiv:2512.24335
- Lagrangian EP (2025) - arXiv:2505.07363
- HEL Equivalence (2025) - arXiv:2506.06248
3.3 混合架构(3 篇核心)
- Meta Hybrid Analysis (2026) - arXiv:2510.04800
- Jamba-1.5 (ICLR 2025) - arXiv:2408.12570
- Mamba-3 (ICLR 2026 Oral) - arXiv:2603.15569
3.4 测试时记忆学习(4 篇核心)
- Titans (NeurIPS 2025) - arXiv:2501.00663
- MIRAS (2025) - arXiv:2504.13173
- TTT Provably Improves ICL (ICML 2025) - PMLR 267:20266
- TTT Done Right (2025) - arXiv:2505.23884
4. 学习路径建议
4.1 入门路径(建议顺序)
- MeanFlow 一步生成建模(生成建模前沿)
- 混合架构系统化分析(架构设计前沿)
- 反向传播物理理论 2026 新视角(理论前沿)
- 测试时记忆学习统一理论(学习范式前沿)
4.2 进阶路径
完成入门路径后,建议深入以下文档:
- Flow Map 家族对比(生成建模理论体系)
- Jamba-1.5 工业级深度解析(工业部署实践)
- MeanFlow 2026 后续进展(前沿研究动态)
4.3 研究路径
如需进一步研究,建议按主题分组阅读原始论文:
主题 1:少步生成
- MeanFlow → Flow Map Self-Distillation → Consistency Flow Matching
主题 2:物理学习
- Lagrangian Learning → Wave Scattering → KL Projections → Lagrangian EP
主题 3:混合架构设计
- Meta Hybrid Analysis → Jamba-1.5 → Mamba-3
主题 4:测试时学习
- TTT → Titans → MIRAS → TTT Provably Improves
5. 与现有 Wiki 主题的连接
5.1 生成建模
5.2 反向传播物理理论
5.3 混合架构
5.4 测试时记忆
6. 本轮成果统计
- 新增文档:7 个
- 总行数:约 9000+ 行
- 核心论文:15+ 篇 NeurIPS/ICML/ICLR/COLM/CVPR 2025-2026
- 代码实现:约 2000+ 行 PyTorch 代码
- 核心主题:四个互补的”新进展”主题
7. 后续可能方向
7.1 高优先级
- V-JEPA 2 / LeJEPA 详解(自监督学习新范式)
- Mamba-3 完整架构详解(与现有分散文档互补)
- Hopfield 注意力等价深度扩展(与现有 wiki 整合)
7.2 中优先级
- Muon 优化器深度理论(工业部署优化器)
- JEPA 与世界模型融合(自监督与世界模型)
- MeanFlow 在视频生成的应用(DiT-MeanFlow)
7.3 低优先级
- 稀疏注意力家族综述(NSA、BigBird 等)
- 多模态扩散 LM(LLaDA、Transfusion)
- Hopfield 网络与深度学习整合
Last updated: 2026-06-21