2026 Q2 深度学习新进展专题索引

1. 概述

本轮扩充（第一百二十轮，2026-06-21）专注于深度学习领域的新进展：

任务核心要求：“针对现有架构/算法的新洞察、新观点”

围绕四大主题展开：

MeanFlow 与 Flow Map 家族生成建模（NeurIPS 2025 Oral + 2026 后续）
反向传播物理理论 2025-2026 新视角（Lagrangian、波散射、KL 投影）
Transformer×SSM 混合架构系统化（Meta FAIR 2026、Jamba-1.5 工业级）
测试时记忆学习统一理论（Titans、MIRAS、TTT）

2. 文档清单

2.1 MeanFlow 家族生成建模

文档	核心内容	链接
MeanFlow 一步生成建模	NeurIPS 2025 Oral 核心论文解读	meanflow-one-step-generative-modeling
Flow Map 家族对比	Diffusion/FM/CM/MeanFlow 系统对比	flow-map-family-comparison
MeanFlow 2026 后续进展	工业部署、训练动力学、多模态扩展	meanflow-2026-advances

2.2 反向传播物理理论新视角

文档	核心内容	链接
反向传播物理理论 2026 新视角	Lagrangian 学习、波散射、KL 投影	backprop-physics-2026-new-perspectives

2.3 混合架构系统化

文档	核心内容	链接
混合架构系统化分析	Meta FAIR 2026 系统性消融	hybrid-architecture-systematic-analysis
Jamba-1.5 工业级深度解析	94B/398B 三合一混合架构	jamba-1-5-deep-dive

2.4 测试时记忆学习统一理论

文档	核心内容	链接
测试时记忆学习统一理论	TTT/Titans/MIRAS 综合视角	test-time-memory-unified-theory

3. 核心论文

3.1 生成建模（3 篇核心）

MeanFlow (NeurIPS 2025 Oral) - arXiv:2505.13447
Flow Map Self-Distillation - arXiv:2505.18825
Consistency Flow Matching (ICLR 2025) - arXiv:2407.02398

3.2 反向传播物理理论（5 篇核心）

Lagrangian Learning (ICLR 2026) - arXiv:2509.21049
Wave Scattering BP (2026) - arXiv:2602.10461
KL Projections BP (2026) - arXiv:2512.24335
Lagrangian EP (2025) - arXiv:2505.07363
HEL Equivalence (2025) - arXiv:2506.06248

3.3 混合架构（3 篇核心）

Meta Hybrid Analysis (2026) - arXiv:2510.04800
Jamba-1.5 (ICLR 2025) - arXiv:2408.12570
Mamba-3 (ICLR 2026 Oral) - arXiv:2603.15569

3.4 测试时记忆学习（4 篇核心）

Titans (NeurIPS 2025) - arXiv:2501.00663
MIRAS (2025) - arXiv:2504.13173
TTT Provably Improves ICL (ICML 2025) - PMLR 267:20266
TTT Done Right (2025) - arXiv:2505.23884

4. 学习路径建议

4.1 入门路径（建议顺序）

MeanFlow 一步生成建模（生成建模前沿）
混合架构系统化分析（架构设计前沿）
反向传播物理理论 2026 新视角（理论前沿）
测试时记忆学习统一理论（学习范式前沿）

4.2 进阶路径

完成入门路径后，建议深入以下文档：

Flow Map 家族对比（生成建模理论体系）
Jamba-1.5 工业级深度解析（工业部署实践）
MeanFlow 2026 后续进展（前沿研究动态）

4.3 研究路径

如需进一步研究，建议按主题分组阅读原始论文：

主题 1：少步生成

MeanFlow → Flow Map Self-Distillation → Consistency Flow Matching

主题 2：物理学习

Lagrangian Learning → Wave Scattering → KL Projections → Lagrangian EP

主题 3：混合架构设计

Meta Hybrid Analysis → Jamba-1.5 → Mamba-3

主题 4：测试时学习

TTT → Titans → MIRAS → TTT Provably Improves

5. 与现有 Wiki 主题的连接

5.1 生成建模

5.2 反向传播物理理论

5.3 混合架构

5.4 测试时记忆

6. 本轮成果统计

新增文档：7 个
总行数：约 9000+ 行
核心论文：15+ 篇 NeurIPS/ICML/ICLR/COLM/CVPR 2025-2026
代码实现：约 2000+ 行 PyTorch 代码
核心主题：四个互补的”新进展”主题

7. 后续可能方向

7.1 高优先级

V-JEPA 2 / LeJEPA 详解（自监督学习新范式）
Mamba-3 完整架构详解（与现有分散文档互补）
Hopfield 注意力等价深度扩展（与现有 wiki 整合）

7.2 中优先级

Muon 优化器深度理论（工业部署优化器）
JEPA 与世界模型融合（自监督与世界模型）
MeanFlow 在视频生成的应用（DiT-MeanFlow）

7.3 低优先级

稀疏注意力家族综述（NSA、BigBird 等）
多模态扩散 LM（LLaDA、Transfusion）
Hopfield 网络与深度学习整合

Last updated: 2026-06-21