连续神经网络专题索引
目录
专题介绍
什么是连续神经网络
连续神经网络(Continuous Neural Networks)是一类将神经网络视为连续函数表示的模型范式。与传统离散层堆叠的神经网络不同,连续神经网络的核心思想是:
- 函数即网络:将整个网络看作从输入到输出的连续函数映射
- 坐标感知:通过坐标输入直接查询连续空间中的信号值
- 连续性先验:利用连续性假设建模自然信号(图像、声音、3D场景等)
这种范式与以下领域密切相关:
| 领域 | 核心思想 | 代表工作 |
|---|---|---|
| 隐式神经表示 | 用神经网络表示任意连续信号 | INR, SIREN, NeRF |
| 神经微分方程 | 将网络层视为连续时间演化 | Neural ODE, ResNet as ODE |
| 液态神经网络 | 动态适应输入的连续状态模型 | LNN, Liquid Time-Constant Networks |
核心优势
连续神经网络相比传统离散表示具有以下优势:
- 分辨率无关:可表示任意分辨率的信号,不受网格限制
- 紧凑表示:参数数量与信号分辨率无关
- 自然可微:查询过程天然可微,便于端到端优化
- 拓扑灵活:可以表示任意拓扑结构的信号
内容导航
隐式神经表示(INR)系列
隐式神经表示(Implicit Neural Representations, INR)是连续神经网络的基础范式。它将信号表示为神经网络权重,通过坐标输入查询连续空间中的信号值。
核心资源:
- 隐式神经表示详解:INR的基础理论、优势对比、应用场景
核心思想:
将离散信号 表示为连续函数 ,其中 是网络参数。
SIREN正弦激活网络
SIREN(SInusoidal REpresentation Networks)是隐式表示领域的重要突破,引入了周期激活函数来增强网络表示高频信号的能力。
核心资源:
- SIREN网络详解:正弦激活的理论基础、梯度特性、代码实现
关键洞察:
标准ReLU激活无法精确表示梯度信息,而SIREN的正弦激活满足:
这使得网络能够精确地建模导数关系,非常适合需要物理约束的任务。
NeRF神经辐射场
NeRF(Neural Radiance Fields)是将隐式表示应用于3D场景重建的里程碑工作。它使用神经网络从多视角图像中学习3D场景的连续表示。
核心概念:
- ** volumetric rendering**:通过体积渲染从隐式表示生成图像
- 位置编码:对输入坐标使用高频编码增强表达能力
- 射线行进:沿相机射线采样积分得到像素颜色
关键公式:
沿射线 的颜色积分为:
其中 是透射率。
神经常微分方程(Neural ODE)
Neural ODE将神经网络的连续层视为常微分方程的解,将离散层堆叠推广为连续时间演化。
核心资源:
- 连续深度网络:Neural ODE与ResNet的联系
- Transformer作为微分方程:连续化Transformer的思路
核心思想:
传统网络的隐藏层更新:
连续化为ODE形式:
优势:
- 自适应计算:可在任意精度下求解
- 内存效率:无需存储中间层
- 可逆性:支持精确的似然计算
液态神经网络(LNN)
液态神经网络(Liquid Neural Networks)是一类具有动态时间常数和连续状态更新的神经网络,能够自适应地处理时序数据。
核心资源:
- 液态神经网络:LNN的架构设计与理论基础
核心特性:
- 液态参数:时间常数随输入动态变化
- 连续时间更新:状态更新遵循连续动力学
- 小型化:相比传统RNN使用更少参数
Titans与长期记忆架构
Titans是Google Research提出的新型架构,通过神经记忆模块实现测试时持续学习,是连续神经网络的重要扩展。
核心资源:
- Titans架构详解:神经记忆模块、测试时学习、三大变体
- MIRAS框架:关联记忆的统一理论框架
- 测试时记忆学习理论:理论基础与收敛性分析
核心特性:
- 测试时学习:记忆在推理中持续更新
- 超长上下文:支持200万+ tokens
- 选择性遗忘:自适应门控机制
学习路径建议
推荐学习顺序
第一阶段:基础概念(第1-2周)
├── 1. 理解隐式表示的基本思想
│ └── 阅读:[[../implicit-neural-representations/implicit-neural-representations|隐式神经表示]]
├── 2. 掌握SIREN的核心技术
│ └── 阅读:[[../implicit-neural-representations/siren-networks|SIREN网络]]
└── 3. 理解连续性与微分的联系
└── 阅读:[[../resnet-dynamical-system-theory|ResNet与动力系统理论]]
第二阶段:进阶应用(第3-4周)
├── 4. NeRF 3D重建
│ └── 学习:体渲染、位置编码、射线采样
├── 5. Neural ODE入门
│ └── 阅读:[[../neural-odes-continuous-depth-networks|连续深度网络]]
└── 6. 代码实践:实现简单INR
第三阶段:深入研究(第5-8周)
├── 7. 液态神经网络
│ └── 阅读:[[../liquid-neural-networks|液态神经网络]]
├── 8. Titans与测试时学习
│ └── 阅读:[[../titans-long-term-memory-architecture|Titans架构]]
└── 9. 探索前沿:Diffusion与连续表示的结合
前置知识要求
| 知识领域 | 必要程度 | 建议资源 |
|---|---|---|
| 深度学习基础 | 必要 | 深度学习基础 |
| 线性代数 | 必要 | 矩阵运算、特征值分解 |
| 微积分 | 必要 | 偏微分、链式法则 |
| 常微分方程 | 推荐 | 欧拉法、龙格-库塔法 |
| 计算机图形学 | 可选 | 体渲染基础 |
核心公式速查
1. 隐式神经表示
通用形式:
MLP结构:
2. SIREN正弦激活
前向传播:
梯度关系:
3. NeRF体渲染
体积渲染积分:
其中
位置编码:
4. Neural ODE
连续更新:
ODE求解:
龙格-库塔法:
其中 为各阶段斜率。
5. 液态神经网络
液态时间常数更新:
其中 为输入依赖的时间常数网络。
工具与库推荐
深度学习框架
| 框架 | 用途 | 特点 |
|---|---|---|
| PyTorch | 通用深度学习 | 动态图、研究首选 |
| JAX | 函数式编程 | 自动微分、矢量化 |
微分方程求解
| 库 | 语言 | 特点 |
|---|---|---|
| torchdiffeq | Python | PyTorch原生Neural ODE支持 |
| DiffEqFlux.jl | Julia | 完整的微分方程生态 |
| torchsde | Python | 随机微分方程求解 |
隐式表示专用
| 库 | 用途 |
|---|---|
| nerfstudio | NeRF完整工具链 |
| tiny-cuda-nn | 高速SIREN实现 |
| Kaolin | 3D深度学习 |
可视化工具
| 工具 | 用途 |
|---|---|
| Plotly | 交互式可视化 |
| matplotlib | 2D/3D绘图 |
| PyVista | 3D场景渲染 |
论文推荐
必读经典
| 论文 | 年份 | 引用 | 关键词 |
|---|---|---|---|
| Implicit Neural Representations with Periodic Activation Functions (SIREN) | 2020 | 3000+ | 正弦激活、隐式表示 |
| Neural Radiance Fields (NeRF) | 2020 | 8000+ | 3D重建、体渲染 |
| Neural Ordinary Differential Equations | 2018 | 6000+ | Neural ODE、连续深度 |
| Liquid Time-constant Networks | 2021 | 500+ | 液态网络、时序建模 |
| Fourier Features Let Networks Learn High Frequency Functions | 2020 | 2000+ | 位置编码、傅里叶特征 |
| Titans: Learning to Memorize at Test Time | 2025 | 新晋 | 测试时学习、神经记忆 |
进阶阅读
| 论文 | 年份 | 主题 |
|---|---|---|
| Mip-NeRF | 2021 | 抗锯齿NeRF |
| Plenoxels | 2022 | 体素替代NeRF |
| DeblurNeRF | 2022 | 模糊场景NeRF |
| Aug-NeRF | 2023 | 数据增强NeRF |
| Neural ODEs as Residual Networks | 2020 | ODE与ResNet联系 |
前沿探索
| 论文 | 年份 | 方向 |
|---|---|---|
| Consistent Neural Implicit Fields | 2023 | 一致性3D表示 |
| HexPlane | 2023 | 高效4D表示 |
| Instant Neural Graphics Primitives | 2022 | 实时隐式表示 |
| GM-NeRF | 2024 | 几何感知多视角 |
相关领域链接
核心相关
| 专题 | 链接 | 说明 |
|---|---|---|
| 隐式神经表示 | 隐式神经表示 | 基础范式 |
| SIREN网络 | SIREN网络 | 周期激活 |
| Neural ODE | 连续深度网络 | 微分方程视角 |
| 液态神经网络 | 液态神经网络 | 动态时序模型 |
| Titans架构 | Titans架构 | 测试时记忆学习 |
理论支撑
| 专题 | 链接 | 说明 |
|---|---|---|
| ResNet动力学 | ResNet与动力系统 | 离散-连续联系 |
| Transformer微分方程 | Transformer作为微分方程 | Transformer连续化 |
| 连续优化理论 | 连续时间优化理论 | 梯度流分析 |
应用领域
学习资源
更新日志
| 日期 | 更新内容 |
|---|---|
| 2026-05-15 | 添加Titans与长期记忆架构内容 |
| 2026-05-15 | 初始创建专题索引 |
本专题持续更新中,欢迎补充相关资源和论文推荐。