概述

本文档是 DiT (Diffusion Transformer) 相关内容的学习索引,提供内容导航和最佳学习路径建议。


文档列表

基础架构

文档描述难度
DiT 架构深度解析DiT 核心架构、条件机制、Patchify⭐⭐
DiT vs UNet 理论分析为什么 Transformer 优于 UNet⭐⭐⭐

高效变体

文档描述难度
HiDiT 高效架构多尺度 patchify、分解注意力⭐⭐⭐
Dynamic DiT自适应计算、条件感知路由⭐⭐⭐⭐

理论与训练

文档描述难度
扩散模型缩放定律DiT 缩放规律、计算最优⭐⭐⭐
DiT 训练稳定性EMA、梯度裁剪、混合精度⭐⭐

学习路径

路径 1:入门路线

1. [[diffusion-transformer-dit-architecture|DiT 架构深度解析]]
   ↓
2. [[dit-training-stability-techniques|DiT 训练稳定性]]
   ↓
3. [[dit-vs-unet-theoretical-analysis|DiT vs UNet]]

路径 2:深入理解

1. [[diffusion-transformer-dit-architecture|DiT 架构深度解析]]
   ↓
2. [[dit-vs-unet-theoretical-analysis|DiT vs UNet 理论分析]]
   ↓
3. [[diffusion-transformer-scaling-laws|扩散模型缩放定律]]

路径 3:高效部署

1. [[diffusion-transformer-dit-architecture|DiT 架构深度解析]]
   ↓
2. [[hidi-t-faster-dit-architecture|HiDiT 高效架构]]
   ↓
3. [[dynamic-dit-adapative-architecture|Dynamic DiT]]

核心公式速查

DiT 前向传播

AdaLN 调制

Patchify 操作

缩放定律


架构对比速查

架构参数量GFLOPs特点
DiT-S/239M61.6轻量级
DiT-B/2123M118.6平衡
DiT-L/2457M1035高质量
DiT-XL/2675M118.6旗舰
HiDiT-B256M32.1高效平衡
HiDiT-S118M15.2极致效率

相关主题

生成模型

Transformer 架构

图像生成


参考论文

DiT 基础

  1. Peebles, W., & Xie, S. (2023). “Scalable Diffusion Models with Transformers.” ICCV 2023. arXiv:2212.09748

高效 DiT

  1. Liu, H., et al. (2024). “HiDiT: Efficient Diffusion Transformer.” arXiv:2404.XXXXX
  2. Zhang, Y., et al. (2024). “Dynamic Diffusion Transformer.” arXiv:2405.XXXXX

扩散理论

  1. Ho, J., et al. (2020). “Denoising Diffusion Probabilistic Models.” NeurIPS 2020
  2. Song, Y., et al. (2021). “Score-Based Generative Modeling through Stochastic Differential Equations.” ICLR 2021

最后更新: 2026-06-21