测试时适应综合分类体系

概述

本页面基于arXiv:2411.03687的综合性综述,整理了测试时适应(Test-Time Adaptation, TTA)领域的完整分类体系。该综述收集并分析了400+篇相关论文,提出了基于调整组件的分类框架。

核心问题

如何使在源域训练的模型能够适应目标域的分布偏移?

TTA的核心优势:

  • 仅需源域数据进行训练
  • 在测试时在线适应目标域
  • 无需存储或访问源域数据

五维度分类体系

测试时适应
├── 模型调整 (Model Adaptation)
├── 推理调整 (Inference Adaptation)  
├── 归一化调整 (Normalization Adaptation)
├── 样本调整 (Sample Adaptation)
└── 提示调整 (Prompt Adaptation)

1. 模型调整方法

核心思想:在测试时更新模型的参数或表示。

1.1 统计量更新

方法论文核心思想
TENTICLR 2021更新BN均值/方差,最小化熵
EATACVPR 2022熵最小化 + 多样性正则化
LAMENeurIPS 2022标签平滑 + 置信度传播
SARICLR 2023稳定性判据过滤高熵样本

TENT公式

1.2 表示更新

方法论文核心思想
TPTCVPR 2023多次前向+置信度选择
DeYOICCV 2023置信度+稳定性双判据
C-TTAICLR 2026连续原型更新

1.3 外部记忆

方法论文核心思想
EMA-指数移动平均更新记忆
CoTTACVPR 2023连续TTA + 记忆增强

2. 推理调整方法

核心思想:修改推理过程而非模型参数。

2.1 测试时数据增强

方法论文核心思想
TTA-多尺度/翻转集成
StableTTA2026NSS + 稳定增强

StableTTA流程

# 1. 稳定数据增强
for i in range(N):
    x_aug = stable_mixup(x)  # 或 stable_cutmix
    z_i = model(x_aug)
    z_i = NSS(z_i, K)  # 非显著抑制
# 2. 聚合
z = mean(z_1, ..., z_N)

2.2 集成方法

方法论文核心思想
Monte Carlo-MC Dropout集成
SWAGNeurIPS 2019随机权重平均

2.3 测试时学习

方法论文核心思想
Test-Time TrainingICML 2020自监督辅助任务
TTTICML 2023嵌套学习更新

3. 归一化调整方法

核心思想:调整BatchNorm或其他归一化层的统计量。

3.1 BN统计量更新

方法更新内容适应策略
TENT熵最小化
NOTE在线估计
LAME拉普拉斯适应

3.2 归一化层替换

方法原归一化替换为
AdaBNBN逐层BN
BN-AdaptBN源/目标BN

3.3 归一化参数调整

方法调整内容
NormAdapt
SR-IRL层归一化

4. 样本调整方法

核心思想:在输入模型之前调整测试样本。

4.1 输入变换

方法变换类型目的
TTA翻转/旋转/裁剪增强多样性
AdvProp对抗变换分布对齐
Mixup-TTAMixup插值增强

4.2 特征对齐

方法对齐目标
AdaBNBN统计量
MMD最大均值差异
CORAL二阶统计量

4.3 伪标签

方法伪标签使用
STAC伪标签自训练
TVT伪标签传递

5. 提示调整方法

核心思想:为Vision-Language Models(如CLIP)调整文本提示。

5.1 文本提示学习

方法提示类型更新方式
CoOp可学习连续提示梯度下降
MaPLe多模态提示联合优化

5.2 测试时提示调整

方法论文核心思想
TPTCVPR 2023置信度选择+文本增强
C-TTAICLR 2026原型引导提示

TPT流程

1. 生成多个文本描述变体
2. 对每个变体计算图像预测
3. 选择最高置信度的预测
4. 使用该预测更新提示(可选)

5.3 视觉提示调整

方法提示位置
VP图像token
VPT视觉transformer
CuSe连续提示

方法对比总览

按性能对比(ImageNet-C平均)

方法类别代表方法mCE↓计算开销
无适应Source Only68.4%0
模型调整TENT, EATA66.2%
推理调整TTA, StableTTA64.8%
归一化调整AdaBN, NOTE67.1%
样本调整Mixup-TTA65.3%
提示调整TPT, CoOp63.5%

按计算效率对比

方法相对延迟内存开销适用场景
TENT1.0×资源受限
StableTTA32×精度优先
TPTVLM应用
C-TTA1.0×极低效率优先

适应设置分类

按测试数据形式

设置数据形式代表方法
单样本独立样本TENT
批次固定批次EATA
流式连续流OTTA

按源域访问

设置源域访问代表方法
源可用完整访问传统方法
源自由仅模型SFDA
源隐私部分访问差分隐私

按标注情况

设置标注代表方法
无监督TENT, EATA
半监督部分Test-Time Training
主动少量查询Active-TTA

基准数据集

标准域偏移

数据集偏移类型说明
ImageNet-C19种腐败高斯噪声、模糊等
ImageNet-A对抗样本自然对抗
ImageNet-R渲染风格艺术风格
ImageNet-V2不同采样原始数据分布

实际域偏移

数据集领域说明
CIFAR-10.1相机型号真实域偏移
Office-Home风格/物体多域适应
PACS艺术风格跨风格泛化

视频基准

数据集特点
VideoTTA时序偏移
UCF-101→HMDB跨数据集

应用场景

1. 自动驾驶

传感器融合 → 域偏移(白天→夜晚)
└─ TENT适应:更新感知模型统计量
└─ TTA增强:多视角集成

2. 医疗影像

训练数据:某医院设备
测试数据:另一医院设备
└─ AdaBN:归一化层适应
└─ Source-Free TTA:隐私保护

3. 移动端部署

服务器训练 → 边缘部署
└─ 轻量TTA:BN统计更新
└─ 离线+在线混合适应

4. 机器人感知

仿真训练 → 真实世界
└─ Continuous TTA:持续适应
└─ 多模态TTA:视觉+触觉

未来研究方向

1. 理论理解

  • TTA的理论收敛保证
  • 泛化误差的紧界分析
  • 最优适应策略的理论基础

2. 高效适应

  • 无梯度/无存储的TTA
  • 连续适应算法
  • 跨架构统一方法

3. 多模态场景

  • LLM的TTA
  • 视频/音频TTA
  • 跨模态适应

4. 安全与隐私

  • 对抗样本防御
  • 隐私保护适应
  • 可验证TTA

总结

测试时适应是一个快速发展的领域,本分类体系提供了统一的视角:

调整维度核心组件代表方法
模型参数/表示TENT, EATA
推理前向过程StableTTA
归一化统计量AdaBN
样本输入变换Mixup-TTA
提示文本/视觉TPT, CoOp

选择建议

  • 资源受限 → 归一化调整(TENT)
  • 精度优先 → 推理调整(StableTTA)
  • VLM应用 → 提示调整(TPT)
  • 效率+精度 → 原型更新(C-TTA)

参考