概率图电路

引言

深度生成模型处理图结构数据的挑战

图结构数据广泛存在于分子设计、社交网络分析、蛋白质结构预测等众多领域。深度生成模型（Deep Generative Models, DGMs）在捕获复杂图分布方面取得了巨大成功¹。然而，现有图生成模型面临以下核心挑战：

C1. 组合空间的复杂性：图存在于庞大而复杂的组合空间中，例如分子领域可能的图数量是巨大的²。
C2. 可变大小特性：图不仅在节点和边的特征值上是随机的，而且在节点和边的数量上也是随机的。
C3. 置换不变性：图是置换不变的，即单个图有阶乘数量的可能配置。
C4. 语义有效性：图需要满足领域特定的语义有效性约束（如化学价规则）。

PGC的提出背景

尽管现代图DGMs在采样方面表现出色，但它们本质上是不可追踪的概率模型——无法高效回答边缘概率计算、条件概率查询等基本推断任务¹。这种不可追踪性源于神经网络中的非线性变换。

为了解决这一根本性限制，Papež等人于2025年在UAI会议上提出了概率图电路（Probabilistic Graph Circuits, PGC），这是一种可追踪的深度生成模型框架，能够在图结构数据上实现精确且高效的边缘概率、条件概率和期望计算¹。

概率电路基础

概率电路的定义

概率电路（Probabilistic Circuits, PCs）是一个统一的可追踪概率模型框架³，由三种类型的计算单元组成：

单元类型	定义	公式
输入单元	计算用户定义的参数化函数	$c_{u} (G_{u}) := f_{u} (G_{u})$
求和单元	计算输入的加权求和	$c_{u} (G_{u}) := \sum_{i \in in (u)} w_{i} c_{i} (G_{i})$
乘积单元	计算输入的乘积	$c_{u} (G_{u}) := \prod_{i \in in (u)} c_{i} (G_{i})$

其中， $G_{u}$ 称为单元的作用域（scope），表示该单元操作对应的子图。

可分解分布

概率电路编码一个非负函数 $c (X) \geq 0$ ，可以被解释为概率分布。要实现可追踪推断，概率电路需要满足以下结构约束⁴：

假设1（平滑性）：每个求和单元的输入具有相同的作用域。

$X_{a} = X_{b}, \forall a, b \in in (u)$

假设2（可分解性）：每个乘积单元的输入具有互不相交的作用域。

$X_{a} \cap X_{b} = \emptyset, \forall a, b \in in (u)$

假设3（可追踪输入单元）：每个输入单元的积分具有代数闭式解。

$\int_{dom (Z_{u})} c_{u} (y_{u}, z_{u}) d Z_{u}$

可追踪推断

可追踪性是概率电路的核心特征，允许在单次前向传播中回答广泛的推断查询⁵。

定义1（概率电路的可追踪性）：

设 $p (X_{n} ∣ n)$ 是一个编码固定大小集合 $X_{n}$ 上概率分布的PC，其满足平滑性、可分解性和可追踪输入单元。此外，将 $X_{n}$ 分为两个固定大小的子集 $X_{n} := {X_{n - k}^{a}, X_{k}^{b}}$ 。则积分

$\int p (x_{n - k}^{a}, X_{k}^{b} ∣ n) d x_{n - k}^{a}$

可以精确计算（A），并在 $O (poly (∣ p ∣))$ 时间内高效完成（B）。

概率图电路定义

图结构编码

一个 $N$ 节点图被定义为元组 $G := {X, A}$ ：

节点特征矩阵 $X \in R^{N \times n_{X}}$ ：每行表示一个节点的 $n_{X}$ 维特征（通常使用独热编码）
邻接张量 $A \in R^{N \times N \times n_{A}}$ ：表示节点间的边类型

图分布 $p (G)$ 需要满足置换不变性（ $S_{n}$ - invariance），即对于任意置换 $π \in S_{n}$ ：

$p (π G ∣ n) = p (G ∣ n)$

PGC的层次结构

PGC的核心架构如图1所示¹：

┌─────────────────────────────────────────────────────────────┐
│                    PGC (完整模型)                            │
│  p(G) = p(G_n | n) × p(N)                                   │
│                                                             │
│  ┌─────────────────┐     ┌─────────────────┐                │
│  │   节点-PC       │     │   边-PC         │                │
│  │ (n-conditioned) │     │ (n-conditioned) │                │
│  └────────┬────────┘     └────────┬────────┘                │
│           │                       │                         │
│           └───────────┬───────────┘                         │
│                       │                                      │
│                 ┌─────▼─────┐                               │
│                 │  乘积层    │ (n_c 个单元)                   │
│                 └─────┬─────┘                               │
│                       │                                      │
│                 ┌─────▼─────┐                               │
│                 │  求和层    │ (1 个单元)                     │
│                 └───────────┘                                │
└─────────────────────────────────────────────────────────────┘

关键组件：

节点-PC：对节点特征 $X^{n}$ 建模，输入为 $n$ 条件化的节点特征
边-PC：对邻接关系 $L^{n}$ 建模，输入为 $A^{n}$ 的下三角部分的展平
乘积层：连接节点-PC和边-PC的输出， $n_{c}$ 个单元捕获节点-边的相关性
求和层：最终聚合，输出 $n$ 条件化的联合分布 $p (X^{n}, L^{n} ∣ n)$
基数分布 $p (N)$ ：描述图的随机大小

与PC的关系

PGC继承并扩展了传统概率电路的能力：

特性	传统PC	PGC
数据类型	固定大小向量	可变大小图
置换不变性	部分不变	完全不变（多种策略）
推断查询	边缘/条件/期望	同PC + 图特定查询
节点相关性	独立建模	联合建模

推断算法

边缘概率计算

PGC支持对图的任意部分进行边缘化。设 $G = {G_{a}, G_{b}}$ ，边缘概率计算为：

$\int p (g_{a}, G_{b}) d g_{a} = \sum_{n = k}^{\infty} \int p (g_{n - k}^{a}, G_{k}^{b} ∣ n) p (n) d g_{n - k}^{a}$

通过**边际填充（Marginalization Padding）**机制，PGC假设图最多有 $m$ 个节点，当实例包含 $n < m$ 个节点时，边缘化”空”节点及其相关边¹。

条件概率查询

PGC可以计算任意图子结构上的条件概率。通过 omni-compatible 图电路，可以精确计算：

证据查询： $p (G_{s} ∣ G_{∖ s})$
边缘查询：对特定节点或边的概率积分
高阶矩查询： $E [X_{i}^{r}]$ 、 $E [A_{ij}^{r}]$

梯度计算

PGC的参数通过梯度下降优化。负对数似然损失函数为：

$L = - lo g p (G) = - lo g (\sum_{n} p (G_{n} ∣ n) p (n))$

由于PGC的可追踪性，梯度可以通过反向传播精确计算，无需变分近似。

训练方法

变分推断

对于不可精确计算的情况，PGC可以使用变分推断。证据下界（ELBO）为：

$lo g p (G_{n} ∣ n) \geq E_{q (π ∣ G_{n})} [lo g p (G, π ∣ n)] + H (q (π ∣ G_{n}))$

其中 $q (π ∣ G_{n})$ 是变分后验分布， $H$ 是熵。

EM算法

期望最大化算法可用于训练PGC：

E步：计算隐变量的后验分布
M步：最大化期望下界更新参数

结构学习

PGC支持两种结构学习方式：

固定结构：使用预定义的区域图（Region Graph）构建架构：
- 二叉树（BT）
- 线性树（LT）
- 随机树（RT）
- 随机同步树（RT-S）
- 隐Chow-Liu树（HCLT）¹
学习结构：如HCLT变体，从数据中学习最优的树结构

应用场景

图生成

PGC可以在单次前向传播中生成完整的图样本：

# PGC 生成过程示意
sample = pgc.generate()  # 单次前向传播

在QM9数据集上的无条生成性能：

模型	有效性↑	NSPDK↓	FCD↓	唯一性↑
RT-S (PGC)	88.83%	0.002	1.11	99.38%
GDSS	95.72%	0.003	2.90	98.46%
DiGress	99.00%	0.005	0.36	96.20%

链接预测

通过条件概率查询，PGC可以评估在图中添加或删除边的概率：

$p (A_{ij} ∣ G_{∖ A_{ij}})$

分子生成

PGC在分子图生成任务中表现出色。实验表明，基于排序的PGC变体（π PGC）在NSPDK和FCD指标上与现有不可追踪模型具有竞争力¹。

条件分子生成示例

与其他方法比较

vs 图神经网络

方面	图神经网络 (GNN)	概率图电路 (PGC)
任务类型	判别/半监督	生成/概率建模
推断能力	单次前向传播	多查询可追踪
输出	节点/图嵌入	概率分布
可解释性	注意力权重	显式概率路径

vs VAE/GAN

方面	GraphVAE/GraphGAN	PGC
似然评估	近似/隐式	精确
条件生成	需要额外设计	原生支持
推断查询	受限	广泛支持
训练稳定性	对抗训练挑战	纯似然训练

vs 归一化流/扩散模型

方面	GraphAF/GraphDF/GDSS	PGC
生成方式	自回归或迭代去噪	单次采样
似然评估	需要额外近似	原生精确
推断能力	主要用于生成	多任务支持
计算效率	多步推理	单次前向

参考文献

本文档基于 PGC 论文（UAI 2025）编写。代码实现见 GitHub: mlnpapez/PGC。

Papež M, Rectoris M, Šmídl V, Pevný T. Probabilistic Graph Circuits: Deep Generative Models for Tractable Probabilistic Inference over Graphs. UAI 2025. (arXiv:2503.12162) ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
Reymond JL, Ruddigkeit L, Blum L, Van Deursen R. The enumeration of chemical space based on GDB-17 data. Wiley Interdisciplinary Reviews: Computational Molecular Science. 2012. ↩
Choi Y, Vergari A, Van den Broeck G. Probabilistic Circuits: A Unifying Framework for Tractable Probabilistic Models. UCLA. 2020. ↩
Darwiche A, Marquis P. A Knowledge Compilation Map. Journal of Artificial Intelligence Research. 2002;17:229-264. ↩
Vergari A, et al. A Compositional Atlas of Tractable Circuit Operations. NeurIPS 2021. ↩

Metaphor

探索

概率图电路

引言

深度生成模型处理图结构数据的挑战

PGC的提出背景

概率电路基础

概率电路的定义

可分解分布

可追踪推断

概率图电路定义

图结构编码

PGC的层次结构

与PC的关系

推断算法

边缘概率计算

条件概率查询

梯度计算

训练方法

变分推断

EM算法

结构学习

应用场景

图生成

链接预测

分子生成

与其他方法比较

vs 图神经网络

vs VAE/GAN

vs 归一化流/扩散模型

参考文献

关系图谱

目录

Metaphor

探索

概率图电路

引言

深度生成模型处理图结构数据的挑战

PGC的提出背景

概率电路基础

概率电路的定义

可分解分布

可追踪推断

概率图电路定义

图结构编码

PGC的层次结构

与PC的关系

推断算法

边缘概率计算

条件概率查询

梯度计算

训练方法

变分推断

EM算法

结构学习

应用场景

图生成

链接预测

分子生成

与其他方法比较

vs 图神经网络

vs VAE/GAN

vs 归一化流/扩散模型

参考文献

Footnotes

关系图谱

目录