谱图理论深度专题

1. 引言

谱图理论（Spectral Graph Theory）是连接代数与图论的桥梁，研究图的邻接矩阵或拉普拉斯矩阵的特征值与图结构性质之间的关系。¹ 在深度学习时代，这一理论为图神经网络（GNN）提供了坚实的数学基础，使得我们能够在谱域设计图卷积滤波器。

2. 图拉普拉斯算子

2.1 拉普拉斯矩阵的定义

给定无向图 $G = (V, E)$ ，其中 $∣ V ∣ = n$ ， $∣ E ∣ = m$ ，定义：

组合拉普拉斯矩阵：
$L = D - A$

其中：

$A \in R^{n \times n}$ ：邻接矩阵， $A_{ij} = 1$ 当且仅当 $(i, j) \in E$
$D \in R^{n \times n}$ ：度矩阵， $D_{ii} = d_{i} = \sum_{j} A_{ij}$

归一化拉普拉斯矩阵：

对称归一化：
$L_{sym} = D^{- 1/2} L D^{- 1/2} = I - D^{- 1/2} A D^{- 1/2}$

随机游走归一化：
$L_{rw} = D^{- 1} L = I - D^{- 1} A$

2.2 拉普拉斯矩阵的基本性质

性质2.1： $L$ 是半正定矩阵，所有特征值 $λ_{i}$ 满足 $0 = λ_{1} \leq λ_{2} \leq \dots \leq λ_{n}$ 。

性质2.2： $L$ 的特征向量 $u_{1} = (1, 1, \dots, 1) / n$ 对应特征值 $0$ ，当且仅当图是连通的。

性质2.3（二次型解释）：
$x^{⊤} Lx = \frac{1}{2} \sum_{i, j \in E} (x_{i} - x_{j})^{2} = \sum_{(i, j) \in E} (x_{i} - x_{j})^{2}$

这一性质表明 $L$ 是图上离散拉普拉斯算子的离散化。

2.3 特征值的谱定理

设 $L$ 的特征值分解为：
$L = U Λ U^{⊤} = \sum_{i = 1}^{n} λ_{i} u_{i} u_{i}^{⊤}$

其中：

$Λ = diag (λ_{1}, λ_{2}, \dots, λ_{n})$
$U = [u_{1}, u_{2}, \dots, u_{n}]$ 是正交特征向量矩阵

3. 图上的傅里叶变换

3.1 图傅里叶变换定义

借鉴经典傅里叶变换的思想，定义图傅里叶变换（Graph Fourier Transform）：

正向变换：
$\overset{x}{^} (λ_{i}) = ⟨ x, u_{i} ⟩ = u_{i}^{⊤} x$

逆向变换：
$x (v) = \sum_{i = 1}^{n} \overset{x}{^} (λ_{i}) u_{i} (v)$

其中 $x \in R^{n}$ 是定义在图节点上的信号， $u_{i} (v)$ 是特征向量 $u_{i}$ 在节点 $v$ 处的分量。

3.2 图频率解释

拉普拉斯矩阵的特征值 $λ_{i}$ 可以解释为图上的频率：

特征值	频率解释	特性
$λ_{1} = 0$	最低频率	全局常数信号（ $u_{1}$ 是均匀向量）
$λ_{2}$	次低频率	与图的宏观结构相关
$λ_{k}$	中等频率	局部结构特征
$λ_{n}$	最高频率	剧烈变化的信号（如噪声）

低频信号：变化平缓，在相邻节点间差异小
高频信号：变化剧烈，相邻节点间差异大

3.3 图信号的正则性

使用拉普拉斯二次型定义图信号的总变差（Total Variation）：

$TV (x) = x^{⊤} Lx = \sum_{(i, j) \in E} (x_{i} - x_{j})^{2}$

$TV (x) = 0$ 当且仅当 $x$ 是常数信号
$TV (x)$ 越小，信号越”平滑”（低频）
$TV (x)$ 越大，信号越”粗糙”（高频）

4. 谱图卷积

4.1 卷积定理

在图上定义卷积操作。经典信号处理中的卷积定理指出：

$Conv (x, y) F \overset{x}{^} \cdot \overset{y}{^}$

其中 $F$ 表示傅里叶变换。

将此定理推广到图上，设 $g_{θ}$ 是谱域的滤波器（频率响应函数），则图卷积定义为：

$(g_{θ} * x) (v) = \sum_{i = 1}^{n} \overset{x}{^} (λ_{i}) g_{θ} (λ_{i}) u_{i} (v) = U (G_{θ} \circ \overset{x}{^})$

其中 $G_{θ} = diag (g_{θ} (λ_{1}), \dots, g_{θ} (λ_{n}))$ 。

4.2 谱域滤波器设计

多项式滤波器：为避免直接计算特征分解，滤波器可参数化为 $K$ 阶多项式：

$g_{θ} (λ) = \sum_{k = 0}^{K - 1} θ_{k} λ^{k}$

这使得图卷积变为：

$g_{θ} * x = \sum_{k = 0}^{K - 1} θ_{k} L^{k} x$

多项式滤波器的性质：

性质	说明
$K$ -局部化	输出仅依赖于 $K$ 跳内的节点
计算效率	避免特征分解，仅需矩阵乘法
表达能力	可表示 $K - 1$ 次多项式的任意函数

5. 谱聚类与图划分

5.1 谱嵌入

谱聚类的核心思想是利用拉普拉斯矩阵的特征向量进行降维：

计算 $L$ 的前 $k$ 个最小特征值对应的特征向量
将节点映射到 $R^{k}$ 空间： $v_{i} \mapsto (u_{2} (i), u_{3} (i), \dots, u_{k + 1} (i))$
在低维空间使用 $k$ -means 进行聚类

5.2 Cheeger不等式

Cheeger不等式建立了特征值 $λ_{2}$ 与图划分质量之间的联系：

$\frac{λ _{2}}{2} \leq h (G) \leq 2 λ_{2}$

其中 $h (G)$ 是图的 Cheeger 常数（最小割与体积比）。

意义： $λ_{2}$ 越小，图越容易被分割成两部分； $λ_{2}$ 越大，图的结构越紧密。

5.3 谱聚类算法

import numpy as np
from sklearn.cluster import KMeans
 
def spectral_clustering(A, k):
    """
    谱聚类算法
    
    参数:
        A: 邻接矩阵 (n x n)
        k: 聚类数
    返回:
        labels: 节点聚类标签 (n,)
    """
    n = A.shape[0]
    D = np.diag(A.sum(axis=1))
    L = D - A
    
    # 归一化拉普拉斯
    D_inv_half = np.diag(1.0 / np.sqrt(A.sum(axis=1)))
    L_sym = D_inv_half @ L @ D_inv_half
    
    # 特征分解（取前k个最小特征值）
    eigenvalues, eigenvectors = np.linalg.eigh(L_sym)
    U = eigenvectors[:, :k]
    
    # 行归一化
    U_norm = U / (np.linalg.norm(U, axis=1, keepdims=True) + 1e-8)
    
    # k-means聚类
    kmeans = KMeans(n_clusters=k, random_state=42)
    labels = kmeans.fit_predict(U_norm)
    
    return labels

6. 特征值与图结构

6.1 特征值与图的连通性

连通分量数： $L$ 的零特征值的重数等于图的连通分量数。

** bipartite 性**：图是二部的当且仅当 $L$ 的最大特征值 $λ_{n} = 2 d_{m a x}$ （对于正则图）。

6.2 谱间隙与混合时间

谱间隙（Spectral Gap）： $γ = λ_{2}$ （对于连通图）

谱间隙与随机游走的混合时间（Mixing Time）直接相关：

$t_{mix} \approx \frac{1}{γ} lo g n$

谱间隙越大，随机游走混合越快
谱间隙越小，图结构越”细长”，信息传播越慢

6.3 有效电阻

节点 $i$ 和 $j$ 之间的有效电阻与拉普拉斯矩阵伪逆有关：

$R_{ij}^{eff} = (L^{+})_{ii} + (L^{+})_{jj} - 2 (L^{+})_{ij}$

有效电阻在分析信息瓶颈和 over-squashing 时起重要作用。²

7. 图信号处理框架

7.1 滤波器算子

设 $g_{θ}$ 是谱域定义的滤波器，则对应的图滤波器算子为：

$T_{g} [x] = g (L) x = U G_{θ} U^{⊤} x$

频率响应： $g_{θ}$ 决定了不同频率成分被放大或衰减的程度。

7.2 局部化算子

通过多项式近似，可以构造局部化的图滤波器：

$g (L) = \sum_{k = 0}^{K - 1} c_{k} L^{k}$

这类算子的空间支撑（Spatial Support）为 $K$ 跳邻域，即：

$supp (g (L) \cdot δ_{i}) \subseteq {j : d (i, j) \leq K}$

7.3 插值与重构

给定部分节点上的信号值，恢复完整信号的问题可以在谱域解决：

$\overset{x}{^}_{known} = U_{known}^{⊤} x$

其中 $U_{known}$ 是对应已知节点的特征向量子矩阵。

8. 与深度学习的联系

8.1 ChebNet架构

ChebNet³ 利用 Chebyshev 多项式近似实现高效的谱域卷积：

$g_{θ} (L) x \approx \sum_{k = 0}^{K - 1} θ_{k} T_{k} (\tilde{L}) x$

其中 $\tilde{L} = 2 L / λ_{m a x} - I$ 是归一化拉普拉斯。

8.2 GCN的谱域解释

GCN⁴ 的一阶近似可以解释为谱域滤波：

$\tilde{A} = D^{- 1/2} A D^{- 1/2}, H^{(l + 1)} = σ (\tilde{A} H^{(l)} W^{(l)})$

这对应于谱域的低通滤波器，倾向于保留平滑信号。

8.3 图Transformer的谱域分析

最近的图Transformer架构⁵通过注意力机制学习数据驱动的谱滤波器：

$H^{(l + 1)} = Attention (Q, K, V) = softmax (\frac{Q K ^{⊤}}{d}) V$

9. 小结

谱图理论为图神经网络提供了强大的分析工具和理论基础：

概念	作用
拉普拉斯矩阵	图结构的线性表示
特征值/特征向量	定义图的频率基
图傅里叶变换	实现谱域信号处理
多项式滤波器	高效的局部化卷积

理解谱图理论对于设计新的GNN架构、分析现有模型的理论性质、以及解决over-squashing等实际问题都至关重要。

参考文献

Chung, F. R. K. (1997). Spectral Graph Theory. American Mathematical Society. ↩
Di Giovanni, A., et al. (2023). “How does over-squashing affect the power of GNNs?” NeurIPS 2023. ↩
Defferrard, M., Bresson, X., & Vandergheynst, P. (2016). “Convolutional Neural Networks on Graphs with Chebyshev Approximation.” NeurIPS 2016. ↩
Kipf, T. N., & Welling, M. (2017). “Semi-Supervised Classification with Graph Convolutional Networks.” ICLR 2017. ↩
Dwivedi, V. P., et al. (2023). “Graphormer: A Graph Transformer for Molecular Property Prediction.” ICLR 2022. ↩

Metaphor

探索

谱图理论深度专题

谱图理论深度专题

1. 引言

2. 图拉普拉斯算子

2.1 拉普拉斯矩阵的定义

2.2 拉普拉斯矩阵的基本性质

2.3 特征值的谱定理

3. 图上的傅里叶变换

3.1 图傅里叶变换定义

3.2 图频率解释

3.3 图信号的正则性

4. 谱图卷积

4.1 卷积定理

4.2 谱域滤波器设计

5. 谱聚类与图划分

5.1 谱嵌入

5.2 Cheeger不等式

5.3 谱聚类算法

6. 特征值与图结构

6.1 特征值与图的连通性

6.2 谱间隙与混合时间

6.3 有效电阻

7. 图信号处理框架

7.1 滤波器算子

7.2 局部化算子

7.3 插值与重构

8. 与深度学习的联系

8.1 ChebNet架构

8.2 GCN的谱域解释

8.3 图Transformer的谱域分析

9. 小结

参考文献

关系图谱

目录

Metaphor

探索

谱图理论深度专题

谱图理论深度专题

1. 引言

2. 图拉普拉斯算子

2.1 拉普拉斯矩阵的定义

2.2 拉普拉斯矩阵的基本性质

2.3 特征值的谱定理

3. 图上的傅里叶变换

3.1 图傅里叶变换定义

3.2 图频率解释

3.3 图信号的正则性

4. 谱图卷积

4.1 卷积定理

4.2 谱域滤波器设计

5. 谱聚类与图划分

5.1 谱嵌入

5.2 Cheeger不等式

5.3 谱聚类算法

6. 特征值与图结构

6.1 特征值与图的连通性

6.2 谱间隙与混合时间

6.3 有效电阻

7. 图信号处理框架

7.1 滤波器算子

7.2 局部化算子

7.3 插值与重构

8. 与深度学习的联系

8.1 ChebNet架构

8.2 GCN的谱域解释

8.3 图Transformer的谱域分析

9. 小结

参考文献

Footnotes

关系图谱

目录