Quartz 4

❯

❯

❯

生成模型概述

生成模型概述

Oct 13, 20253 min read

终极目标：给定观测样本 $x$ ，建模真实数据的分布 $p (x)$ 提供的接口：

根据学习到的近似模型生成新样本
使用学习到的近似模型评估观测数据或采样数据的似然度

细分方向：

生成对抗网络（GANs）：通过对抗训练学习分布采样机制
基于似然的模型：学习对观测样本赋予高概率的模型，包括自回归模型、标准化流、变分自编码器（VAEs）
基于能量的模型：将数据分布学习为能量函数后再进行归一化
基于分数的模型：不直接学习能量函数本身，而是通过神经网络学习基于能量模型的评分函数

由柏拉图洞穴假说：使用潜空间帮助建模

由于建模似然函数难计算，转为使用ELBO代理计算

VAE

给AE编码的潜空间离散点换成高斯分布，使用变分推断训练模型，使其具备生成能力

变分 (Variational): 在由参数 $ϕ$ 参数化的一系列后验分布中，优化寻找最佳的 $q_{ϕ} (z ∣ x)$ 。
自编码器 (Autoencoder): 它类似于传统的自编码器，其中输入数据在经过中间的瓶颈表示 $z$ 后，被训练来预测自身。

优化目标：

E_{q_{ϕ} (z ∣ x)} [lo g \frac{p ( x , z )}{q _{ϕ} ( z ∣ x )}] = reconstruction term E_{q_{ϕ} (z ∣ x)} [lo g p_{θ} (x ∣ z)] - prior matching term D_{KL} (q_{ϕ} (z ∣ x) ∥ p (z))

MHVAE

在VAE的基础上，通过引入多个潜在变量层来对复杂的数据分布进行建模（HVAE），但效果不好，使用马尔可夫性质来约束，效果更好。优化目标：

E_{q_{ϕ} (z_{1 : T} ∣ x)} [lo g \frac{p ( z _{T} ) p _{θ} ( x ∣ z _{1} ) \prod _{t = 2}^{T} p _{θ} ( z _{t - 1} ∣ z _{t} )}{q _{ϕ} ( z _{1} ∣ x ) \prod _{t = 2}^{T} q _{ϕ} ( z _{t} ∣ z _{t - 1} )}]

Variational Diffusion Models

在MHVAE的基础上加入三个限制： 1.

Graph View

VAE
MHVAE
Variational Diffusion Models

Created with Quartz v4.5.2 © 2025

鄂ICP备2025095675号-1

GitHub
Discord Community