终极目标:给定观测样本,建模真实数据的分布 提供的接口:

  1. 根据学习到的近似模型生成新样本
  2. 使用学习到的近似模型评估观测数据或采样数据的似然度

细分方向:

  1. 生成对抗网络(GANs):通过对抗训练学习分布采样机制
  2. 基于似然的模型:学习对观测样本赋予高概率的模型,包括自回归模型、标准化流、变分自编码器(VAEs)
  3. 基于能量的模型:将数据分布学习为能量函数后再进行归一化
  4. 基于分数的模型:不直接学习能量函数本身,而是通过神经网络学习基于能量模型的评分函数

由柏拉图洞穴假说:使用潜空间帮助建模

由于建模似然函数难计算,转为使用ELBO代理计算

VAE

给AE编码的潜空间离散点换成高斯分布,使用变分推断训练模型,使其具备生成能力

  • 变分 (Variational): 在由参数 参数化的一系列后验分布中,优化寻找最佳的
  • 自编码器 (Autoencoder): 它类似于传统的自编码器,其中输入数据在经过中间的瓶颈表示 后,被训练来预测自身。

优化目标:

MHVAE

在VAE的基础上,通过引入多个潜在变量层来对复杂的数据分布进行建模(HVAE),但效果不好,使用马尔可夫性质来约束,效果更好。 优化目标:

Variational Diffusion Models

在MHVAE的基础上加入三个限制: 1.