终极目标:给定观测样本,建模真实数据的分布 提供的接口:
- 根据学习到的近似模型生成新样本
- 使用学习到的近似模型评估观测数据或采样数据的似然度
细分方向:
- 生成对抗网络(GANs):通过对抗训练学习分布采样机制
- 基于似然的模型:学习对观测样本赋予高概率的模型,包括自回归模型、标准化流、变分自编码器(VAEs)
- 基于能量的模型:将数据分布学习为能量函数后再进行归一化
- 基于分数的模型:不直接学习能量函数本身,而是通过神经网络学习基于能量模型的评分函数
由柏拉图洞穴假说:使用潜空间帮助建模
由于建模似然函数难计算,转为使用ELBO代理计算
VAE
给AE编码的潜空间离散点换成高斯分布,使用变分推断训练模型,使其具备生成能力
- 变分 (Variational): 在由参数 参数化的一系列后验分布中,优化寻找最佳的 。
- 自编码器 (Autoencoder): 它类似于传统的自编码器,其中输入数据在经过中间的瓶颈表示 后,被训练来预测自身。
优化目标:
MHVAE
在VAE的基础上,通过引入多个潜在变量层来对复杂的数据分布进行建模(HVAE),但效果不好,使用马尔可夫性质来约束,效果更好。 优化目标:
Variational Diffusion Models
在MHVAE的基础上加入三个限制: 1.