频率派VS贝叶斯派

假设我们以表示数据,代表参数。

现在有一个概率模型:

频率派

频率派认为

  • 是一个未知的常量
  • 数据是变量。

常用的方法是最大似然估计(MLE):

贝叶斯派

贝叶斯派认为:

  • 是变量,服从某个概率分布
  • 通过贝叶斯公式将先验概率和后验概率联系起来
  • MAP:最大后验证概率
  • 找一个使得最大的点(其实就是众数)

根据贝叶斯定理依赖观测集参数的后验可以写成:

MAP计算公式:

其中第二个等号是由于分母和 没有关系。求解这个 值后计算 ,就得到了参数的后验概率。其中 叫似然,是我们的模型分布。

求出了分布后,我们使用作为新旧数据的桥梁,将这个分布用于预测贝叶斯预测:

这个积分很困难,又时解析解甚至求不出来。因此发展出了概率图模型,使用蒙特卡罗方法求数值解。