频率派VS贝叶斯派
假设我们以表示数据,代表参数。
现在有一个概率模型:
频率派
频率派认为
- 是一个未知的常量
- 数据是变量。
常用的方法是最大似然估计(MLE):
贝叶斯派
贝叶斯派认为:
- 是变量,服从某个概率分布
- 通过贝叶斯公式将先验概率和后验概率联系起来
- MAP:最大后验证概率
- 找一个使得最大的点(其实就是众数)
根据贝叶斯定理依赖观测集参数的后验可以写成:
MAP计算公式:
其中第二个等号是由于分母和 没有关系。求解这个 值后计算 ,就得到了参数的后验概率。其中 叫似然,是我们的模型分布。
求出了分布后,我们使用作为新旧数据的桥梁,将这个分布用于预测贝叶斯预测:
这个积分很困难,又时解析解甚至求不出来。因此发展出了概率图模型,使用蒙特卡罗方法求数值解。