朴素贝叶斯
朴素贝叶斯假设/条件独立性假设、最简单的概率图模型
flowchart TB y y --> x1 y --> x2 y --> xp subgraph x direction LR x1 x2 x3[...] xp end
其中xi表示的是维度而不是变量,其中
那么朴素贝叶斯算法假设:
也就是说
这里起了简化运算的作用,没有其它动机。
回顾一下概率生成模型
利用贝叶斯定理,对于单次观测:
对于单个维度的条件概率以及类先验作出进一步的假设:
- 为连续变量:
- 为离散变量:类别分布(Categorical):
对这些参数的估计,常用 MLE 的方法直接在数据集上估计,由于不需要知道各个维度之间的关系,因此,所需数据量大大减少了。估算完这些参数,再代入贝叶斯定理中得到类别的后验分布。