朴素贝叶斯

朴素贝叶斯假设/条件独立性假设、最简单的概率图模型

flowchart TB
	y
	y --> x1
	y --> x2
	y --> xp
	subgraph x
		direction LR
		x1
		x2
		x3[...]
		xp
	end

其中xi表示的是维度而不是变量,其中

那么朴素贝叶斯算法假设:

也就是说

这里起了简化运算的作用,没有其它动机。

回顾一下概率生成模型

利用贝叶斯定理,对于单次观测:

对于单个维度的条件概率以及类先验作出进一步的假设:

  1. 为连续变量:
  2. 为离散变量:类别分布(Categorical):

对这些参数的估计,常用 MLE 的方法直接在数据集上估计,由于不需要知道各个维度之间的关系,因此,所需数据量大大减少了。估算完这些参数,再代入贝叶斯定理中得到类别的后验分布。