感知机
想法:错误驱动。
假定
- 模型:
- 激活函数:
- 被错误分类的样本:集合
错误分类就是给一个初始值,不断的挪动我们的曲线,使得中元素最少。
这里的损失函数为:,其中
虽然很直观,但是这个方法有个问题,它的函数
- 不连续、不可导,不能/很难求解
- 是
NP Hard问题
我们继续观察,当变动一点点,也会变化一点点,这样就可导了,为何不将其当作一个损失函数呢?
现在构造新损失函数:
计算时,我们采用随机梯度下降(SGD)算法
如果不是线性可分的,我们有Pocket Algorithm,它允许有一点点错误存在
- 感知机收敛定理 todo
- Pocket Algorithm