感知机

想法:错误驱动

假定

  • 模型:
  • 激活函数
  • 被错误分类的样本:集合

错误分类就是给一个初始值,不断的挪动我们的曲线,使得中元素最少。

这里的损失函数为:,其中

虽然很直观,但是这个方法有个问题,它的函数

  1. 不连续、不可导,不能/很难求解
  2. NP Hard问题

我们继续观察,当变动一点点,也会变化一点点,这样就可导了,为何不将其当作一个损失函数呢?

现在构造新损失函数

计算时,我们采用随机梯度下降(SGD)算法

如果不是线性可分的,我们有Pocket Algorithm,它允许有一点点错误存在