L2 Ridge 也叫做岭回归。 w^=wargminL(w)+λwTw⟶∂w∂L(w)+2λw=0⟶2XTXw^−2XTY+2λw^=0⟶w^=(XTX+λI)−1XTY 可以看到,这个正则化参数和前面的 MAP 结果不谋而合。利用2范数进行正则化不仅可以是模型选择 w 较小的参数,同时也避免 X^TX不可逆的问题。