Quartz 4

❯

❯

❯

5 Dimension Reduction

5-Dimension Reduction

Sep 22, 20252 min read

ai
ML

降维

背景

在机器学习中我们更关心泛化误差而不是训练误差，过拟合会导致训练误差很小但是泛化误差很大，要抑制过拟合的一大方法就是降维。

维度过高会导致维度灾难(The Curse of Dimensionality)，我们每增加一个维度，需要的属性增加会是指数级别的，因此通过减少数据的特征数量来简化数据集来降维，可以帮助提高模型的性能、减少计算开销，并使数据更易于可视化理解。

降维的算法分为：

直接降维/特征选择：有 $P$ 个维度，选 $q$ 个维度保留
线性降维：PCA，MDS等
非线性：流形学习，包括 Isomap，LLE 等

样本矩阵

首先将协方差矩阵（数据集）写成中心化的形式：

S = \frac{1}{N} i = 1 \sum N (x_{i} - \overline{x}) (x_{i} - \overline{x})^{T} = \frac{1}{N} (x_{1} - \overline{x}, x_{2} - \overline{x}, \dots, x_{N} - \overline{x}) (x_{1} - \overline{x}, x_{2} - \overline{x}, \dots, x_{N} - \overline{x})^{T} = \frac{1}{N} (X^{T} - \frac{1}{N} X^{T} I_{N 1} I_{N 1}^{T}) (X^{T} - \frac{1}{N} X^{T} I_{N 1} I_{N 1}^{T})^{T} = \frac{1}{N} X^{T} (E_{N} - \frac{1}{N} I_{N 1} I_{1 N}) (E_{N} - \frac{1}{N} I_{N 1} I_{1 N})^{T} X = \frac{1}{N} X^{T} H_{N} H_{N}^{T} X = \frac{1}{N} X^{T} H_{N} H_{N} X = \frac{1}{N} X^{T} H X

这个式子利用了中心矩阵 $H$ 的对称性，这也是一个投影矩阵。

PCA

PCA

Graph View

降维
背景
样本矩阵
PCA

Backlinks

README

Created with Quartz v4.5.2 © 2025

鄂ICP备2025095675号-1

GitHub
Discord Community