Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

习题9-1 #63

Open
simo-an opened this issue Jan 24, 2022 · 1 comment
Open

习题9-1 #63

simo-an opened this issue Jan 24, 2022 · 1 comment

Comments

@simo-an
Copy link

simo-an commented Jan 24, 2022

习题9-1 分析主成分分析为什么具有数据降噪能力?

解答

什么是主成分分析?

主成分分析( PCA) 是一种最常用的数据降维方法, 使得在转换后的空间中数据的方差最大。
如图9.1所示的两维数据, 如果将这些数据投影到一维空间中, 选择数据方差最大的方向进行投影, 才能最大化数据的差异性, 保留更多的原始数据信息。(根据信息论,数据方差越大,包含的信息越大,方差为0,则不包含任何信息)

image

主成分分析为什么具有数据降噪能力?

主成分分析有两个步骤:

  1. 线性投影:将高维数据映射到底维度(保证最大投影方差)
  2. 重构:将底维数据重构回原始维度(保证最小重构误差)

在上面的两个过程中,重构回的数据会丢失一部分信息,这部分信息可能就是噪声,所以具有数据降噪能力。一下举一个例子:

image

如上面的二维数据可能是某一线性函数f(x) = ax + b在引入噪声后的分布情况,现将其线性映射到一维空间上(如x轴上),再重构回二维空间,数据就会服从在某一函数g(x) = ax + b上(成了一条直线),相当于去掉了噪声。

@simo-an
Copy link
Author

simo-an commented Jan 24, 2022

参考:https://www.cxymm.net/article/m0_38056893/103188612

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant