题目
在数据分析中,主成分分析(P A. 是一种常用的降维技术。其主要目标是通过选择少量主成分来保留数据中的大部分方差信息。以下哪项最能描述主成分分析的一个关键特性?()A. 主成分分析能够通过无监督学习的方法有效地处理缺失数据。B. 主成分分析在保留信息的同时,会改变数据的实际分布。C. 主成分分析可以将高维数据映射到低维空间,同时尽量保留数据的原始结构和特征。D. 主成分分析只适用于线性数据,无法处理非线性关系。
在数据分析中,主成分分析(P
- A. 是一种常用的降维技术。其主要目标是通过选择少量主成分来保留数据中的大部分方差信息。以下哪项最能描述主成分分析的一个关键特性?()
- A. 主成分分析能够通过无监督学习的方法有效地处理缺失数据。
- B. 主成分分析在保留信息的同时,会改变数据的实际分布。
- C. 主成分分析可以将高维数据映射到低维空间,同时尽量保留数据的原始结构和特征。
- D. 主成分分析只适用于线性数据,无法处理非线性关系。
题目解答
答案
C
解析
主成分分析(PCA)的核心目标是通过降维技术,在减少数据维度的同时保留尽可能多的信息(通常以方差衡量)。其关键特性包括:
- 线性变换:通过正交变换将原始变量线性组合成主成分。
- 降维本质:将高维数据映射到低维空间,同时保留数据的主要结构和特征。
- 无监督学习:不依赖数据标签,仅利用数据内部的协方差结构。
- 线性限制:仅适用于线性可分的数据,非线性关系需其他方法处理。
本题需结合选项,判断哪项最能体现PCA的核心功能。
选项分析:
- A:PCA虽为无监督学习,但处理缺失数据并非其核心功能。实际应用中,缺失数据需先通过其他方法(如插补)处理,因此不选。
- B:PCA通过正交变换改变数据表示方式,主成分之间正交,可能改变变量间相关性,但“改变数据实际分布”的表述不准确,数据本质分布未被修改,因此不选。
- C:PCA通过选择主成分实现高维到低维的映射,并保留数据的原始结构和特征(如方差最大化),直接对应其核心目标,因此正确。
- D:PCA仅适用于线性关系的描述,但题目要求选择关键特性而非局限性,因此不选。