题目
在数据分析中,主成分分析(P A. 是一种常用的降维技术。其主要目标是通过选择少量主成分来保留数据中的大部分方差信息。以下哪项最能描述主成分分析的一个关键特性?()A. 主成分分析能够通过无监督学习的方法有效地处理缺失数据。B. 主成分分析可以将高维数据映射到低维空间,同时尽量保留数据的原始结构和特征。C. 主成分分析在保留信息的同时,会改变数据的实际分布。D. 主成分分析只适用于线性数据,无法处理非线性关系。
在数据分析中,主成分分析(P
- A. 是一种常用的降维技术。其主要目标是通过选择少量主成分来保留数据中的大部分方差信息。以下哪项最能描述主成分分析的一个关键特性?()
- A. 主成分分析能够通过无监督学习的方法有效地处理缺失数据。
- B. 主成分分析可以将高维数据映射到低维空间,同时尽量保留数据的原始结构和特征。
- C. 主成分分析在保留信息的同时,会改变数据的实际分布。
- D. 主成分分析只适用于线性数据,无法处理非线性关系。
题目解答
答案
B
解析
主成分分析(PCA)的核心目标是通过降维技术,在减少数据维度的同时保留尽可能多的信息(通常以方差衡量)。其关键特性包括:
- 线性变换:通过正交变换将原始变量线性组合成主成分。
- 降维:将高维数据映射到低维空间,降低复杂性。
- 保留原始结构:主成分按方差大小排序,前几个主成分能保留大部分数据特征。
本题需抓住“降维”与“保留原始结构”的关联,排除干扰项中关于数据分布、适用范围等非核心描述。
选项分析
选项A
“无监督学习处理缺失数据”
- PCA属于无监督学习,但处理缺失数据并非其核心功能。实际应用中,PCA需完整数据矩阵计算协方差,缺失数据需先通过其他方法(如插补)处理。
- 结论:非关键特性,排除。
选项B
“高维映射低维,保留原始结构”
- PCA通过正交变换找到数据的主成分,将高维数据投影到低维空间,确保前几个主成分保留最多方差(即原始数据的结构和特征)。
- 结论:直接体现PCA的核心目标,正确。
选项C
“改变数据实际分布”
- PCA通过线性变换改变数据的坐标系,但数据的分布类型(如高斯分布)并未改变,仅是重新表示数据。
- 结论:表述不准确,排除。
选项D
“仅适用于线性数据”
- PCA基于线性变换,无法处理非线性关系(需其他方法如核PCA)。但本题要求描述关键特性,而非局限性。
- 结论:虽正确但非核心,排除。