题目
关于聚类分析下列描述正确的是()。A. 聚类分析是回归分析的一种。B. 聚类分析会使用到欧氏距离的概念。C. K-means算法是目前使用最广泛的聚类算法。D. 我们有时需要通过观察个体的特征,将群体中的个体归为不同的族群/簇,以上的归类过程均称为聚类分析。E. 聚类分析过程中每个点到中心点的距离仅测算一次。
关于聚类分析下列描述正确的是()。
A. 聚类分析是回归分析的一种。
B. 聚类分析会使用到欧氏距离的概念。
C. K-means算法是目前使用最广泛的聚类算法。
D. 我们有时需要通过观察个体的特征,将群体中的个体归为不同的族群/簇,以上的归类过程均称为聚类分析。
E. 聚类分析过程中每个点到中心点的距离仅测算一次。
题目解答
答案
BCD
B. 聚类分析会使用到欧氏距离的概念。
C. K-means算法是目前使用最广泛的聚类算法。
D. 我们有时需要通过观察个体的特征,将群体中的个体归为不同的族群/簇,以上的归类过程均称为聚类分析。
B. 聚类分析会使用到欧氏距离的概念。
C. K-means算法是目前使用最广泛的聚类算法。
D. 我们有时需要通过观察个体的特征,将群体中的个体归为不同的族群/簇,以上的归类过程均称为聚类分析。
解析
聚类分析是无监督学习中的一种重要方法,其核心是根据数据特征将样本划分成不同的簇。本题需结合聚类分析的基本概念、常见算法(如K-means)及计算过程进行判断。关键点在于:
- 区分聚类与回归:回归属于监督学习,而聚类属于无监督学习。
- 距离度量:欧氏距离是聚类中常用的相似性度量方式。
- K-means算法特点:广泛应用但需预先指定簇数,且需多次迭代计算距离。
- 聚类定义:强调基于特征的自动分组过程。
选项分析
A. 聚类分析是回归分析的一种
错误。聚类分析属于无监督学习,用于发现数据内在的分组结构;而回归分析属于监督学习,用于预测连续数值输出。两者目标和方法均不同。
B. 聚类分析会使用到欧氏距离的概念
正确。聚类分析中(如K-means算法),常用欧氏距离衡量数据点之间的相似性,距离越小表示相似性越高。
C. K-means算法是目前使用最广泛的聚类算法
正确。K-means因简单高效且易于实现,成为应用最广泛的聚类算法之一,尽管其存在需预先指定簇数等局限。
D. 我们有时需要通过观察个体的特征,将群体中的个体归为不同的族群/簇,以上的归类过程均称为聚类分析
正确。聚类分析的定义即为根据特征将数据自动分组,描述符合其核心思想。
E. 聚类分析过程中每个点到中心点的距离仅测算一次
错误。以K-means为例,算法通过迭代更新簇中心,每次迭代需重新计算所有点到当前中心的距离,直到收敛,因此距离计算会多次进行。