题目
如果样本数据本身是无法标注的,我们可以针对数据的相似性和差异性将一组数据分为几个类别,这种寻找数据之间的相似性并将之划分组的方法称为()。A. 回归B. 分类C. 递归D. 聚类
如果样本数据本身是无法标注的,我们可以针对数据的相似性和差异性将一组数据分为几个类别,这种寻找数据之间的相似性并将之划分组的方法称为()。
A. 回归
B. 分类
C. 递归
D. 聚类
题目解答
答案
D. 聚类
解析
考查要点:本题主要考查对无监督学习方法中聚类概念的理解,以及区分其他常见机器学习方法(如回归、分类)的能力。
解题核心思路:
- 明确题目中“无法标注的数据”意味着无监督学习场景。
- 聚类的核心是根据数据的相似性自动分组,无需依赖标签。
- 排除需要标注数据的方法(如分类、回归),以及与算法结构相关的术语(如递归)。
破题关键点:
- 聚类是无监督学习的典型任务,专门处理未标注数据。
- 其他选项中,分类需要标签,回归用于预测数值,递归属于编程概念,均不符合题意。
选项分析:
- A. 回归:用于预测连续数值(如房价),属于监督学习,需要标注数据,排除。
- B. 分类:用于预测类别标签(如 spam/ham),同样需要标注数据,排除。
- C. 递归:计算机科学中指函数自身调用,与机器学习无关,排除。
- D. 聚类:无监督学习方法,通过数据间相似性自动分组,符合题意。
结论:正确答案为D. 聚类。