题目
KNN算法在分类任务中如何确定一个样本的类别?A. 选择最近的K个邻居,取它们的平均值B. 选择最近的K个邻居,取出现次数最多的类别C. 选择最近的一个邻居,取它的类别D. 选择最远的K个邻居,取出现次数最少的类别
KNN算法在分类任务中如何确定一个样本的类别?
A. 选择最近的K个邻居,取它们的平均值
B. 选择最近的K个邻居,取出现次数最多的类别
C. 选择最近的一个邻居,取它的类别
D. 选择最远的K个邻居,取出现次数最少的类别
题目解答
答案
B. 选择最近的K个邻居,取出现次数最多的类别
解析
KNN算法是一种基于实例的监督学习方法,其核心思想是“近朱者赤,近墨者黑”,即通过已有样本的类别来预测新样本的类别。在分类任务中,KNN的关键步骤是:
- 计算距离:确定新样本与训练集中所有样本的距离;
- 选择K近邻:按距离排序,选取最近的K个样本;
- 投票决策:根据这K个样本的类别,采用多数投票法确定最终类别。
破题关键在于区分分类与回归任务的差异:分类任务用“类别投票”,回归任务用“数值平均”。题目明确为分类任务,因此正确答案需体现“多数类别”。
选项分析
- A. 取平均值:错误。平均值适用于回归任务(如预测房价),而非分类任务。
- B. 取出现次数最多的类别:正确。分类任务中,KNN通过统计K近邻中出现次数最多的类别进行预测。
- C. 取最近的一个邻居:错误。虽然K可设为1,但题目问的是KNN的通用逻辑,而非特例。
- D. 取最远的K个邻居:错误。KNN始终选择最近的K个邻居,而非最远。