题目
2.朴素贝叶斯算法中,为什么被称为'朴素'(naive)?A 因为它使用了简单的数学模型,不涉及复杂的计算。B 因为它假设特征之间是相互独立的,即给定类别下特征之间没有关联。C 因为只能处理离散数据,对于连续数据表现较差。D 因为它采用了一种直观的直方图分布方法。
2.朴素贝叶斯算法中,为什么被称为'朴素'(naive)?
A 因为它使用了简单的数学模型,不涉及复杂的计算。
B 因为它假设特征之间是相互独立的,即给定类别下特征之间没有关联。
C 因为只能处理离散数据,对于连续数据表现较差。
D 因为它采用了一种直观的直方图分布方法。
题目解答
答案
答案选B。
朴素贝叶斯算法被称为"朴素"主要是因为它假设特征之间在给定类别的条件下是相互独立的。这个假设极大地简化了模型的计算过程,因为它允许单独地计算每个特征的贡献,而不需要担心特征之间的相互作用和依赖关系。虽然这个假设在很多实际情况下并不完全成立,但朴素贝叶斯算法仍然能够提供令人满意的性能,特别是在文本分类和垃圾邮件识别等领域。
因此,正确的答案是:
B 因为它假设特征之间是相互独立的,即给定类别下特征之间没有关联。
解析
朴素贝叶斯算法的核心在于“特征独立性假设”。题目考查对“朴素”这一名称由来的理解。关键点在于明确算法中对特征之间关系的假设,而非具体计算过程或数据类型限制。需抓住“独立性”这一核心概念,排除其他干扰选项。
选项分析:
- A:错误。朴素贝叶斯涉及概率计算(如条件概率公式),并非“简单数学模型”,且“复杂计算”并非其核心特点。
- B:正确。假设在给定类别下,所有特征相互独立,这是“朴素”的来源。例如,计算概率时只需考虑单个特征的影响,而非特征间的关联。
- C:错误。虽然朴素贝叶斯对连续数据处理较弱(需离散化),但这属于算法的局限性,与“朴素”无关。
- D:错误。直方图方法可能用于某些实现,但并非算法的核心假设。
关键结论:
朴素贝叶斯的“朴素”源于独立性假设,极大简化了计算,但实际数据中特征往往相关,这被称为“强假设弱模型”。