题目
使用了伯努利朴素贝叶斯算法对数据集的要求是()。A. 样本特征之间相关联。B. 样本特征为连续数值。C. 符合伯努利分布。D. 没有要求。
使用了伯努利朴素贝叶斯算法对数据集的要求是()。
A. 样本特征之间相关联。
B. 样本特征为连续数值。
C. 符合伯努利分布。
D. 没有要求。
题目解答
答案
伯努利朴素贝叶斯算法是一种基于贝叶斯定理的分类算法,适用于离散型数据集,通常用于处理文本分类等问题。它假设特征之间相互独立,且每个特征都符合伯努利分布,即每个特征都是二元的(取值为0或1)。因此,对于使用了伯努利朴素贝叶斯算法的数据集,要求样本特征之间相关联,并且符合伯努利分布。
正确答案为 C。
解析
伯努利朴素贝叶斯算法的核心在于假设每个特征均服从伯努利分布,即特征为二元变量(如0或1)。其关键要求是数据集的特征需满足这一分布形式,而算法本身依赖于特征独立性假设(与数据实际关联性无关)。因此,本题需明确区分算法假设与数据要求。
选项分析
选项A:样本特征之间相关联
- 错误。朴素贝叶斯的核心假设是特征独立性,与特征是否关联无关。即使数据特征关联,算法仍假设独立,但数据本身无需满足关联性。
选项B:样本特征为连续数值
- 错误。伯努利分布要求特征为二元离散值(如存在/不存在),连续数值需通过其他方法(如分箱)转换为离散形式,或使用高斯朴素贝叶斯。
选项C:符合伯努利分布
- 正确。伯努利NB要求每个特征取值为0或1,严格符合伯努利分布的特性。
选项D:没有要求
- 错误。算法对数据形式有明确要求(二元特征),不能忽略分布假设。