题目
置信度是衡量什么的指标?A. 项集在记录中出现的频繁程度B. 关联规则的可靠程度C. 数据的质量D. 数据的相似性
置信度是衡量什么的指标?
A. 项集在记录中出现的频繁程度
B. 关联规则的可靠程度
C. 数据的质量
D. 数据的相似性
题目解答
答案
B. 关联规则的可靠程度
解析
置信度是数据挖掘中关联规则分析的重要概念,用于评估规则的可靠性。本题的关键在于区分支持度与置信度的不同作用:
- 支持度衡量项集出现的频繁程度(对应选项A);
- 置信度则反映关联规则的成立概率,即“前件出现时后件也出现”的可信度(对应选项B)。
其他选项(C、D)与置信度无关,可直接排除。
关联规则通常用“A→B”表示,其核心度量包括:
- 支持度(Support):项集A和B同时出现的频率,公式为:
$\text{Support}(A \cup B) = \frac{\text{包含A和B的记录数}}{\text{总记录数}}$
对应选项A的“项集出现的频繁程度”。 - 置信度(Confidence):规则的可靠性,公式为:
$\text{Confidence}(A \rightarrow B) = \frac{\text{Support}(A \cup B)}{\text{Support}(A)}$
表示在A出现的情况下,B也出现的概率,对应选项B的“关联规则的可靠程度”。
选项分析:
- C(数据质量)涉及数据的完整性、准确性,与规则无关;
- D(数据相似性)通常指数据间距离或相似度计算,与置信度无直接联系。