题目
关联规则挖掘过程是发现满足最小支持度和最小置信度A. 正确B. 错误
关联规则挖掘过程是发现满足最小支持度和最小置信度
A. 正确
B. 错误
题目解答
答案
A. 正确
解析
本题考查关联规则挖掘的基本概念和过程。解题思路是明确关联规则挖掘的核心目标和关键衡量指标。
关联规则挖掘是数据挖掘中的一个重要任务,其主要目的是从大量数据中发现项集之间的有趣关系。在这个过程中,有两个非常重要的衡量指标,即最小支持度和最小置信度。
- 支持度(Support):用于衡量一个项集在数据集中出现的频繁程度。设 $X$ 和 $Y$ 是两个项集,支持度的计算公式为:$Support(X \cup Y)=\frac{\text{包含 } X \cup Y \text{ 的事务数}}{\text{总事务数}}$。只有当支持度大于等于最小支持度时,该项集才被认为是频繁项集。
- 置信度(Confidence):用于衡量在包含项集 $X$ 的事务中,同时包含项集 $Y$ 的比例。其计算公式为:$Confidence(X \to Y)=\frac{Support(X \cup Y)}{Support(X)}$。只有当置信度大于等于最小置信度时,关联规则 $X \to Y$ 才被认为是有效的。
关联规则挖掘的过程就是不断地寻找满足最小支持度和最小置信度的关联规则。所以“关联规则挖掘过程是发现满足最小支持度和最小置信度”这一表述是正确的。