题目
大型数据库中的关联规则挖掘包含哪两个过程A. 找出所有频繁项集B. 由频繁项集产生强关联规则C. 项合并D. 子项集剪枝
大型数据库中的关联规则挖掘包含哪两个过程
A. 找出所有频繁项集
B. 由频繁项集产生强关联规则
C. 项合并
D. 子项集剪枝
题目解答
答案
AB
A. 找出所有频繁项集
B. 由频繁项集产生强关联规则
A. 找出所有频繁项集
B. 由频繁项集产生强关联规则
解析
本题考查大型数据库中关联规则挖掘的基本过程这一知识点。解题思路是明确关联规则挖掘的核心步骤,然后分析每个选项是否属于该核心步骤。
关联规则挖掘主要有两个关键过程:
- 找出所有频繁项集集:频繁项集是指在数据集中频繁出现的项的集合。在关联规则挖掘中,首先需要从大量的数据中找出那些出现频率达到一定阈值的最小支持度阈值的项集,这些项集被称为频繁项集。因为只有频繁出现的项集才有可能产生有意义的关联规则。例如,在超市购物篮数据中,频繁项集可能是“{牛奶,面包}”,表示购买牛奶和面包的情况经常发生的频率较高。
- 由频繁项集产生强关联规则:在得到频繁项集后,需要从这些频繁项集中生成关联规则。关联规则的形式通常为 $X \Rightarrow Y$,其中 $X$ 和 $Y$ 是项项集的子集,且 $X \cap Y = \varnothing$。然后需要根据最小置信度阈值来筛选出强关联规则,即满足一定置信度要求的规则。例如,从频繁项集“{牛奶,面包}”可以生成规则具体具体的关联规则,如“如果购买了牛奶,那么购买面包”,并判断该规则是否满足最小置信度。
对于选项C“项合并”和选项D“子项集剪枝”,它们是在找出频繁项集过程中可能会用到的一些技术手段,而不是关联规则挖掘的核心过程。