题目
下表是一个购物篮,假定支持度阈值为 40% ,其中 __ 是频繁闭项集。 TID 项 1 abc 2 abcd 3 bce 4 acde 5 deA. abcB. adC. cdD. de
下表是一个购物篮,假定支持度阈值为 40% ,其中 __ 是频繁闭项集。 TID 项 1 abc 2 abcd 3 bce 4 acde 5 de
A. abc
B. ad
C. cd
D. de
题目解答
答案
AD
A. abc
D. de
A. abc
D. de
解析
考查要点:本题主要考查频繁闭项集的判断,需要结合支持度阈值,分析项集的频繁性及其超集的频繁性。
解题核心思路:
- 计算每个选项的支持度,判断是否达到阈值(40%)。
- 检查所有真超集是否都不频繁。若某项集的所有真超集均不频繁,则该项集为频繁闭项集。
破题关键点:
- 支持度计算:统计项集在所有交易中的出现次数。
- 超集分析:确认是否存在比当前项集更大的频繁项集。
选项A:abc
- 支持度计算:
- TID1(abc)、TID2(abcd)包含
abc,共2次。 - 支持度:$\frac{2}{5} = 40\%$,达到阈值,是频繁项集。
- TID1(abc)、TID2(abcd)包含
- 超集分析:
- 真超集如
abcd(仅TID2出现,支持度20%),均不频繁。 - 结论:
abc是频繁闭项集。
- 真超集如
选项D:de
- 支持度计算:
- TID4(acde)、TID5(de)包含
de,共2次。 - 支持度:$\frac{2}{5} = 40\%$,达到阈值,是频繁项集。
- TID4(acde)、TID5(de)包含
- 超集分析:
- 真超集如
cde(仅TID4出现,支持度20%),均不频繁。 - 结论:
de是频繁闭项集。
- 真超集如
选项B:ad
- 支持度计算:
- TID2(abcd)、TID4(acde)包含
ad,共2次。 - 支持度:$\frac{2}{5} = 40\%$,是频繁项集。
- TID2(abcd)、TID4(acde)包含
- 超集分析:
- 真超集
acd(TID2、TID4出现,支持度40%),频繁。 - 结论:
ad不是频繁闭项集。
- 真超集
选项C:cd
- 支持度计算:
- TID2(abcd)、TID4(acde)包含
cd,共2次。 - 支持度:$\frac{2}{5} = 40\%$,是频繁项集。
- TID2(abcd)、TID4(acde)包含
- 超集分析:
- 真超集
acd(TID2、TID4出现,支持度40%),频繁。 - 结论:
cd不是频繁闭项集。
- 真超集