襄阳网站seo方法,wordpress文章保存目录,广西美丽乡村建设网站,ai生成图片在线制作“啤酒和尿布的荣誉”
概念
项 item#xff1a;单个的事物个体 #xff0c;I{i1,i2…im}是所有项的集合#xff0c;|I|m是项的总数项集#xff08;item set)/模式#xff08;pattern)#xff1a;项的集合#xff0c;包含k个项的项集称为k-项集数据集(data set)/数据库…“啤酒和尿布的荣誉”
概念
项 item单个的事物个体 I{i1,i2…im}是所有项的集合|I|m是项的总数项集item set)/模式pattern)项的集合包含k个项的项集称为k-项集数据集(data set)/数据库(data base)D{T1,T2,…Tn}是与任务相关的数据库事务/记录/交易的集合每个事务有一个标识符称作TID。|D|n为数据集中包含的事务总数。支持度support 项集的出现频率0~1/比例绝对数置信度/可信度(confidence)在D中的那些包含A的事务中B也同时出现的条件概率P(B|A)P(AB)/P(A)频繁项集(frequent itemset)/模式(pattern)项集的支持度最小支持度(min support)关联规则(association rules):关联规则是形如AB的蕴含式具有支持度ssupport(A ∪ \cup ∪B)cconfidence(AB)P(B|A)support(A ∪ \cup ∪B)/support(A)强规则同时满足最小支持度和最小置信度的规则称作强规则。关联规则发掘分为两步 找出所有频繁项集产生强规则
例子 结论与注意事项
1.非频繁项集的超集都是非频繁的 support(y)support(x)min_sup yx ∪ \cup ∪其他 2.频繁项集的子集是频繁的
1.强规则不一定有价值 2.相关分析corr(A,B)P(A ∪ \cup ∪B)/P(A)P(B) 正相关1,负相关1独立1
问题分类
根据规则中所处理的值的类型分类
布尔关联规则(boolean association rule)规则考虑的关联是项的在与不在量化关联规则(quantitative association rule)规则描述的是量化的项或属性之间的关联
根据规则中所涉及的数据维数分类
单维关联规则(single-dimensional association rule) 规则中的项或属性每个只涉及一个维多维关联规则(multi-dimensional association rule):规则涉及多维度
根据规则中所涉及的抽象层分类
单层关联规则(single-level association rule)规则不考虑项的分层多层关联规则(multi-level association rule)考虑项的分层 buys(X,milk)buys(X,food)
频繁模式挖掘的分类
频繁模式挖掘交互挖掘增量挖掘效用频繁模式挖掘最大频繁模式挖掘频繁闭合模式挖掘并行/分布式挖掘
经典算法
基于候选项生成与测试(candidate generation and test)
非频繁项集的超集都是非频繁的 代表作apriori1994
基于分治的模式增长pattern growth)
采用分而治之的方法频繁项集的子集是频繁的 代表作:FP-growth(2000)