改进的Apriori关联规则挖掘算法
来源:wenku163.com 资料编号:WK16317204 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK16317204
资料介绍
改进的Apriori关联规则挖掘算法(中文6000字,英文PDF)
摘要:关联规则是数据挖掘的主要技术,而Apriori算法是关联规则挖掘算法中的一种经典的算法。许多的关于关联规则和其转变的算法都是在Apriori算法的基础上提出来的,但是传统的算法的效率不高,对于频繁项集挖掘的两个瓶颈:大量的候选项目集,计算他们的支持度的效率较差。改进的算法降低了C2的一个冗余修剪的操作。如果频繁1项集的数量为n,当修剪操作为Cn时,连接候选2项集的数量为Cn。所提出的该算法减小了候选2项集的修剪操作,从而节省了时间,提高了效率。对于瓶颈:计算支持度的效率低下,提出的算法优化自己的操作,通过事务标记,以加快支持度的计算。Apriori算法是最古老和最通用的频繁模式挖掘(FPM)算法之一。它的优点和有节制的搜索空间的变量在对于非常大的数据库进行挖掘是很有优势。提出的算法通过减少修剪操作来改进Apriori算法,通过先验根操作产生候选2项集。此外,它采用了级数标签法快速地计算出支持度,从而使瓶颈被克服。
关键词:关联规则挖掘,频繁项集的产生,支持度和置信度。
|