计算机应用 ›› 2011, Vol. 31 ›› Issue (05): 1391-1394.DOI: 10.3724/SP.J.1087.2011.01391
凌绪雄1,2,王社国1,李洋2,3, 苗再良2
LING Xu-xiong1,2, WANG She-guo1, LI Yang2,3, MIAO Zai-liang2
摘要: 针对FP-Growth算法中频繁模式树的遍历低效问题,提出了一种无项头表的频繁模式增长算法。该算法利用递归回溯的方式遍历频繁模式树以求取条件模式基,解决了对同一树路径多次重复遍历的问题。从理论分析和实际挖掘能力两方面,将新算法与FP-Growth算法进行了对比。结果表明,新算法有效减少了条件模式基的搜索开销,使频繁模式挖掘的效率提高了2~5倍,在时间和空间性能上均优于FP-Growth算法。将该算法应用于通信告警关联规则挖掘,较快地挖掘出了关联规则结果,且正确规则的覆盖率达到了83.3%。
中图分类号: