首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于混合搜索的高效Top-K最频繁模式挖掘算法
引用本文:敖富江,杜静,陈彬,黄柯棣. 一种基于混合搜索的高效Top-K最频繁模式挖掘算法[J]. 国防科技大学学报, 2009, 31(2): 90-93
作者姓名:敖富江  杜静  陈彬  黄柯棣
作者单位:国防科技大学,机电工程与自动化学院,湖南,长沙,410073;国防科技大学,计算机学院,湖南,长沙,410073
摘    要:挖掘数据集中的Top-K最频繁模式具有重要意义.已有Top-K最频繁模式挖掘算法通常采用最频繁的k个项目作为初始项目,并将初始项目中频率最低的项目的支持度作为初始边界支持度.但实际组成Top-K最频繁模式的项目数目可能远少于k,从而制约了算法的效率.为此,提出了一种基于混合搜索方式的高效Top-K最频繁模式挖掘算法MTKFP.该算法首先利用宽度优先搜索获得少量的短项集,并利用短项集确定数目少于k的初始项目范围以及较高的初始边界支持度;然后利用深度优先搜索获得所有Top-K最频繁模式.实验表明,MTKFP算法所获得的初始项目数目至少低于已有算法70%,初始边界支持度高于已有算法;NTKFP算法的性能优于已有最好算法.

关 键 词:Top-K 最频繁模式  边界支持度  混合搜索  FP-Tree
收稿时间:2008-09-18

An Efficient Mixed-searching-based Algorithm for Mining Top-K Most-frequent Patterns
AO FuJiang,DU Jing,CHEN Bin and HUANG KeDi. An Efficient Mixed-searching-based Algorithm for Mining Top-K Most-frequent Patterns[J]. Journal of National University of Defense Technology, 2009, 31(2): 90-93
Authors:AO FuJiang  DU Jing  CHEN Bin  HUANG KeDi
Affiliation:1.College of Mechatronics Engineering and Automation;National Univ.of Defense Technology;Changsha 410073;China;2.College of Computer;China
Abstract:It is significant to mine Top-K most-frequent patterns in dataset.The existing algorithms usually use the k-most frequent items as the initial items,and use the support of item with lowest frequency in initial items as the initial border support.In fact,since the number of items in Top-K most-frequent patterns is much less than k,the efficiency of the existing algorithms is restricted.To solve this problem,an efficient mixed-searching-based algorithm for mining Top-K most-frequent patterns,MTKFP is presente...
Keywords:FP-Tree
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号