首页 | 本学科首页   官方微博 | 高级检索  
     

分块自适应加权改进大规模概率模糊聚类
作者姓名:景慎艳  刘松迪
作者单位:1.辽宁对外经贸学院大数据研究院;2.吉林大学软件学院
摘    要:为解决传统基于贝叶斯理论的概率模糊聚类(Bayesian Fuzzy Clustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BFC算法,用于数据分块内数据聚类,以挑选出对聚类贡献最具代表的标识数据及其自适应权值,在块间迭代聚类过程中,将标识数据及其权值合并到下一数据块中并参与聚类,从而将上一数据块的聚类信息有效地传递到下一数据块中,最后分析算法的收敛性和时间复杂度。实验结果表明,算法在继承传统BFC算法良好聚类性能基础上,减少计算复杂度,有效提高聚类效率,适用于大规模数据集聚类。

关 键 词:大规模数据集聚类  数据分块  加权概率模糊聚类  自适应数据加权  聚类信息传递
本文献已被 万方数据 等数据库收录!
点击此处可从《火力与指挥控制》浏览原始摘要信息
点击此处可从《火力与指挥控制》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号