首页 | 本学科首页   官方微博 | 高级检索  
     

不平衡数据的软件缺陷预测方法
作者姓名:常瑞花  慕晓冬  宋国军  张海静  尹宗润
作者单位:1.西安高技术研究所;2.解放军96550部队
摘    要:数据的不平衡问题是数据分类领域中的一个热点问题。当分类算法处理这些数据时,算法将偏向多数类而忽视少数类。在软件缺陷预测领域,它并没有引起足够的重视,在4组NASA不平衡数据上比较和分析了14种分类算法的性能,为了克服数据的不平衡性,采用SMOTE技术对软件缺陷数据进行平衡化,最后在AUC和F-measure评价指标下对算法进行评估。实验结果表明随机森林算法在4组数据上表现最佳,这为软件缺陷预测提供了很好的参考。

关 键 词:软件缺陷  预测  度量元  不平衡数据
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《火力与指挥控制》浏览原始摘要信息
点击此处可从《火力与指挥控制》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号