垃圾评论自动过滤方法 |
| |
作者姓名: | 谭文堂 朱洪 葛斌 李芳芳 肖卫东 |
| |
作者单位: | 国防科技大学 信息系统工程重点实验室,湖南 长沙,410073 |
| |
基金项目: | 国家自然科学基金资助项目,国防科技大学优秀研究生创新基金资助项目 |
| |
摘 要: | 针对互联网上存在的大量垃圾评论,提出一种基于电阻网络的垃圾评论检测方法,该方法用电阻距离来度量评论之间的上下文语义相似性,把整个评论数据表示成一个电阻网络,把垃圾评论当作该网络上的语义离群点来处理,根据网络节点对电阻网络平均电能消耗的影响,建立电离群因子来度量数据的离群程度,以此来识别垃圾评论。实验证明了该方法的有效性,在多个数据集上取得了较好的效果。
|
关 键 词: | 垃圾评论检测 电阻距离 电离群因子 |
收稿时间: | 2012-03-04 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载全文 |
|