首页 | 本学科首页   官方微博 | 高级检索  
   检索      

多源文本数据真值发现方法
引用本文:曹建军,常宸,陶嘉庆,翁年凤,蒋国权.多源文本数据真值发现方法[J].国防科技大学学报,2022,44(4):172-179.
作者姓名:曹建军  常宸  陶嘉庆  翁年凤  蒋国权
作者单位:国防科技大学 第六十三研究所, 江苏 南京 210007;陆军工程大学 指挥控制工程学院, 江苏 南京 210007;国防科技大学 第六十三研究所, 江苏 南京 210007;南京工业大学 工业工程系, 江苏 南京 211800
基金项目:国家自然科学基金资助项目(61371196);中国博士后科学基金资助项目(20090461425);中国博士后科学基金特别资助项目(201003797)〖
摘    要:针对传统真值发现算法无法直接应用于文本数据的问题,提出基于深度神经网络面向多源文本数据的真值发现算法(NN_Truth)。根据文本答案多因素性、词语使用多样性以及文本数据稀疏性等特点,将“数据源-答案”向量作为网络输入,识别答案真值向量作为网络输出,依据真值发现的一般假设,无监督学习各数据源答案向量间关联关系,并最终获得答案真值。实验结果表明,该算法适用于文本数据真值发现场景,较基于检索的方法及传统真值发现算法效果更优。

关 键 词:数据质量  真值发现  神经网络  文本挖掘
收稿时间:2020/11/24 0:00:00

Truth discovery method for multi-source text data
CAO Jianjun,CHANG Chen,TAO Jiaqing,WENG Nianfeng,JIANG Guoquan.Truth discovery method for multi-source text data[J].Journal of National University of Defense Technology,2022,44(4):172-179.
Authors:CAO Jianjun  CHANG Chen  TAO Jiaqing  WENG Nianfeng  JIANG Guoquan
Institution:The Sixty-third Research Institute, National University of Defense Technology, Nanjing 210007, China;Command and Control Engineering College, Army Engineering University, Nanjing 210007, China;The Sixty-third Research Institute, National University of Defense Technology, Nanjing 210007, China;Department of Industrial Engineering, Nanjing Tech University, Nanjing 211800, China
Abstract:
Keywords:data quality  truth discovery  neural network  text mining
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号