首页 | 本学科首页   官方微博 | 高级检索  
     

基于软聚类的模糊类语言模型
作者姓名:顾思远  尹廷辉  岳振军
作者单位:解放军理工大学通信工程学院研究生1队;解放军理工大学通信工程学院
基金项目:江苏省自然科学基金资助项目(BK2012511)
摘    要:基于类的语言模型被认为是解决数据稀疏的有效方法。众所周知,自然语言中存在着大量一词多义、一词多性的现象,这在传统基于硬聚类的词类划分下无法表达。而基于软聚类的类语言模型采用大数定律,依然没有摆脱在最终计算时一词一类的思维模式。为解决此类问题,基于词的软聚类,结合模糊数学,提出了词的隶属度,以及基于隶属度的模糊类语言模型。该模型提高了传统类语言模型对训练语料中历史信息的利用率,较基于词的语言模型能给未出现词对提供更多的类内参考数据。设计了一个小语料集的实验,结果表明在数据稀疏条件下,较传统的类语言模型有更好的效果。

关 键 词:词的软聚类  统计语言模型  隶属度  模糊类语言模型
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号