基于软聚类的模糊类语言模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于软聚类的模糊类语言模型

作者姓名：	顾思远尹廷辉岳振军

作者单位：	解放军理工大学通信工程学院研究生1队;解放军理工大学通信工程学院

基金项目：	江苏省自然科学基金资助项目(BK2012511)

摘要：	基于类的语言模型被认为是解决数据稀疏的有效方法。众所周知,自然语言中存在着大量一词多义、一词多性的现象,这在传统基于硬聚类的词类划分下无法表达。而基于软聚类的类语言模型采用大数定律,依然没有摆脱在最终计算时一词一类的思维模式。为解决此类问题,基于词的软聚类,结合模糊数学,提出了词的隶属度,以及基于隶属度的模糊类语言模型。该模型提高了传统类语言模型对训练语料中历史信息的利用率,较基于词的语言模型能给未出现词对提供更多的类内参考数据。设计了一个小语料集的实验,结果表明在数据稀疏条件下,较传统的类语言模型有更好的效果。
关键词：	词的软聚类统计语言模型隶属度模糊类语言模型
本文献已被 CNKI 等数据库收录！