汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现 |
| |
引用本文: | 蔡小艳,寇应展,沈巍,郑伟.汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现[J].军械工程学院学报,2008,20(5):63-66,70. |
| |
作者姓名: | 蔡小艳 寇应展 沈巍 郑伟 |
| |
作者单位: | [1]军械工程学院计算机工程系,河北石家庄050003 [2]北京航空航天大学电子信息工程学院,北京100083 |
| |
摘 要: | 分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。
|
关 键 词: | Nutch Lucene ICTCLAS 中文分词 汉语词法分析系统 |
本文献已被 维普 等数据库收录! |
|