首页 | 本学科首页   官方微博 | 高级检索  
   检索      

汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现
引用本文:蔡小艳,寇应展,沈巍,郑伟.汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现[J].军械工程学院学报,2008,20(5):63-66,70.
作者姓名:蔡小艳  寇应展  沈巍  郑伟
作者单位:[1]军械工程学院计算机工程系,河北石家庄050003 [2]北京航空航天大学电子信息工程学院,北京100083
摘    要:分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。

关 键 词:Nutch  Lucene  ICTCLAS  中文分词  汉语词法分析系统
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号