当前位置: 代码迷 >> Java相关 >> 共享一个不错的Lucene中文分词包!
  详细解决方案

共享一个不错的Lucene中文分词包!

热度:455   发布时间:2006-06-09 13:54:32.0
共享一个不错的Lucene中文分词包!
下载地址:http://www.jesoft.cn/posts/list/5.page

1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整

1.1
增加扩展词典的静态读取方法

1.0.1
修正无法识别生僻字的问题

1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法
搜索更多相关的解决方案: Lucene  中文  分词  

----------------解决方案--------------------------------------------------------
  相关解决方案