中文分词包
2016-08-23
0 0 0
暂无评分
其他
如何获取积分?
默认的mahout是不支持中文分词的,这需要我们把分词程序弄到mahout的jar包中。
这里利用了原作者已经写好的分词程序,先把几个jar包下载下来(mmseg4j-solr-2.2.0.jar mmseg4j-core-1.9.1.jar mmseg4j-analysis-1.9.1.jar)里边包含了作者写好的分词程序。
把mahout目录下的mahout-examples-0.10.1-job.jar文件拷出来,跟上边三个jar包一起,把4个jar包用压缩工具解压,把mmseg4j-solr-2.2.0 mmseg4j-core-1.9.1 mmseg4j-analysis-1.9.1文件夹中除了META-INF,其他都中拷贝到mahout-examples-0.10.1-job,再把mahout-examples-0.10.1-job压缩成mahout-examples-0.10.1-job.zip,把后缀改一下mahout-examples-0.10.1-job.jar,把mahout目录下的mahout-examples-0.10.1-job.jar替换一下
中文
分词
相关源码推荐
毛 泽 东字体ttf文件
0
0
暂无评分
张正友带中文解释的标定
2
0
暂无评分
er9x用户手册之简体中文版本
0
0
暂无评分
Groovy&Grails中文文档翻译
0
0
暂无评分
简体繁体中文翻译工具
0
0
暂无评分
暂无评论