1、ES5.4.0 IK分词安装步骤

步骤1:下载最新版的ik插件

地址:https://github.com/medcl/elasticsearch-analysis-ik

步骤2:解压elasticsearch-analysis-ik-master.zip

unzip elasticsearch-analysis-ik-master.zip

步骤3:修改ES版本号。

修改pom.xml,最新(20170622)是5.4.2, 改为5.4.0

步骤4:执行mvn package

步骤5:在/opt/elasticsearch/plugins下新建ik文件夹。

完成拷贝:将
cp elasticsearch-analysis-ik-master/target/releases/elasticsearch-analysis-ik-5.4.0.zip
/opt/elasticsearch/plugins/ik/

步骤6:重启ES。

2、IK使用

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;

ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”

3、小结

1、分词插件有很多,IK是由ES的中国第一位员工曾勇开发的,相对效果更好些。
2、虽然github已经很简明扼要的有说明,但自己安装的时候,总会遇到这样或那样的问题,记录下来,以备后用。

——————————————————————————————————
更多ES相关实战干货经验分享,请扫描下方【铭毅天下】微信公众号二维码关注。
(每周至少更新一篇!)

这里写图片描述
和你一起,死磕Elasticsearch
——————————————————————————————————

2017年7月2日 9:13 于家中床前

作者:铭毅天下
转载请标明出处,原文地址:
http://blog.csdn.net/laoyang360/article/details/74090357
如果感觉本文对您有帮助,请点击‘顶’支持一下,您的支持是我坚持写作最大的动力,谢谢!

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐