Update README.md

This commit is contained in:
Magese 2018-05-10 14:24:19 +08:00 committed by GitHub
parent 5202672a5a
commit b492e1c4d3
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -5,35 +5,43 @@ ik-analyzer for solr7.x
在不需要重启solr服务的情况下加载新增的字典。
<hr>
使用说明:<br>
<h2>使用说明:</h2><br>
1-将jar包放入solr服务的jetty或tomcat的webapp/WEB-INF/lib/目录下;
1-将jar包放入solr服务的jetty或tomcat的webapp/WEB-INF/lib/目录下;<br>
2-将resources目录下的5个配置文件(IKAnalyzer.cfg.xml; ext.dic; stopword.dic; ik.conf; dynamicdic.txt)放入solr服务的jetty或tomcat的webapp/WEB-INF/classes/目录下;
2-将resources目录下的5个配置文件(IKAnalyzer.cfg.xml; ext.dic; stopword.dic; ik.conf; dynamicdic.txt)放入solr服务的jetty或tomcat的webapp/WEB-INF/classes/目录下;<br>
3-配置solr的managed-schema添加ik分词器示例如下
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="true" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
3-配置solr的managed-schema添加ik分词器示例如下<br>
<div class="content">
<pre>
{{
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="true" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
}}
</pre>
</div>
4-启动solr服务测试分词
5-ik.conf文件说明
files=dynamicdic.txt
lastupdate=0
4-启动solr服务测试分词<br>
5-ik.conf文件说明<br>
files=dynamicdic.txt<br>
lastupdate=0<br>
 files为动态字典列表可以设置多个字典表用逗号进行分隔默认动态字典表为dynamicdic.txt
 lastupdate默认值为0每次对动态字典表修改后请+1不然不会将字典表中新的词语添加到内存中lastupdate采用的是int类型不支持时间戳如果使用时间戳的朋友可以把源码中的int改成long即可
 files为动态字典列表可以设置多个字典表用逗号进行分隔默认动态字典表为dynamicdic.txt<br>
 lastupdate默认值为0每次对动态字典表修改后请+1不然不会将字典表中新的词语添加到内存中lastupdate采用的是int类型不支持时间戳如果使用时间戳的朋友可以把源码中的int改成long即可<br>
5-dynamicdic.txt 为动态字典,在此文件配置的词语不需重启服务即可加载进内存中;
5-dynamicdic.txt 为动态字典,在此文件配置的词语不需重启服务即可加载进内存中;<br>
<hr>
有问题可以联系作者邮箱magese@live.cn
欢迎大家一起交流~
有问题可以联系作者邮箱magese@live.cn<br>
欢迎大家一起交流~<br>