2018-05-10 01:56:19 -04:00
|
|
|
|
# ik-analyzer-solr7
|
|
|
|
|
ik-analyzer for solr7.x
|
|
|
|
|
|
|
|
|
|
适配最新版solr7,并添加动态加载字典表功能;
|
|
|
|
|
在不需要重启solr服务的情况下加载新增的字典。
|
2018-05-10 02:20:06 -04:00
|
|
|
|
|
2018-05-10 02:20:53 -04:00
|
|
|
|
<hr>
|
2018-05-10 02:24:19 -04:00
|
|
|
|
<h2>使用说明:</h2><br>
|
|
|
|
|
|
2018-05-10 02:37:57 -04:00
|
|
|
|
<ul>
|
|
|
|
|
<li>
|
|
|
|
|
<p>1. 将jar包放入solr服务的jetty或tomcat的webapp/WEB-INF/lib/目录下;</p>
|
|
|
|
|
</li>
|
|
|
|
|
<li>
|
|
|
|
|
<p>2. 将resources目录下的5个配置文件放入solr服务的jetty或tomcat的webapp/WEB-INF/classes/目录下;</p>
|
|
|
|
|
<p>①IKAnalyzer.cfg.xml</p>
|
|
|
|
|
<p>②ext.dic</p>
|
|
|
|
|
<p>③stopword.dic</p>
|
|
|
|
|
<p>④ik.conf</p>
|
|
|
|
|
<p>⑤dynamicdic.txt</p>
|
|
|
|
|
</li>
|
|
|
|
|
<li>
|
|
|
|
|
<p>3. 配置solr的managed-schema,添加ik分词器,示例如下;</p>
|
|
|
|
|
<div class="content">
|
2018-05-10 02:39:24 -04:00
|
|
|
|
<!-- ik分词器 -->
|
|
|
|
|
<fieldType name="text_ik" class="solr.TextField">
|
|
|
|
|
<analyzer type="index">
|
|
|
|
|
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false"
|
|
|
|
|
conf="ik.conf"/>
|
|
|
|
|
<filter class="solr.LowerCaseFilterFactory"/>
|
|
|
|
|
</analyzer>
|
|
|
|
|
<analyzer type="query">
|
|
|
|
|
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="true" useSmart="true"
|
|
|
|
|
conf="ik.conf"/>
|
|
|
|
|
<filter class="solr.LowerCaseFilterFactory"/>
|
|
|
|
|
</analyzer>
|
|
|
|
|
</fieldType>
|
2018-05-10 02:37:57 -04:00
|
|
|
|
</div>
|
|
|
|
|
</li>
|
|
|
|
|
<li>
|
|
|
|
|
<p>4. 启动solr服务测试分词;</p>
|
|
|
|
|
</li>
|
|
|
|
|
<li>
|
|
|
|
|
<p>5. ik.conf文件说明:</p>
|
|
|
|
|
<p>files=dynamicdic.txt</p>
|
|
|
|
|
<p>files为动态字典列表,可以设置多个字典表,用逗号进行分隔,默认动态字典表为dynamicdic.txt;</p>
|
|
|
|
|
<br>
|
|
|
|
|
<p>lastupdate=0</p>
|
|
|
|
|
<p>lastupdate默认值为0,每次对动态字典表修改后请+1,不然不会将字典表中新的词语添加到内存中,lastupdate采用的是int类型,不支持时间戳,如果使用时间戳的朋友可以把源码中的int改成long即可;</p>
|
|
|
|
|
</li>
|
|
|
|
|
<li>
|
|
|
|
|
<p>5-dynamicdic.txt 为动态字典,在此文件配置的词语不需重启服务即可加载进内存中;</p>
|
|
|
|
|
</li>
|
|
|
|
|
</ul>
|
2018-05-10 02:24:19 -04:00
|
|
|
|
<hr>
|
2018-05-10 02:20:06 -04:00
|
|
|
|
|
2018-05-10 02:37:57 -04:00
|
|
|
|
<p>有问题可以联系作者邮箱magese@live.cn;</p>
|
|
|
|
|
<p>欢迎大家一起交流~</p>
|