ik-analyzer-solr/README.md

59 lines
2.4 KiB
Markdown
Raw Normal View History

2018-05-10 01:56:19 -04:00
# ik-analyzer-solr7
ik-analyzer for solr7.x
适配最新版solr7并添加动态加载字典表功能
在不需要重启solr服务的情况下加载新增的字典。
2018-05-10 02:20:06 -04:00
2018-05-10 02:20:53 -04:00
<hr>
2018-05-10 02:24:19 -04:00
<h2>使用说明:</h2><br>
2018-05-10 02:37:57 -04:00
<ul>
<li>
<p>1. 将jar包放入solr服务的jetty或tomcat的webapp/WEB-INF/lib/目录下;</p>
</li>
<li>
<p>2. 将resources目录下的5个配置文件放入solr服务的jetty或tomcat的webapp/WEB-INF/classes/目录下;</p>
<p>①IKAnalyzer.cfg.xml</p>
<p>②ext.dic</p>
<p>③stopword.dic</p>
<p>④ik.conf</p>
<p>⑤dynamicdic.txt</p>
</li>
<li>
<p>3. 配置solr的managed-schema添加ik分词器示例如下</p>
<div class="content">
2018-05-10 02:39:24 -04:00
&lt;!-- ik分词器 --&gt;
&lt;fieldType name="text_ik" class="solr.TextField"&gt;
&lt;analyzer type="index"&gt;
&lt;tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false"
conf="ik.conf"/&gt;
&lt;filter class="solr.LowerCaseFilterFactory"/&gt;
&lt;/analyzer&gt;
&lt;analyzer type="query"&gt;
&lt;tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="true" useSmart="true"
conf="ik.conf"/&gt;
&lt;filter class="solr.LowerCaseFilterFactory"/&gt;
&lt;/analyzer&gt;
&lt;/fieldType&gt;
2018-05-10 02:37:57 -04:00
</div>
</li>
<li>
<p>4. 启动solr服务测试分词</p>
</li>
<li>
<p>5. ik.conf文件说明</p>
<p>files=dynamicdic.txt</p>
<p>files为动态字典列表可以设置多个字典表用逗号进行分隔默认动态字典表为dynamicdic.txt</p>
<br>
<p>lastupdate=0</p>
<p>lastupdate默认值为0每次对动态字典表修改后请+1不然不会将字典表中新的词语添加到内存中lastupdate采用的是int类型不支持时间戳如果使用时间戳的朋友可以把源码中的int改成long即可</p>
</li>
<li>
<p>5-dynamicdic.txt 为动态字典,在此文件配置的词语不需重启服务即可加载进内存中;</p>
</li>
</ul>
2018-05-10 02:24:19 -04:00
<hr>
2018-05-10 02:20:06 -04:00
2018-05-10 02:37:57 -04:00
<p>有问题可以联系作者邮箱magese@live.cn</p>
<p>欢迎大家一起交流~</p>