当前位置 : 主页 > 网络推广 > seo >

solr配置IK分词器

来源:互联网 收集:自由互联 发布时间:2021-06-16
配置中文分词器 在 /opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/lib 目录中加入IK分词器的jar包 在 /opt/solr-7.7.1/server/solr/article_core/conf 文件夹下的 managed-schema文件中配置IK中文分词器 在 /opt/so

配置中文分词器

  • /opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/lib目录中加入IK分词器的jar包
  • /opt/solr-7.7.1/server/solr/article_core/conf 文件夹下的 managed-schema文件中配置IK中文分词器
    • /opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/lib 中加入 ik分词器的jar包
    • 在managed-schema文件中配置ik分词器
    <fieldType name="text_ik" class="solr.TextField">  
               <analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer" useSmart="false"/>  
           <analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer" useSmart="false"/>  
          </fieldType>

    *测试分词效果

    • 配置停用词 扩展词 同义词
      停止词 的功能是过滤,把“啊”加入到停止词的字典里,比如搜索“你好啊”,solr会过滤掉“啊”,以“你好”去搜索。应该叫过滤词才好。
      扩展词 的功能是强制让扩展词字典里的词不被中文分词器分开,叫它自定义词也好理解。
      同义词:搜索结果里出现的同义词。如我们输入”还行”,得到的结果包括同义词”还可以”。

      /opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/文件夹下创建classes文件夹
      加入
      IKAnalyzer.cfg.xml
      ext.dic
      stopword.dic
      三个文件,在stopword.dic中配置你的停用词 ext.dic中配置自定义扩展词

    *在ext.dic中定义小米手机自定义扩展词后 对小米手机四个字分词的对比

网友评论