1. 什么是Solr ?

      大多数搜索引擎应用都必须具有某种搜索功能,问题是搜索功能往往是巨大的资源消耗并且它们由于沉重的数据库加载而拖垮你的应用的性能。

      这就是为什么转移负载到一个外部的搜索服务器是一个不错的主意,Apache Solr是一个流行的开源搜索服务器,它通过使用类似REST的HTTP API,这就确保你能从几乎任何编程语言来使用solr。

      Solr是一个开源搜索平台,用于构建搜索应用程序。它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。使用Solr构建的应用程序非常复杂,可提供高性能。

      为了在CNET网络的公司网站上添加搜索功能,YonikSeely于2004年创建了Solr。并在2006年1月,它成为Apache软件基金会下的一个开源项目。并于2016年发布最新版本Solr 6.0,支持并行SQL查询的执行。

       Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。

总之,Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。

2. Solr安装

   

解压

什么是Solr?Solr安装与配置

什么是Solr?Solr安装与配置

IK解压

什么是Solr?Solr安装与配置

查看目录(三个文件夹)记得

什么是Solr?Solr安装与配置

复制lib /ext下所有jar包到Tomcat的/lib下

什么是Solr?Solr安装与配置

复制solr.war到tomcat/webapp下

什么是Solr?Solr安装与配置

给solr.war里面配置solr的家的位置

什么是Solr?Solr安装与配置

删除solr.war

什么是Solr?Solr安装与配置

配置tomcat/webapps/solr/WEB-INF/web.xml家的位置

什么是Solr?Solr安装与配置

启动Tomcat

什么是Solr?Solr安装与配置

查看日志

什么是Solr?Solr安装与配置

访问http://IP:8080/solr/

什么是Solr?Solr安装与配置

3.中文分析器IK Analyzer

3.1 IK Analyzer简介

IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。

3.2 IK Analyzer(配置)

步骤:

1、把IKAnalyzer2012FF_u1.jar添加到 solr 工程的 lib 目录下

2、创建WEB-INF/classes文件夹  把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。

3、修改 Solrhome 的 schema.xml 文件,配置一个FieldType,使用 IKAnalyzer

<fieldType name="text_ik" class="solr.TextField">

     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>



相关文章: