【发布时间】:2013-12-02 15:27:55
【问题描述】:
我有一个关于 Solr 的问题。它被描述为一个企业搜索平台。是否有面向企业的搜索平台和通用搜索平台?例如,您不能仅使用 Solr 来构建通用搜索引擎吗?如果有这样的区别,它们之间的主要区别是什么?
【问题讨论】:
标签: apache search solr lucene full-text-search
我有一个关于 Solr 的问题。它被描述为一个企业搜索平台。是否有面向企业的搜索平台和通用搜索平台?例如,您不能仅使用 Solr 来构建通用搜索引擎吗?如果有这样的区别,它们之间的主要区别是什么?
【问题讨论】:
标签: apache search solr lucene full-text-search
Enterprise 是一个模糊的术语,用于表示“是的,您完全可以在专业项目中使用它,它非常棒”。简而言之,这是胡扯。在阅读软件产品(或任何产品)的首页时,我发现忽略所有形容词和副词很有用,这使得Solr page 上的第一句话读为:“Solr 是 Apache Lucene 项目的搜索平台。”
不知道为什么我没有被雇用来写广告文案。
我认为说 Solr 是一个通用搜索服务器是公平的,当然(当然,这取决于你对通用目的的要求)。它索引数据,允许您搜索它,并提供许多工具以最适合您的数据和用户的方式执行此操作。
【讨论】:
搜索这个词有很多语义。它通常用于表示/描述动作、功能或技术。但更重要的是这个问题有两种常见的“搜索项目”,即Web Search 和Enterprise Search 项目。
Web 搜索 通常是关于从一种以 html 格式提供内容的内容源(Web 服务器)中的内容编制索引。大多数情况下,它仅与公共内容有关,文档级别的安全性不是问题。这种解决方案的一个典型例子是谷歌的网页搜索,但大多数全文Site Search 解决方案也可以看作是这类解决方案的好例子。对于一个基本的解决方案,一个爬虫、一个 html 标记删除工具和一个索引库以及一些“胶水”就足够了。 Apache Nutch 或 Apache Solr 和 ElasticSearch 与网络爬虫相结合是用于实施此类解决方案的良好候选者。
企业搜索通常是关于整合来自多个内容源的各种格式的内容。此类解决方案的典型示例是企业内部网,但Search Based Applications 通常也属于此类。这些解决方案通常带有额外的要求,例如支持文档级安全性、高级语言学、元数据提取、数据映射和丰富、同义词等。项目更复杂,需要更复杂的技术堆栈。虽然 Apache Solr 或 ElasticSearch 都可以使用,但许多必需的功能不是标准下载的一部分,需要作为项目的一部分进行开发或集成。但是对于 Apache Solr 和 ElasticSearch 两者来说,也有商业发行版已经将标准下载的功能扩展到Enterprise Search 的方向。其他不错的选择是商业搜索引擎。
我同意 @femtoRgon 的 Solr:
【讨论】:
Solr 是一个搜索平台,可以针对通用搜索或企业搜索解决方案进行定制。正如 Daniel 在之前的 cmets 中所建议的,ESearch 应用程序专门用于企业/组织来搜索组织内部数据,并且在某些情况下也可以搜索外部内容,但仅与组织相关。企业通常使用内部开发或由供应商开发的各种系统,并且 ESearch 应用程序应该能够连接到内部系统并索引内容,包括不同的文件类型、元数据和重要的与来自每个文档相关联的安全性那些系统。
总之,Solr 是一个搜索系统,可用于索引和搜索内容作为一般或作为组织的 ESearch 应用程序。
【讨论】: