【问题标题】:Is there a Elasticsearch plugin similar to the Solr analysis tool?有没有类似 Solr 分析工具的 Elasticsearch 插件?
【发布时间】:2015-01-31 17:57:31
【问题描述】:

Solr 具有内置的"Analysis Screen",它有助于调试特定字段类型的标记器和过滤器之间的相互作用:

是否有 ElasticSearch 插件可以做类似的事情?具体来说,我想查看每个过滤器的输入/输出,而不仅仅是分析链的最终结果。我在这方面使用谷歌非常密集,但没有找到任何东西。

https://www.found.no/play/#analysis 包含我想要的功能(向下滚动到“myAnalyzer”),但不幸的是,我无法在我的索引上运行它。但它表明这样的功能是可能的。

编辑:我知道有很多插件可以显示完整的过滤器链的输出,例如用户@Bass 建议的 kopf:

这不是我想要的!我想看到每个过滤器的输出,而不仅仅是最终结果。

【问题讨论】:

标签: solr elasticsearch analysis


【解决方案1】:

有一个名为elyzer 的独立工具由 OpenSource Connections 的好心人制作。该工具将在分析过程的任何步骤(字符过滤器、标记器、标记过滤器)向您显示标记的状态,并且使用起来非常简单。

通过pip install elyzer 安装它非常简单,然后您可以将其用作命令行工具,例如

$ elyzer --es "http://localhost:9200" --index tmdb --analyzer english_bigrams --text "Mary had a little lamb"
TOKENIZER: standard
{1:Mary}    {2:had} {3:a}   {4:little}  {5:lamb}    
TOKEN_FILTER: standard
{1:Mary}    {2:had} {3:a}   {4:little}  {5:lamb}    
TOKEN_FILTER: lowercase
{1:mary}    {2:had} {3:a}   {4:little}  {5:lamb}    
TOKEN_FILTER: porter_stem
{1:mari}    {2:had} {3:a}   {4:littl}   {5:lamb}    
TOKEN_FILTER: bigram_filter
{1:mari had}    {2:had a}   {3:a littl} {4:littl lamb}  

【讨论】:

    【解决方案2】:

    我过去曾使用Inquisitor 来测试标记器和过滤器。它位于 Elasticsearch 分析 API 之上,可从 Web 前端使用。

    您还应该尝试另一个名为 elasticsearch-extended-analyze 的插件,它返回与 Solr 分析页面相同的令牌级信息(尽管没有 Web 前端)。

    【讨论】:

      【解决方案3】:

      是的,我们可以通过 Elasticsearch - kopf 来完成。Elastic Search-KOPF 是管理员工具。你会在你的命令提示符下输入这个命令

      bin/plugin --install lmenezes/elasticsearch-kopf/1.1

      如果您有任何疑问,请告诉我?

      【讨论】:

      • 也许我的问题表述不够清楚,但这绝对不是我问题的答案。我知道 kopf 插件,它只显示完整分析器的输出(请参阅上面的编辑)。
      • 等待我会检查并告诉你@Martin
      【解决方案4】:

      Analyze API 可用于测试分析仪。它不是那么漂亮,但可以完成工作。

      例子

      GET localhost:9200/_analyze
      {
        "tokenizer" : "keyword",
        "token_filters" : ["lowercase"],
        "char_filters" : ["html_strip"],
        "text" : "this is a <b>test</b>"
      }
      

      【讨论】:

        猜你喜欢
        • 2011-04-02
        • 2014-01-30
        • 2020-11-23
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多