【发布时间】:2018-02-11 02:00:19
【问题描述】:
我正在做一个测试,从 Twitter API 收集推文,并索引 Elasticsearch 中的一些信息。
众所周知,Elasticsearch 不能很好地处理对象数组。我需要这些来做一些分析。推文中的对象数组示例可能是:
- 文本中包含的 url 列表,包含有关域或其他内容的信息
- 文本中包含的提及列表,以及有关用户的信息(如加入日期、用户 ID)
- 来自文本的标记和语义分析。
Kibana 也不能很好地处理对象数组,将这些对象可视化简直就是一场噩梦。所以我想flat将这些对象放在一个新索引或相同索引的新类型中,放入一些关于来源tweet的信息。
什么更好?一个新的索引?新类型?为什么? 我如何在 Kibana 上进行可视化,考虑其他类型/索引的 id?哪个更好?
【问题讨论】:
-
检查嵌套类型 (elastic.co/guide/en/elasticsearch/reference/current/nested.html) 是否有帮助。
-
Kibana 不支持嵌套类型。这是一篇关于在 Elasticsearch 中删除类型和其他选项的好文章:elastic.co/guide/en/elasticsearch/reference/master/…。您还可以将属性名称嵌套在单一类型下,就像我们在 Kibana 中所做的那样:elastic.co/blog/kibana-6-removal-of-mapping-types
标签: elasticsearch kibana