【发布时间】:2017-12-18 14:26:29
【问题描述】:
有没有办法获取编写弹性搜索文档的日期和时间?
我正在通过 spark 运行 es 查询,并且希望 NOT 查看我已经处理过的所有文档。相反,我想阅读在程序上次运行和现在之间摄取的唯一文档。
最有效的方法是什么?
我看过;
- 更新 以添加一个带有布尔数组的字段,以判断它是否被哪个分析器查看。否定是等待更新发生。
- index per time frame 方法,即按小时将当前索引分解为较小的索引。我看到的负数是打开文件描述符的数量。
- ??
Elasticsearch 5.6 版
【问题讨论】:
-
为您的文档添加一个计数器,并在您每次“处理”该文档时增加该计数器。曾经有一个
_timestamp,但在 5.x 中被删除。但是那个时间戳仍然不是文档被索引到 ES 中的确切时间;-)。
标签: elasticsearch