【发布时间】:2016-03-09 20:36:34
【问题描述】:
我有一个具有多个索引的 ES 集群,它们都以随机时间间隔接收更新。我有一个从 ES 中提取数据并将其传递给 Kafka 的 logstash 实例。
每分钟运行一次并在 ES 中获取任何更新的好方法是什么?
会议:
input {
elasticsearch {
hosts => [ "hostname1.com:5432", "hostname2.com" ]
index => "myindex-*"
query => "*"
size => 10000
scroll => "5m"
}
}
output {
kafka {
bootstrap-servers => "abc-kafka.com:1234"
topic_id => "my.topic.test"
}
}
我想在查询中使用文档@timestamp 并将其保存在临时文件中,然后重新运行查询(带有计划)并获取最新的更新/插入(类似于logstash 的jdbc-input plugin 支持的内容)
有什么想法吗?
提前谢谢你
【问题讨论】:
标签: elasticsearch logstash logstash-configuration