【发布时间】:2019-05-28 15:18:54
【问题描述】:
我正在尝试使用 Kafka 消息(作为 StreamSource)更新 Elasticsearch 中的文档。使用 windows 和 Elasticsearch 连接器作为接收器批量写入 Elasticsearch 很好,但是,我们需要更新文档中的现有数据并以批量执行的方式读取它(不是针对每个元组,而是针对例如在byKey() 我们要聚合的拆分)
我们现在正在使用 Storm Trident,它在 persistentAggregate 之前执行批量读取,并在之后将更新的聚合写回,从而最大限度地减少与后端的交互。我只是在 Flink 中找不到类似的东西——有什么提示吗?
【问题讨论】:
标签: apache-flink apache-storm flink-streaming trident