【发布时间】:2020-01-10 01:39:05
【问题描述】:
我正在使用 Spark 流处理来自 Kafka 队列的大量数据,我需要将结果写入两个已设置的 ES 集群。
我在我的项目中使用“org.elasticsearch.elasticsearch-spark-XX”,并且能够通过使用方法 EsSpark.saveJsonToEs() 写入一个 ES 集群,该方法在内部从不可变的 spark 上下文中获取 ES 特定属性。
所以,如果 spark 上下文是不可变的,我如何在运行时更改属性并将结果写入多个 ES 集群。
请提出建议。
参考 - https://www.elastic.co/guide/en/elasticsearch/hadoop/6.7/spark.html
【问题讨论】:
-
您可以尝试使用
spark.driver.allowMultipleContextstrue 并将每个 sparkcontext 与一个 es sink 一起使用吗? -
以下解决方案你试过了吗?
标签: apache-spark elasticsearch