【发布时间】:2016-02-18 07:51:41
【问题描述】:
我在 spark 流应用中做类似模式匹配的事情。我想要的是更新像 broadcast variable 这样的变量,但是它是可变的。有没有办法做到这一点?有什么建议吗?
编辑
抱歉没有说清楚。我在日志上做一些 CEP 的东西。我需要在 spark 应用程序运行时从 elasticsearch 加载规则。我想将这些规则应用到工作人员方面(在每个 RDD 上)。
【问题讨论】:
-
你是指驱动级别的全局状态还是工作级别的局部变量?
-
您能否添加一些示例代码来帮助澄清您的问题?
-
@axlpado 感谢您的回复。我的意思是工人级别的变量。
-
@maasg 抱歉不清楚。我已经更新了我的问题。谢谢。
-
从驱动程序发送给工作人员(包括广播)的所有内容都在那里序列化一次并且是只读的,没有交叉执行程序更新。 worker 请求动态状态的方式是 Spark 管理系统外部的一种方式 - JDBC,或 Tachyon 等共享文件系统。
标签: apache-spark spark-streaming