【问题标题】:What is the alternative for side inputs in apache beamapache Beam中侧面输入的替代方法是什么
【发布时间】:2019-08-01 12:07:02
【问题描述】:

我正在尝试使用 Apache Beam 加入多个 kafka 流和查找。我使用侧面输入来处理查找表,一切都在直接运行器中解决。但是,当我尝试在 spark 模式或 flink 模式下运行它时,我了解到不支持侧输入。这些是 Jira Bugs 的几个链接。

http://mail-archives.apache.org/mod_mbox/beam-user/201605.mbox/%3C573EFC2F.6000708@nanthrax.net%3E https://issues.apache.org/jira/browse/FLINK-6131

https://issues.apache.org/jira/browse/BEAM-2112

有没有办法使用侧面输入或解决这个问题?

我可以为此使用有状态处理吗?我知道每个键的每个窗口都可以使用该状态,但是仍然需要进行调整以以不同的方式使用它吗?

我可以使用像 memcached 这样的缓存数据库并在处理每条记录时获取数据吗?

非常感谢任何建议。

谢谢,

【问题讨论】:

    标签: apache-kafka streaming apache-beam lookup-tables beam-sql


    【解决方案1】:

    在 BeamSQL 中有另一种想法,称为可搜索连接。它类似于侧输入连接,但它只需要连接输入的一侧是可搜索的1

    所以这取决于你是否可以构造一个表来实现seek API(底层实现可能只是一个 API 调用)。

    【讨论】:

      猜你喜欢
      • 2018-05-11
      • 1970-01-01
      • 2017-07-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-10-06
      • 2016-05-17
      相关资源
      最近更新 更多