【问题标题】:Apache Beam initialize an PCollection to emptyApache Beam 将 PCollection 初始化为空
【发布时间】:2017-12-03 22:42:09
【问题描述】:

我试图将 Spark ETL 应用程序转换为 Beam 应用程序。

在 Spark 应用程序中,我有一个空 RDD。

sc.emptyRDD()

其中scSparkContext

如果我很好理解,PCollection 就像 Spark RDD。那么,有没有办法创建一个空的PCollection

【问题讨论】:

    标签: apache-spark apache-beam


    【解决方案1】:

    使用Create.empty()。由于PCollections 是类型化的并且需要编码器,因此您还需要指定编码器或类型描述符(即使集合为空),例如PCollection<String> emptyStrings = Create.of(StringUtf8Coder.of()).

    【讨论】:

      【解决方案2】:

      对我有用的是:

      PCollection<String> output = p.apply(Create.empty(StringUtf8Coder.of()));
      

      【讨论】:

        猜你喜欢
        • 2022-12-31
        • 1970-01-01
        • 2023-02-03
        • 2018-05-16
        • 1970-01-01
        • 1970-01-01
        • 2014-04-10
        • 1970-01-01
        • 2022-08-19
        相关资源
        最近更新 更多