【发布时间】:2020-10-06 07:49:40
【问题描述】:
我在 Apache BEAM 中阅读有关 SCHEMAS 的文档,但我不明白它的目的是什么,我应该如何以及为什么或在什么情况下需要使用它们。使用模式和使用扩展 Serializable 接口的类有什么区别?
文档有一个例子:
@DefaultSchema(JavaFieldSchema.class)
public class TransactionPojo {
public String bank;
public double purchaseAmount;
}
PCollection<TransactionPojos> transactionPojos = readTransactionsAsPojo();
但它没有解释readTransactionsAsPojo 函数是如何构建的。我认为对此有很多缺失的解释。
【问题讨论】:
-
是的。在实现 Doc 中提到的架构后,我试图使用 JdbcIO 进行读取,但显然我们必须通过 RowMapper 才能通过 Jdbc 读取。我不明白我们如何在这里使用已经定义的 POJO Schema。
标签: apache-beam dataflow