【发布时间】:2019-06-22 03:29:41
【问题描述】:
在 Dataflow/Apache Beam 程序中说,我正在尝试读取数据呈指数增长的表。我想提高读取的性能。
BigQueryIO.Read.from("projectid:dataset.tablename")
或
BigQueryIO.Read.fromQuery("SELECT A, B FROM [projectid:dataset.tablename]")
如果我只选择表中所需的列,而不是上面的整个表,我的读取性能会提高吗?
我知道选择少数列会降低成本。但是想知道上面的读取性能。
【问题讨论】:
标签: google-bigquery google-cloud-dataflow dataflow