【发布时间】:2021-10-17 18:50:36
【问题描述】:
我正在尝试将多个 csv 文件加载到 BigQuery 表中。对于某些 csv 文件,分隔符是逗号,对于某些是分号。有什么方法可以在 Job config 中传递多个分隔符。
job_config = bigquery.LoadJobConfig(
autodetect=True,
source_format=bigquery.SourceFormat.CSV,
field_delimiter=",",
write_disposition="WRITE_APPEND",
skip_leading_rows=1,
)
谢谢 丽兹
【问题讨论】:
-
否,创建 2 个作业或预处理您的文件以使用通用分隔符
-
这是否意味着我们不能像在熊猫中那样在这里传递多个分隔符。
-
每个作业一个分隔符,每个作业没有多个。
-
是否将 csv 文件中的
;替换为,是一个选项?那么没有文本字段应该包含;,使用像sed这样的shell命令非常快。 -
是的,我替换了它。但是现在我可以在 csv 文件中看到像 ABC 这样的带有额外分隔符的行;; ..如何照顾它
标签: python-3.x google-bigquery google-cloud-functions etl