【发布时间】:2015-01-03 16:36:14
【问题描述】:
我正在尝试使用 bq 工具将在 mysql(使用 outfile)中生成的 CSV 文件(实际上是 TSV)上传到 Bigquery。该表具有以下架构:
这里是示例数据文件:
"6.02" "0000" "101" \N "Md Fiesta Chicken|1|6.69|M|300212|100|100^M Sourdough|1|0|M|51301|112|112" "6.5" \N "V03" "24270310376" "10/17/2014 3:34 PM" "6.02" "30103" "452" "302998" "2014-12-08 10:57:15" \N
这就是我尝试使用 bq CLI 工具上传它的方式:
$ bq load -F '\t' --quote '"' --allow_jagged_rows receipt_archive.receipts /tmp/rec.csv
BigQuery error in load operation: Error processing job
'circular-gist-812:bqjob_r8d0bbc3192b065_0000014ab097c63c_1': Too many errors encountered. Limit is: 0.
Failure details:
- File: 0 / Line:1 / Field:16: Could not parse '\N' as a timestamp.
Required format is YYYY-MM-DD HH:MM[:SS[.SSSSSS]]
我认为问题在于 updated_at 列是 NULL 并因此被跳过。那么知道如何告诉它考虑空/空列吗?
【问题讨论】:
-
不是“跳过”;它被拒绝了。
-
@Strawberry:代表不代表编程专业!
-
与stackoverflow.com/q/13050296/560648 非常相似(可能足以称其为骗子);这看起来像是导出和输入工具之间的格式差异(
\N不是“标准”CSV) -
@Strawberry 你是什么意思? “应付账款不太可能是浮动的”为什么不能浮动?它的应付金额。如果不是浮点数,它会是什么数据类型?
-
十进制。人们可能会对那些微不足道的小部分非常感兴趣!
标签: mysql csv google-bigquery