【发布时间】:2016-12-09 12:42:19
【问题描述】:
自从昨晚深夜以来,我一直在阅读bigquery documentation,但对它知之甚少。它讨论了通过不同的方法加载数据,但没有说明如何创建我将要加载数据的表。当我使用 Web UI 时,它希望我输入架构。我的表有 400 多列。我不会输入数百个列名、类型和长度。
我一直在将数百 GB 的 csv 格式数据上传到 Google 存储桶。 csv 文件没有列名。我有我喜欢使用的 sql 格式的架构。
如果我尝试通过查询创建表,我在第 2 行已经收到错误消息,
"Error: Encountered "" at line 2, column 1."
CREATE TABLE [example-mdi:myData_1.ST] (
`ADDRESS_ID` varchar(9),
`INDIVIDUAL_ID` varchar(2),
`FIRST_NAME` varchar(25),
`LAST_NAME` varchar(2),...
我该怎么做或正确的方法是什么?
【问题讨论】:
-
如果有人发现这个,我个人非常喜欢的一个替代方案是 MapD,它被重新命名为 OmniSci。它在github.com/omnisci/omniscidb 是开源的。它确实需要一些不错的硬件规格,但对于我的特定应用程序,这就是我所采用的,而且它们只会变得更好。我只使用 cpu(没有 GPU,我在服务器上有超过 500 GB 的内存和 40 个物理内核)在不到一秒的时间内搜索了超过 400 GB 的非常广泛的数据。
标签: google-bigquery