【发布时间】:2017-04-22 21:15:48
【问题描述】:
BigQuery 处理大型数据集的速度很快,但从 BigQuery 检索大型结果却一点也不快。
例如,我运行了一个查询,该查询通过三个 HTTP 请求返回 211,136 行,总共只用了 12 多秒。
查询本身是从缓存中返回的,因此没有时间花在执行查询上。主机服务器是在美国东部(弗吉尼亚)运行的 Amazon m4.xlarge。
在生产中,我发现这个过程在返回约 100 万行时需要约 90 秒。显然,其中一些可能是由于网络流量造成的……但它似乎太慢了,不能成为唯一的原因(那 211,136 行只有 ~1.7MB)。
有没有其他人在返回结果的时候遇到速度这么慢,并找到了解决办法?
更新:在 Google Cloud 内的 VM 上重新进行测试,结果非常相似。排除 Google 和 AWS 之间的网络问题。
【问题讨论】:
-
您能提供工作ID吗?
-
@xuejian job_BAp8OdilQEzUV7x6HNeEzVh2lo8
-
对不起,忘了说:还需要项目ID。
-
没关系,我想通了。届时将进行一些调查。
-
@xuejian 根据更新我已经排除了谷歌通过在谷歌云中运行测试并获得类似结果的亚马逊网络问题。