【发布时间】:2016-01-21 05:22:35
【问题描述】:
我们运行 BigQuery 大约 4 个月了,我们对定价有一些有趣的观察和问题:
- 定价模型无法解释,需要对联接、联合等进行解释
- 如果我在小表上运行连接,我处理的数据将随着在 bigquery 引擎中相乘的小表的每个副本而增加?
- 如果我在一个查询中重复使用相同的子查询,这是新的数据处理,不管它是相同的子查询吗?这可以以任何方式优化吗? bigquery 不会缓存它的数据吗?
- 是否存在四舍五入用于数据处理的最小大小?我们的观察认为它是 4MB,这是正确的吗?
- 在 Google 控制台中,地理位置存在问题,它说大多数查询都是从 CA 完成的,这是不正确的,因为我的公司在欧洲,所有的开发都是在那里完成的。我检查了所有IP地址,没有CA ip。是否可以获得更详细的报告?
- 关于 5,我们想获取每个查询的历史和价格。我们应该怎么做?我们的软件必须这样做吗?
- 关于 3) 我在数据处理方面遇到了这个大问题(这就是我问所有问题的原因)。我的整个数据集大约有 150mb 大,但每个查询的 DP 大小是 3 倍?如果 bigquery 读取我的全部数据,它不会达到它在处理的数据上显示的大小。什么时候会重新读取数据并因此发生新的 DP?这个怎么算?
谢谢。
问候, 托米斯拉夫
【问题讨论】:
-
有什么特别的原因被否决了吗?
-
我投了赞成票,所以它是 0
标签: google-bigquery