【问题标题】:Visualising data in Tableau when connected to BigQuery taking an eternity连接到 BigQuery 时在 Tableau 中可视化数据需要很长时间
【发布时间】:2016-04-23 06:00:45
【问题描述】:

我有一个已加载到 BigQuery 的数据集,它由 3 个单独的表组成,每个文件都有一个共同的标识符。

当我在 Tableau 中设置我的项目时,我对其中两个表执行了内部联接。我将连接设置为提取而不是实时的。

我的文件中有一些地理信息,经纬度。当我将 lat 拖到工作表上的行部分时,它需要很长时间才能执行该任务,目前它需要 18 分钟,并且当我将 lat 拖到行部分时,它只需要处理它正在做的任何事情。

是否有其他方法可以让我随机抽取数据进行处理,而不必等待每个查询处理完毕?我的数据甚至没有那么大,大约有 100 万行。

【问题讨论】:

    标签: google-bigquery tableau-api


    【解决方案1】:

    我发现 Tableau 在 100 万行之前陷入了相当长的一段时间,我猜想连接会让你的问题更加复杂。

    在提取之前尽可能多地在 BigQuery 本身中进行聚合是您的朋友。随机摘录也是一个好主意。你可以试试:

        SELECT
          *
        FROM
          ([subquery joining your tables])
        WHERE RAND() < 0.05 # or whatever gives an acceptable sample size
    

    【讨论】:

      猜你喜欢
      • 2016-04-08
      • 2018-06-13
      • 2020-05-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多