【问题标题】:Amazon S3 to Amazon Athena to Tableau从 Amazon S3 到 Amazon Athena 到 Tableau
【发布时间】:2019-12-02 02:34:32
【问题描述】:

我正在开展一个项目,将 Amazon S3 存储桶中的数据导入 Tableau。

数据需要从多个 .CSV 文件重新组织和组合。 Amazon Athena 是否能够直接从 S3 连接到 Tableau,是否相对容易/便宜?还是应该改用其他软件包来实现这一点?

我希望可视化数据并根据观察到的趋势提供预测(可能需要合并函数来生成数据以拟合线性回归)。

【问题讨论】:

    标签: amazon-web-services amazon-s3 tableau-api amazon-athena


    【解决方案1】:

    Tableau 似乎可以从 Amazon Athena 查询数据。

    见:Connect to your S3 data with the Amazon Athena connector in Tableau 10.3 | Tableau Software

    Amazon Athena 可以查询给定路径(目录)中的多个 CSV 文件并针对数据运行 SQL。所以,听起来这对你来说是一个可行的解决方案。

    【讨论】:

      【解决方案2】:

      是的,您可以将 Athena 与 Tableau 集成以在 S3 中查询您的数据。网上有很多资源描述了如何做到这一点,例如link 1link 2link 3。但显然,定义数据元信息的表必须事先定义。

      Amazon Athena pricing 基于每次查询扫描的数据量,即每扫描 1TB 数据 5$。因此,一切都取决于您拥有多少数据以及数据的结构,即分区、分桶文件格式等。这是一个很好的blog post,涵盖了这些方面。

      在您对仪表板进行原型设计时,需要牢记一件事。默认情况下,每次您更改参数列表、过滤器等时,Tableau 都会自动向 AWS Athena 发送请求以执行您的查询。幸运的是,您可以禁用数据源的自动查询并手动执行。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-05-04
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多