【发布时间】:2020-06-20 11:35:11
【问题描述】:
在后台,我收集应用程序的 API 使用日志(请求、响应、延迟、用户 ID 等)。典型的一天将积累 200-3 亿条记录。这些数据目前以 parquet 格式存储在 s3 上,我使用 AWS Athena 进行临时查询。我想构建一个基于 Web 的仪表板,显示每个客户的指标;一个示例查询是过去 6 小时内按小时按客户的请求量。我只需要过去 30 天的那种详细使用数据。
理想情况下,我会继续将 AWS 生态系统用于此解决方案。我试图确定的是一个大方向。 Redshift 能否在 1 秒左右的时间内针对原始日志数据有效地计算这些类型的查询,以使其在 Web 上可用?有没有更好的工具?或者我应该查看运行 ETL 和汇总类型操作以生成这些指标,填充不同的表(可能在 redshift 中),然后使用它来为仪表板提供服务?
欢迎提出任何想法,甚至建议阅读 - 谢谢。
【问题讨论】:
标签: database amazon-web-services amazon-redshift etl data-warehouse