【发布时间】:2019-08-11 05:43:45
【问题描述】:
我正在尝试了解外连接在 tableau 中的用途和限制(在本例中为 tableau online)。我发现画面的行为不是我所期望的。 我在下面提供了对我的问题的详细描述,以避免任何歧义,因为我不知道从哪里开始了。我希望我没有过火(欢迎编辑)。
我的用例的细节
我正在两个以特定时间间隔记录自然数据的 .csv 文件之间创建连接。一组以小时为间隔,另一组以分钟为间隔(因各种因素而异)。
“雨”数据集(1):
日期和时间 |雨
01/01/2018 00:00 | 0
01/01/2018 01:00 | 0.4
01/01/2018 02:00 | 1.4
01/01/2018 03:00 | 0.4
“填充”数据集 (2):
日期和时间|填充
24/04/2018 06:04 | 78
24/04/2018 12:44 | 104
24/04/2018 18:51 | 96
25/04/2018 00:20 | 84
不出所料,我的数据中有很多空值(这对我来说不是问题):
- “雨”的时间序列较长
- 在任何一个数据集中,大多数日期时间在另一个数据集中没有精确的等价物
我想要达到的目标
我正在尝试绘制两个数据集的图表,以便我可以通过以下所有方式将完整的数据集相互比较:
- 每月或每年汇总(平均)
- 每小时汇总(平均)
- 准确时间
问题(以及我的有限假设)
- 在画面中绘制后,某些值具有
'null'DateTime 值*。 - 一旦在画面中绘制出来,就好像很多点都丢失了
**Graphing using 'Fill' time series
Graphing using 'Rain' time series - 我曾假设(给出
'Date and Time(s)'的完整外连接)tableau 将按时间顺序使用公共日期时间序列连接数据集
* 我曾假设连接条件不可能有'null' 值而不引发错误。此外,数据干净且统一** 这是每月汇总时,我认为不会受到任何(如果有)每小时/分钟不匹配的影响
所以,最后是问题#
在阅读在线帮助文档时,我一直在努力寻找一种原生于 tableau 的功能来帮助我实现这些特定目标。我得出了一个令人担忧的结论,即画面不是为这种类型的“可视化分析”而构建的。
是否有一种原生于 tableau 的功能,可以让我按照我上面描述的方式组合数据?
我考虑过的方法
由于我有两个 .csv 文件,我可以将这两个文件组合起来,以便在一个高列表中拥有完整、细化的 'Date and Time' 字段。
但是,我想找到一种对 tableau (online) 很自然的方法,因为在未来,至少有一些数据将来自数据库 (postgres) 连接但其他可能必须保留作为.csv 或excel 文件上传。
我再问一次
关于如何(以及为什么)使用 tableau,我忽略了什么? 我不是在寻找一个完整的解决方案,但我可以使用哪些工具来实现这一目标?
非常感谢您的帮助
【问题讨论】:
-
Join 是一个数据库概念,用于使用其中具有共同值的某些字段“合并”两个数据集。如果您想知道 2018 年 3 月 1 日下午 3 点 30 分的雨量和填充值,并且两个表当时都有值,那么 join 就可以了。您所拥有的是不具有共同值的日期时间字段。你应该怎么做才能“联合”表格(生成一个包含一个日期时间字段和两个值字段的表格,其中包含所有值(但有很多空白)。然后表格将处理聚合并正确给出聚合值。跨度>
-
@matt_black 我理解联合是两个或多个文件的串联。它会将数据“编织”在一起吗?或者在将数据放入可视化项时是否已处理此步骤?
-
将数据放入可视化项时可以完成“编织”。 Tableau 将聚合时间字段(例如以天为单位),并将聚合当天的两个数据字段(即使没有一个特定时间字段匹配)。
标签: csv tableau-api