【发布时间】:2015-03-24 17:41:52
【问题描述】:
我有一个复杂的数据集,其中包含来自制药行业的超过 1600 万行。关于数据,保存在一个有400多个关系表的sql server中。
数据有多个层次,如省、市、邮政编码、人员和抗原测量等。
我想创建许多仪表板来观察正在发生的变化和趋势。为此,我可以使用 Pentaho、R(闪亮)或 Tableau。但问题是数据如此庞大,使用仪表板软件处理它需要很长时间。我可以选择制作立方体并将其连接到仪表板。
我的问题是我是否可以使用其他解决方案来代替制作立方体?我不想经历制作和维护立方体的麻烦。
我想使用一个软件来指定表之间的关系,以便聚合/合并顺利进行,并输出可以连接到仪表板的已处理表。我听说 Alteryx 是一款可以为您做到这一点的软件(我自己没试过,而且很贵!)。
我了解此任务需要两个或更多软件/工具。请分享您的意见和经验。请提及您使用哪些工具、数据大小、整个系统的速度/效率以及其他必要细节。
【问题讨论】:
标签: open-source bigdata