【发布时间】:2017-12-14 21:00:36
【问题描述】:
我的客户希望我使用 Alteryx 实施 ETL 流程,因为他们拥有它的许可证。我很困惑 Alteryx 是否是 ETL 工具。我相信 Alteryx 是常用的 Tableau 数据可视化工具准备数据。
请告知它是否是 ETL 工具?它与 SSIS 有何不同?
谢谢,
【问题讨论】:
标签: ssis etl difference alteryx
我的客户希望我使用 Alteryx 实施 ETL 流程,因为他们拥有它的许可证。我很困惑 Alteryx 是否是 ETL 工具。我相信 Alteryx 是常用的 Tableau 数据可视化工具准备数据。
请告知它是否是 ETL 工具?它与 SSIS 有何不同?
谢谢,
【问题讨论】:
标签: ssis etl difference alteryx
Alteryx 是一个数据准备/高级分析应用程序。由于它允许数据准备、空间分析和预测,人们以多种不同的方式使用它。
我与许多选择使用 Alteryx 纯粹是因为其 ETL 功能将数据从一个数据库移动到另一个数据库的客户合作,例如我曾与一个使用 Alteryx 自动从 MySQL 加载到 Amazon Redshift 数据库的客户合作,另一个使用 SQL -> Tableau 数据引擎的客户,以及许多其他涉及一系列数据输入的示例(Alteryx 支持来自自定义 API 的所有内容-> Excel)。
如果您已经在使用 SSIS,那么老实说,您会发现 Alteryx 呼吸新鲜空气,我在过去的生活中使用过 SSIS,并且发现 Alteryx 的开发速度要快得多。它对数据的更改更加宽容,并允许更紧密地集成许多不同的数据源。新的数据库内工具提供了与 SQL 更紧密的集成,这使得工作可以在数据库内完成。
最后,与 SSIS 相比,我认为您会发现 Alteryx 非常易于学习。他们网站上的在线培训视频将为您提供尽可能多的介绍。
享受吧,我想你会喜欢这种体验的。
克里斯
【讨论】:
只要您有 Alteryx 服务器,Alteryx 就可以用于 ETL。我已经将它用于许多用例,尤其是在云和数据库之间。
我个人认为它明显优于 SSIS 的一些事情:
流可以从服务器上的命令行运行,我发现的最简单的方法(除了使用 Alteryx 自己的调度程序)是保存为“应用程序”,然后使用 Alteryx 引擎可执行文件从命令行运行,传递它通过xml文件参数。您可以通过点击魔术棒按钮(在将流程另存为 .yxwz(应用程序)之后)从流程中保存示例 xml 参数文件。这会打开一个面板,让您设置变量,并且该面板有一个方便的“保存" 生成正确格式的 xml 文件的按钮。
在流程本身中,通过操作工具或模块级参数 (User.*) 对环境设置等进行参数化 - 例如,您可以使用 %User.[Your variable name]% 在输入中设置数据库服务器场。
错误日志通常非常好(识别失败的工具、有用的错误消息),并且命令行会抛出有用的错误级别数字,因此使用某些第三方调度程序(或仅使用 Alteryx 服务器自己的调度程序)进行调度非常简单。
显然,如果您需要进行任何严肃的数据操作、数据透视等,那么它无疑是我用过的最简单的工具。
【讨论】:
是的,Alteryx 是一个 ETL 和数据整理工具,但它的功能远不止纯 ETL。 Alteryx 将预烘焙的连接(Experian / Tableau 等)选项与一系列嵌入式功能(如数据挖掘、地理空间、数据清理)结合起来,在一个产品中提供一套工具。
如果您所寻找的只是基本的 a->b ETL 映射,并且您不需要 Alteryx 具有的附加功能,那么像 SSIS 这样更便宜的产品往往绰绰有余。
【讨论】:
Alteryx 是一个数据挖掘工作台,ETL 通常是数据挖掘过程的重要组成部分。 Alteryx 有很多 ETL 工具/功能,还有更多。我已经很久没有使用过 SSIS 了,当然自从收购 Alteryx 之后就没有了。
凯特
【讨论】:
Alteryx 具有三个基本功能 ETL 、高级分析和报告。
我最喜欢的部分是高级分析,但 ETL 也在那里。所以,我认为它是一个完整的分析工具,从 ETL 到报告。我曾经将它与存储在磁带中的数据连接起来。
【讨论】: