【发布时间】:2018-09-14 19:43:09
【问题描述】:
目前,我的所有数据文件都在 Azure Data Lake Store 中。我需要处理这些主要是 csv 格式的文件。该处理将在这些文件上运行作业以提取各种信息,例如某些日期期间的数据或与场景相关的某些事件或从多个表/文件中添加数据。这些作业每天通过数据工厂(v1 或 v2)中的 u-sql 作业运行,然后发送到 powerBI 进行可视化。
使用 ADLA 进行所有这些处理,我觉得需要花费大量时间来处理并且看起来非常昂贵。我收到了一个建议,我应该将 Azure Databricks 用于上述过程。有人可以帮助我解决两者之间的差异以及转变是否有帮助吗?我可以将我所有的 U-sql 作业修改为 Databricks 笔记本格式吗?
【问题讨论】:
标签: azure azure-data-lake u-sql databricks