【发布时间】:2021-11-03 19:34:21
【问题描述】:
我正在使用 databricks 服务进行分析。我已经与 ADLS gen2 存储建立了连接并创建了一个挂载点,现在该容器包含多个文件夹多年和几个月,并且每个月在月份文件夹中都有镶木地板文件。我必须阅读所有这些文件并创建一个包含完整月份数据的目标文件。任何人都可以建议我如何实现它?
【问题讨论】:
-
数据是否已分区 - 您的目录的名称类似于
col=value,还是只是目录? -
只是目录
-
您能否分享文件类型、文件架构以及最终输出的架构是什么?
标签: python azure-databricks azure-data-lake