【发布时间】:2019-11-25 12:30:18
【问题描述】:
我需要创建一个大文件,通过合并分散在 Azure Blob Storage 中的几个子文件夹中的多个文件,还需要进行转换,每个文件都包含单个元素的 JSON 数组,所以最终文件,将包含一个 JSON 元素数组。
最终目的是在 Hadoop 和 MapReduce 作业中处理该大文件。
原始文件的布局是这样的:
folder
- month-01
- day-01
- files...
- month-02
- day-02
- files...
【问题讨论】:
标签: json azure azure-data-factory