【发布时间】:2021-10-23 22:34:50
【问题描述】:
我的 blob 中有一个 parquet 文件层次结构,存储为
yyyy/MM/dd/yyyy_MM_dd_hh_mm_ss_[来源].parquet
dd 文件夹在 24 小时内包含多个文件,至少每小时一个。
跨文件夹示例:
2018/04/01/2018_04_01_06_37_14_ABCXYZ01.Parquet
2019/10/03/2019_10_03_21_52_34_ABCXYZ01.parquet
2020/08/23/2020_08_23_03_00_13_ABCXYZ01.parquet
我希望文件夹结构在复制后看起来像这样。
年=2019/月=04/日=01/2019_04_01_00_00_00_ABCXYZ01.Parquet
我可能需要复制所有 8GB 的这些文件并进行迭代,但动态内容代码让我感到厌烦。
任何有关方法的帮助都会很棒。如果我不需要迭代,我可以使用复制活动和复制行为吗?
谢谢
【问题讨论】:
标签: regex azure-data-factory azure-data-factory-2 azure-data-flow