【问题标题】:Zipped File in Azure Data factory Pipeline adds extra filesAzure 数据工厂管道中的压缩文件添加了额外的文件
【发布时间】:2021-07-20 07:14:21
【问题描述】:

我有一个数据工厂管道(复制活动),它压缩整个文件夹并将其添加到存档文件夹。 Blob 存储中的文件夹结构 主/网络/data.csv。

  • 源和汇使用二进制数据集
  • 源位置:通配符路径 ->container/Main*
  • 接收器位置:容器/存档/
  • 压缩类型->.zipdeflate

我压缩整个主文件夹并将其复制到另一个存档文件夹

  • 存档文件夹:Main.zip

当我下载这个文件并解压缩它时,它包含的主文件夹

有没有办法在管道中避免网络文件? 因为当我解压缩文件时,网络文件夹被删除,因为它具有相同的文件和文件夹名称

谢谢

谢谢

【问题讨论】:

  • 据我了解,Source是Main/Network/data.csv,sink是container/Archive/main.zip,解压main.zip时,有一个额外的文件'network',对吗?跨度>
  • @LeonYue 是对的!
  • 文件夹 Archive 是已经存在还是在 sink 中手动创建?
  • @LeonYue 它已经可用。我也尝试过手动创建它。问题还是一样
  • 你好@Rachael DSouza,我测试过,一切正常,没有额外的文件“网络”。我还检查了文件视图中的隐藏项目。请检查我们之间是否有任何差异。

标签: azure azure-data-factory


【解决方案1】:

我尝试了相同的选项,但没有额外的相同文件。请参考我的步骤:

源数据集:

来源设置:

接收器数据集:

接收器设置:

输出:

我下载了它,一切正常:

【讨论】:

  • 成功了!!非常感谢.. 我从使用通配符切换到数据集中的文件路径。这对我来说有点诀窍。
猜你喜欢
  • 2020-01-17
  • 1970-01-01
  • 2020-06-27
  • 2022-11-11
  • 1970-01-01
  • 2018-02-20
  • 2023-01-19
  • 2019-12-07
  • 1970-01-01
相关资源
最近更新 更多