【问题标题】:Azure Import/Export tool dataset.csv and multiple session foldersAzure 导入/导出工具 dataset.csv 和多个会话文件夹
【发布时间】:2017-03-22 15:23:07
【问题描述】:

我正在将大量数据复制到 Azure Blob 存储区域。我的源数据集有大量我不想移动的文件,所以我的第一个想法是创建一个 DataSet.csv 文件,其中包含我确实想要复制的文件。作为测试,我创建了一个 csv 文件,其中每一行都是我想要包含的单个文件。

BasePath,DstBlobPathOrPrefix,BlobType,Disposition,MetadataFile,PropertiesFile
"\\SERVER\Share\Folder1\Item1\Page1\full.jpg","容器名/Src/Folder1/Item1/Page1/full.jpg",BlockBlob,overwrite,"无",无
"\\SERVER\Share\Folder1\Item1\Page1\thumb.jpg","containername/Src/Folder1/Item1/Page1/thumb.jpg",BlockBlob,overwrite,"无",无
等等


当我运行导入/导出工具 (WAImportExport.exe) 时,它似乎在目标上为每个文件创建了一个文件夹,因此它最终看起来像:
会话#1
-session#1-0
-会话#1-1
-会话#1-2
等等。

所有文件共享相同的库,但在 CSV 中输出它们的文件名。有什么办法可以避免这种情况,以便所有文件都进入一个“session#1”文件夹?如果可能,我想避免在目标驱动器上创建 N 千个文件夹。

【问题讨论】:

    标签: azure


    【解决方案1】:

    我认为您不必担心文件在磁盘上的存储方式,因为它们将被转换回您在 .csv 文件中指定的目录结构。

    documentation 是这样说的:

    WAImportExport 工具如何在多个源目录和磁盘上工作?

    如果数据大小大于磁盘大小,WAImportExport 工具将以优化的方式将数据分布在磁盘上。 数据复制到多个磁盘可以并行完成或 依次。数据可以存储的磁盘数量没有限制 同时写入。该工具将基于磁盘分发数据 大小和文件夹大小。它将选择最优化的磁盘 对于对象大小。 上传到存储帐户时的数据 会收敛回指定的目录结构。

    【讨论】:

      猜你喜欢
      • 2021-01-22
      • 2018-05-11
      • 2019-08-25
      • 2021-04-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-03-16
      • 2020-05-02
      相关资源
      最近更新 更多