【问题标题】:How we can copy any file within Azure Data Lake Store folders我们如何复制 Azure Data Lake Store 文件夹中的任何文件
【发布时间】:2017-06-06 04:40:55
【问题描述】:

我们已经有了Move-AzureRmDataLakeStoreItem,它将在 Azure datalake 内的文件夹之间移动文件。我正在寻找的是在数据湖中复制文件而不影响原始文件。

我知道的可能性是——

  1. 使用USQLEXTRACT 数据从源文件然后OUTPUT 到目标文件 - 但我试图复制所有类型的文件(.gz、.txt、.info、.exe、.msi)和我不确定USQL 是否可以帮助我处理 .gz 或 .exe 或 .msi 文件
  2. 使用Data FactoryData Lake store复制数据/向Data Lake store复制数据

那么,我的问题是,我们是否还有其他东西可供我们在 Azure Data Lake Store 中执行文件副本?

【问题讨论】:

  • 要考虑的另一种方法是,也许不要复制太多文件?您可以将数据放在“原始”湖或暂存区域,然后该文件的任何其他版本都应该以某种方式进行细化、聚合、清理、扩充或处理,而不是直接复制。

标签: powershell azure azure-data-lake u-sql


【解决方案1】:

您还有其他几个选择,

  1. 在 HDI 集群上运行 distcp - 类似于此处提供的说明。 https://docs.microsoft.com/en-us/azure/data-lake-store/data-lake-store-copy-data-wasb-distcp
  2. 如果您要复制有限数量的数据(例如 10-100 的 GB),请使用 adlcopy - https://docs.microsoft.com/en-us/azure/data-lake-store/data-lake-store-copy-data-azure-storage-blob

请问这样就够了吗?还是您想要 Azure Data Lake Store 通过其 REST API 原生支持的东西?

谢谢, 萨钦谢斯 Azure 数据湖项目经理。

【讨论】:

  • 谢谢@Sachin - 让我浏览文章并探索可能性。如果我需要更多关于这方面的信息,我可能会回你,如果你同意的话:)
猜你喜欢
  • 2017-08-15
  • 1970-01-01
  • 1970-01-01
  • 2019-04-22
  • 2019-04-01
  • 2020-02-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多