【发布时间】:2017-06-06 04:40:55
【问题描述】:
我们已经有了Move-AzureRmDataLakeStoreItem,它将在 Azure datalake 内的文件夹之间移动文件。我正在寻找的是在数据湖中复制文件而不影响原始文件。
我知道的可能性是——
- 使用
USQL到EXTRACT数据从源文件然后OUTPUT到目标文件 - 但我试图复制所有类型的文件(.gz、.txt、.info、.exe、.msi)和我不确定USQL是否可以帮助我处理 .gz 或 .exe 或 .msi 文件 - 使用
Data Factory从Data Lake store复制数据/向Data Lake store复制数据
那么,我的问题是,我们是否还有其他东西可供我们在 Azure Data Lake Store 中执行文件副本?
【问题讨论】:
-
要考虑的另一种方法是,也许不要复制太多文件?您可以将数据放在“原始”湖或暂存区域,然后该文件的任何其他版本都应该以某种方式进行细化、聚合、清理、扩充或处理,而不是直接复制。
标签: powershell azure azure-data-lake u-sql