【发布时间】:2021-12-06 20:20:43
【问题描述】:
我正在使用 .csv 文件将数据导入 Azure SQL 数据库。数据导入完成后,我现在将源文件从 Source 容器移动到 myArchive 容器。我现在尝试将文件名保存为 SaleData_yyyyMMdd_HHmm.csv,但是,我创建了具有此名称的文件夹,并且该文件被分解为多个部分文件(部分-00000-,部分-00001-,...)。请指导我如何使用当前数据和时间戳指定文件名。
文件系统:我的存档
文件夹路径:concat('SalesDepartment/Warehouse1/','SaleData_',toString(currentTimestamp(),'yyyyMMdd_HHmm'),'.csv')
【问题讨论】:
-
你用什么任务来移动它?听起来它正在保存为镶木地板。这仍然是一种有效的文件格式,但可能不是您想要的。确保您的数据集是 CSV 而不是镶木地板
-
所以你使用了两个复制活动?一个复制到 SQL 表,另一个移动到存档?
-
@Nick.McDermaid,我将文件保存为 .csv,但它没有使用我定义的命名约定。文件夹被创建为
SaleData_yyyyMMdd_HHmm.csv,文件被创建为part-0000。 -
@AllAboutBI,是的,我正在使用 2 个复制活动 1 复制到 SQL 表,另一个用于存档到 Data Lake Storage。
-
正如我所说,该文件夹/部分意味着它保存为镶木地板,而不是 csv。因此,请确保您的目标数据集是 CSV,而不是 parquet
标签: azure-data-factory azure-data-factory-2 azure-data-factory-pipeline azure-data-flow