【发布时间】:2022-11-01 21:02:48
【问题描述】:
我有一个数据集,即 IQVIA 我需要从 Zip 中提取数据,在 Zip 中我有许多 txt 文件和一个包含列的 XML 我需要用 txt 文件映射这些列
我尝试在 Synapse NTBK 中准备 XML 脚本,但没有任何效果
【问题讨论】:
标签: apache-spark pyspark azure-data-factory azure-databricks
我有一个数据集,即 IQVIA 我需要从 Zip 中提取数据,在 Zip 中我有许多 txt 文件和一个包含列的 XML 我需要用 txt 文件映射这些列
我尝试在 Synapse NTBK 中准备 XML 脚本,但没有任何效果
【问题讨论】:
标签: apache-spark pyspark azure-data-factory azure-databricks
首先使用一个复制活动将上述 zip 文件解压缩到一个文件夹,然后将该 xml 文件转换为包含所需列的 txt 文件。
为此,请使用另一个复制活动。
这是我的示例源 xml:
在复制活动的来源中给出这个。 在接收器中给出一个文本文件。
您可以在映射中使用高级编辑器。如果需要,您还可以在此处指定动态内容。
生成带有列的文本文件。
【讨论】: