【发布时间】:2021-10-04 16:42:29
【问题描述】:
我想获取 parquet 文件的列名。我的管道中有一个 Get Metadata 模块,它使用的是仅提供根文件夹的镶木地板数据集。因为只提供文件夹 ADF 不允许我获取包含列名的文件结构。未提供文件名,因为它可能会更改。任何人都可以就如何解决这个问题提供一些建议吗?
【问题讨论】:
-
我也有同样的挑战。 GetMetadata 需要重大更新。除了这个问题之外,没有递归能力是一个主要障碍,它会导致人们为它已经做过的事情(只是不递归地做)创建函数应用程序。我所说的大多数利用 PARQUET 的人都指向一个目录,因为正如您所指出的,您通常不控制文件名,而只是指向目录的根目录。