【发布时间】:2018-09-06 15:45:31
【问题描述】:
我有两个 parquet 文件,Parquet A 有 137 列,Parquet B 有 110 列。 Parquet 一个文件具有该表的全部历史记录。因此 Parquet A 具有表的整个历史记录的所有字段。 Parquet B 是我今天提取的所有值,删除了 17 列。我想将镶木地板 A 与镶木地板 B 结合,但它们的列数不同。所以每次都会失败。
我尝试过 mergeSchema,但失败了。是否可以将缺少的列添加到镶木地板 B 并添加空值。那就结盟吧?
【问题讨论】:
标签: python dataframe parquet databricks