【发布时间】:2016-11-30 02:27:01
【问题描述】:
我们正在从netezza 到hadoop 非分区表中挖掘数据,然后使用插入覆盖方法从非分区到分区。在此之后,我们在分区表上运行 databasename.tablename 的计算增量统计信息,但是对于某些分区,此查询失败并出现错误
无法执行命令:计算增量统计信息并且分区目录中的某些文件没有此类文件或目录。
【问题讨论】:
标签: impala
我们正在从netezza 到hadoop 非分区表中挖掘数据,然后使用插入覆盖方法从非分区到分区。在此之后,我们在分区表上运行 databasename.tablename 的计算增量统计信息,但是对于某些分区,此查询失败并出现错误
无法执行命令:计算增量统计信息并且分区目录中的某些文件没有此类文件或目录。
【问题讨论】:
标签: impala
您可以在计算统计数据之前运行刷新语句以立即刷新元数据。即使刷新语句返回代码为 0,在计算统计信息之前可能需要等待几秒钟,因为过去的经验表明,即使在给出返回代码后元数据仍在刷新。除非脚本按顺序执行这些命令,否则您通常不会看到此问题。
refresh yourTableName
compute stats yourTableName
从 Impala 2.3 开始,您还可以使用 alter table recover partitions 而不是刷新元数据或修复表。
alter yourTableName recover partitions
compute stats yourTableName
【讨论】: