【发布时间】:2017-05-05 08:57:21
【问题描述】:
我正在解析数据,以便通过 MapReduce 作业从中获得一些意义。解析后的数据以批次的形式出现。它通过火花流作业进一步加载到配置单元外部表。这是一个实时过程。现在我今天遇到了一个不寻常的事件,因为在输出位置创建了一个 _temporary 目录,由于无法将目录加载到 hive 表中,因此加载到 hive 表中失败。它只发生了一次,其余的工作都运行良好。请参考截图。
_temporary 目录还包含任务 ID 作为空的子目录。任何人都可以帮助解决这个问题,以便将来避免它。
【问题讨论】:
标签: hive mapreduce hadoop2 hadoop-partitioning bigdata