【发布时间】:2014-01-06 21:06:49
【问题描述】:
在执行 INSERT OVERWRITE TABLE 查询时,如何阻止 Hive 将临时文件写入 s3。
我在 hive-default.xml 中找到了一个属性
<property>
<name>hive.exec.skips3scratch</name>
<value>true</value>
<description>Do not write temp files to S3 scratch space. This will
increase the performance by avoiding multiple writes in S3, but can
corrupt the table or partition being written to, esp. if the job
fails.
</description>
</property>
我在 hive-site.xml 中设置了这个,但它似乎仍然将临时文件写入 s3。
我有什么遗漏的吗?
【问题讨论】:
-
我发现了这个 community.cloudera.com/t5/Batch-SQL-Apache-Hive/… 那个蜂巢属性似乎是 Hive 的亚马逊风味独有的。
标签: hadoop amazon-s3 hive cloudera