【问题标题】:External hive table as parquet file returns NULL when queried查询时作为镶木地板文件的外部配置单元表返回 NULL
【发布时间】:2016-02-27 03:29:43
【问题描述】:

我使用 map reduce 作业创建了一个 .parquet 文件。现在我想在这个文件之上创建一个外部表。这是命令:

CREATE EXTERNAL TABLE testparquet (
  NAME STRING, 
  AGE INT
)
STORED AS PARQUET 
LOCATION 'file location'

表已成功创建,但是当我使用简单的 SELECT * 查询表时,我将所有字段的数据都设为 NULL。 hive的版本是0.13。

我有什么遗漏的吗?

【问题讨论】:

    标签: hadoop hive hdfs parquet


    【解决方案1】:

    使用external 文件时,您需要将了解数据架构的元数据存储与实际数据本身显式同步。

    通常,您将使用INVALIDATE METADATA 命令强制以下查询重新读取数据。如果您只有一个已更新的表,您也可以使用REFRESH <table-name>

    【讨论】:

      猜你喜欢
      • 2020-12-20
      • 2019-05-15
      • 2021-12-02
      • 1970-01-01
      • 1970-01-01
      • 2015-05-18
      • 1970-01-01
      • 2021-01-22
      • 1970-01-01
      相关资源
      最近更新 更多