虚拟列

Hive 0.8.0支持两个虚拟列:

 INPUT__FILE__NAME, mapper任务的输出文件名。

 BLOCK__OFFSET__INSIDE__FILE, 当前全局文件的偏移量。对于块压缩文件,就是当前块的文件偏移量,即当前块的第一个字节在文件中的偏移量。

 

简单例子

select INPUT__FILE__NAME, key, BLOCK__OFFSET__INSIDE__FILE from src;

select key, count(INPUT__FILE__NAME) from src group by key order by key;

select * from src where BLOCK__OFFSET__INSIDE__FILE > 12000 order by key;

翻译自 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VirtualColumns

相关文章:

  • 2021-10-20
  • 2021-06-27
  • 2021-10-24
  • 2022-12-23
  • 2022-02-06
  • 2021-11-15
  • 2022-12-23
  • 2021-12-20
猜你喜欢
  • 2021-08-23
  • 2021-07-06
  • 2021-12-17
  • 2022-02-09
  • 2021-09-21
  • 2021-07-03
  • 2021-12-17
相关资源
相似解决方案