【发布时间】:2019-11-13 12:08:59
【问题描述】:
在计算百分位数时处理空值时遇到了一些麻烦。下面是样本数据。
现在使用的代码: percentile(column_1, array(0, 0.25, 0.50, 0.75, 1)) as column_1_p
这里它在计算百分位数时也考虑空值。但我需要消除它们,只使用其他有效值来计算百分位数。我找不到任何其他功能可以做到这一点。
数据:值范围从零到 1000。我不能用零替换空值,因为我的数据中已经有零了。
非常感谢这里的任何帮助。
提前致谢。
【问题讨论】:
-
一种选择是创建一个非空值的临时表,然后使用它来计算百分位数或创建 Hive UADF。