【发布时间】:2012-03-12 12:56:08
【问题描述】:
我在 hive 中有下表
用户 ID、用户名、用户地址、点击次数、展示次数、页面 ID、页面名称
我需要通过点击每个页面 [page-id,page-name] 找出前 5 个用户 [user-id,user-name,user-address]
我知道我们需要首先按 [page-id,page-name] 分组,在每个组中我想按 [clicks,impressions] desc 排序,然后只发出前 5 个用户 [user-id, user-name , user-address],但我发现很难构造查询。
我们如何使用 HIve UDF 做到这一点?
【问题讨论】:
标签: user-defined-functions hive rank