【发布时间】:2013-07-10 19:18:08
【问题描述】:
我的数据库系统中有一些数据,由于几个原因,我无法使用 LOAD 语句提取这些数据。我需要 Pig 通过键(标识符)查找此数据,但如果我实现 Java UDF,我担心一对一键查找的性能。基本上,如果我的关系上有 10,000 个条目,我想以某种方式在 500 个键的集合中查找这些数据。 Pig 是否提供了一个接口,允许我调用一个 java 方法,该方法将接收一组键并返回一组答案(包或映射),这些答案可以连接或以某种方式分配给 Pig 关系中的元组?
提前感谢您的帮助!
【问题讨论】:
标签: hadoop mapreduce apache-pig