【发布时间】:2015-10-01 15:04:04
【问题描述】:
我正在编写一个 MR 代码来对 HBASE 和 HDFS 中可用的数据执行正则表达式模式匹配。 我的输入文件是一个大型 CSV 文件,其中包含从 HBASE 获取唯一数据的密钥。此输入文件可以有重复项。
我的问题 - 在我的 Main 类中 - 我想读取 Input 文件并执行一些处理并将数据保存到 hashmap 中,然后再将其提供给 mapper 类。 在我见过的所有示例中,我们只能输入文件路径作为映射器类的输入, 有没有办法将哈希图输入到映射器而不是文件?
谢谢你 普拉奈维亚斯
【问题讨论】:
标签: java regex hadoop mapreduce hashmap