【发布时间】:2015-06-19 21:27:54
【问题描述】:
我是 Avro 格式的新手。我正在尝试使用 Storm-Jms spout 从 JMS 队列中收集 Avro 消息,并使用 hdfs bolt 将它们发送到 hdfs。
队列正在发送 avro,但我无法使用 HDFS BOLT 以 avro 格式获取它们。
如何正确收集 avro 消息并将其发送到下游,而不会在 hdfs 中出现编码错误。
【问题讨论】:
-
您应该将收到的异常消息添加到您的问题中。
-
嗨 Joshua 我在风暴中没有遇到任何异常我能够从 JMS 读取数据并将其放置在 hdfs 但是在使用 HDFS-bolt 读取放置在 hdfs 中的 .avro 文件时,我收到了错误当我尝试使用 HIVE 读取文件时。这是错误:java.io.IOException: java.io.IOException: Not a data file。
-
我认为 Storm 需要一些类似于 HDFS BOLT 中 Flume Avroevent 序列化程序的东西。
-
看起来 Storm 需要机制来将元组序列化为 HDFS 螺栓中的 avro 元组。
标签: hadoop jms message-queue apache-storm avro