【发布时间】:2013-01-07 13:52:08
【问题描述】:
是否可以在 Hadoop 中将图像转换为 Avro 格式?
【问题讨论】:
是否可以在 Hadoop 中将图像转换为 Avro 格式?
【问题讨论】:
Avro 用于描述独立于平台的数据模式(“数据序列化系统”)。
图像本身可以以多种格式(PNG、JPEG、BMP、GIF 等)编码,所有这些都可以表示为字节序列。您还可以定义一些关于图像的元数据(可能无论如何都以字节编码,但根据您的用例,提取它可能很有用。
原始模式可能如下(改编自docs):
{"namespace": "example.avro",
"type": "record",
"name": "Image",
"fields": [
{"name": "filename", "type": "string"},
{"name": "type", "type": "string"},
{"name": "data", "type": "bytes"},
{"name": "width", "type": "int"},
{"name": "height", "type": "int"}
]
}
【讨论】: