【发布时间】:2014-04-01 08:57:14
【问题描述】:
我正在使用 Pentaho Data Integration (Kettle) 进行 ETL 过程,从 MongoDB 源中提取。
我的源有一个 ISODateField,所以从提取返回的 JSON 是这样的:
{ "_id" : { "$oid" : "533a0180e4b026f66594a13b"} , "fac_fecha" : { "$date" : "2014-04-01T00:00:00.760Z"} , "fac_fedlogin" : "KAYAK"}
所以现在,我必须使用 AVRO 输入来反序列化这个 JSON。所以我定义了 AVRO 模式 喜欢
{
"type": "record",
"name": "xml_feeds",
"fields": [
{"name": "fac_fedlogin", "type": "string"},
{"name": "fac_empcod", "type": "string"},
{"name": "fac_fecha", "type": "string"}
]
}
fac_fecha 可以是日期类型,但 AVRO 不支持。
在执行时,AVRO Input 拒绝所有行,因为它们有错误。这仅在我使用日期字段时发生。
关于我该如何做的任何建议?
水壶版本:4.4.0 Pentaho 大数据插件:1.3.0
【问题讨论】:
标签: json mongodb etl kettle avro