【发布时间】:2019-09-03 10:57:28
【问题描述】:
我已在使用 Avro 序列化的记录中重命名了一个字段。我想支持读取旧版本的数据,而不需要模式注册表。因此,我将架构的所有版本都保留为从类路径加载的资源。
这很好用并且支持模式演变。当它们向后兼容时,我可以读取使用旧模式序列化的数据。作为确保这一点的一部分,我想在应用程序启动时验证模式。不幸的是,模式验证不支持字段别名,即使解码数据支持。
这里有一个简单的例子来证明我的观点:
import java.util.Collections;
import org.apache.avro.Schema;
import org.apache.avro.SchemaBuilder;
import org.apache.avro.SchemaValidationException;
import org.apache.avro.SchemaValidatorBuilder;
public class Bar {
public static void main(String[] args) throws SchemaValidationException {
Schema stringType = SchemaBuilder.builder().stringType();
Schema s1 = SchemaBuilder.builder().record("foo").fields()
.name("test1").type(stringType).noDefault()
.endRecord();
Schema s2 = SchemaBuilder.builder().record("foo").fields()
.name("test2").aliases("test1").type(stringType).noDefault()
.endRecord();
new SchemaValidatorBuilder().canReadStrategy().validateLatest().validate(s2, Collections.singleton(s1));
}
}
这会引发以下异常:
Exception in thread "main" org.apache.avro.SchemaValidationException: Unable to read schema:
{
"type" : "record",
"name" : "foo",
"fields" : [ {
"name" : "test1",
"type" : "string"
} ]
}
using schema:
{
"type" : "record",
"name" : "foo",
"fields" : [ {
"name" : "test2",
"type" : "string",
"aliases" : [ "test1" ]
} ]
}
at org.apache.avro.ValidateMutualRead.canRead(ValidateMutualRead.java:70)
at org.apache.avro.ValidateCanRead.validate(ValidateCanRead.java:40)
at org.apache.avro.ValidateLatest.validate(ValidateLatest.java:51)
at Bar.main(Bar.java:18)
【问题讨论】: