【发布时间】:2020-10-04 18:47:41
【问题描述】:
我有一个需要写入 Kafka 的数据框。
我定义了 avro 架构,类似于:
{
"namespace": "my.name.space",
"type": "record",
"name": "MyClass",
"fields": [
{"name": "id", "type": "string"},
{"name": "parameter1", "type": "string"},
{"name": "parameter2", "type": "string"},
...
]
}
它会自动生成到 java bean。是这样的:
public class MyClass extends org.apache.avro.specific.SpecificRecordBase implements org.apache.avro.specific.SpecificRecord {
String id;
String parameter1;
String parameter2;
...
}
我发现要以 avro 格式编写,只有 to_avro 方法需要一列。
所以我的问题是,有没有办法在这个定义的架构中强制以 Avro 格式写入 Kafka?
【问题讨论】:
-
我的理解是,只有使用 Confluent Schema Registry 才能做到这一点。
-
你解决了吗?
标签: apache-spark apache-kafka avro spark-avro