【发布时间】:2020-07-27 16:13:10
【问题描述】:
我需要从另一个 GCP 项目的 PubSub 主题中读取 AVRO 消息。我之前实现了 Python 数据流管道,它从 PubSub 读取 JSON 消息并写入 BigQuery。但我是处理 AVRO 消息的新手。我试图查找 AVRO 的 Python 文档,它指向此链接 https://avro.apache.org/docs/current/gettingstartedpython.html
在这个链接中有一些从文件读取和写入文件的例子,但我认为这些函数对于从 PubSub 读取没有用。我正在使用以下转换从输出为字节串的 PubSub 中读取。
"Read from PubSub" >> beam.io.ReadFromPubSub(topic=TOPIC).with_output_types(bytes)
我需要一种读取这些字节的方法(AVRO 格式)
【问题讨论】:
标签: python-3.x google-cloud-dataflow avro google-cloud-pubsub