【发布时间】:2019-03-13 03:11:24
【问题描述】:
我对流式编程相当陌生。我们有使用 Avro 的 Kafka 流。
我想将 Kafka Stream 连接到 Spark Stream。我使用了下面的代码。
kvs = KafkaUtils.createDirectStream(ssc, [topic], {"metadata.broker.list": brokers})
lines = kvs.map(lambda x: x[1])
我收到以下错误。
return s.decode('utf-8') 解码中的文件“/usr/lib64/python2.7/encodings/utf_8.py”,第 16 行 返回 codecs.utf_8_decode(输入,错误,真) UnicodeDecodeError:“utf8”编解码器无法解码位置 57-58 中的字节:无效的继续字节
我是否需要指定 Kafka 使用 Avro,是否存在上述错误?如果是我如何指定它?
【问题讨论】:
标签: python apache-spark pyspark spark-streaming