【发布时间】:2016-09-28 16:55:54
【问题描述】:
我有一个 Apache Spark 集群和一个 RabbitMQ 代理,我想使用 pyspark.streaming 模块来使用消息并计算一些指标。
问题是我只找到this package,但是用Java和Scala实现的。除此之外,我没有在 Python 中找到任何示例或桥接实现。
我有一个使用 Pika 实现的消费者,但我不知道如何将有效负载传递给我的 StreamingContext。
【问题讨论】:
-
在 RabbitMQ 集群上使用 MQTT 协议意味着更改队列配置。对我来说,这不是一个解决方案。我找到了解决它的方法。完成测试后,我将发布解决方案
-
嘿,有进展吗?我现在面临同样的问题。就我而言,我什至无法设置 MQTT 概念验证。
-
是的,这比我想象的要容易。我使用 TCP 连接 从我的 pika 消费者发送我的消息以触发。我将在几个小时内发布正式答案
-
谢谢!我被困在这里:stackoverflow.com/questions/39331781/…
标签: python rabbitmq pyspark spark-streaming pika