【问题标题】:Kafka stream load to data frame display data azure data bricksKafka 流加载到数据框显示数据 azure databricks
【发布时间】:2020-10-27 21:52:04
【问题描述】:

我们有本地 kafka 流数据到 Azure 数据块设置;我们使用以下查询连接到本地主机

df = spark \
  .readStream \
  .format("kafka") \
  .option("kafka.bootstrap.servers", "host1:10.10.10.120:9092") \
  .option("subscribe", "SIP.SIP.MENT") \
  .option("minPartitions", "10")  \
  .option("startingOffsets", "earliest") \
  .load()

接下来我们使用 显示(df)

我们永远不会显示任何结果,消费者在服务器上工作正常。

完全错误

    [Consumer clientId=consumer-spark-kafka-source-6c634c0d-01de-4840-a7b9-414326972173-2063739220-driver-0-1, groupId=spark-kafka-source-6c634c0d-01de-4840-a7b9-414326972173-2063739220-driver-0] Discovered group coordinator xyz.xyz.com:9092 (id: 2147483647 rack: null)
20/10/28 01:26:20 WARN NetworkClient: [Consumer clientId=consumer-spark-kafka-source-6c634c0d-01de-4840-a7b9-414326972173-2063739220-driver-0-1, groupId=spark-kafka-source-6c634c0d-01de-4840-a7b9-414326972173-2063739220-driver-0] Error connecting to node xyz.xyz.com:9092 (id: 2147483647 rack: null)
java.net.UnknownHostException: xyz.xyz.com: Name or service not known
    at java.net.Inet6AddressImpl.lookupAllHostAddr(Native Method)
    at java.net.InetAddress$2.lookupAllHostAddr(InetAddress.java:929)

【问题讨论】:

    标签: azure apache-kafka-streams databricks azure-databricks pyspark-dataframes


    【解决方案1】:

    去掉host1部分:

    .option("kafka.bootstrap.servers", "10.10.10.120:9092")
    

    【讨论】:

      【解决方案2】:

      确保您使用正确的 kafka.bootstrap.servers 语法。

      语法: ("kafka.bootstrap.servers", "Host_IP_address:Port") .

      相应地修改您的代码。

      df = spark \
        .readStream \
        .format("kafka") \
        .option("kafka.bootstrap.servers", "10.10.10.120:9092") \
        .option("subscribe", "SIP.SIP.MENT") \
        .option("minPartitions", "10")  \
        .option("startingOffsets", "earliest") \
        .load()
      

      【讨论】:

      • 得到错误连接到节点 xyz.xyz.com:9092 (id: 0 rack: null) java.net.UnknownHostException: xyz.xyz.com at java.net.InetAddress.getAllByName0(InetAddress. java:1281) 在 java.net.InetAddress.getAllByName(InetAddress.java:1193) 在 java.net.InetAddress.getAllByName(InetAddress.java:1127) 在 kafkashaded.org.apache.kafka.clients.ClientUtils.resolve(ClientUtils .java:104)
      猜你喜欢
      • 2020-08-29
      • 1970-01-01
      • 2021-05-29
      • 1970-01-01
      • 2021-06-26
      • 2021-09-26
      • 2020-03-15
      • 2019-09-28
      • 1970-01-01
      相关资源
      最近更新 更多