【发布时间】:2021-07-02 09:37:42
【问题描述】:
我正在尝试使用 Presto 作为可选组件创建一个 dataproc 集群,并且我想向其中添加一个 kafka 目录。在https://cloud.google.com/dataproc/docs/concepts/components/presto 和https://prestodb.io/docs/current/connector/kafka.html#configuration-properties 之后,我正在使用以下命令:
gcloud beta dataproc clusters create mycluster \
--region us-central1 \
--no-address \
--zone us-central1-a \
--single-node \
--master-machine-type n1-standard-4 \
--master-boot-disk-size 500 \
--project myproject \
--optional-components=PRESTO \
--enable-component-gateway \
--properties="presto-catalog:kafkastream.connector.name=kafka,presto-catalog:kafkastream.kafka.tables-names=topicname,presto-catalog:kafkastream.kafka.nodes=kafkavm:9092,presto-catalog:kafkastream.kafka.default-schema=default,presto-catalog:kafkastream.kafka.hide-internal-columns=false"
所以,基本上我想设置properties 来安装名为kafkastream 的目录,该目录连接到端口9092 上的kafka 虚拟机并创建一个表default.topicname。
但是,当我尝试创建集群时,状态变为错误。在日志中我发现了与StructuredError{presto, Component presto failed to activate 相关的内容。
日志中的其他错误是
google-dataproc-startup[1129]: activate-component-presto[2447]: Query 12345 failed: Presto server is still initializing
google-dataproc-startup[1129]: activate-component-presto[2447]: 'get_node_information' attempt 6 failed! Sleeping 10s.
google-dataproc-startup[1129]: activate-component-presto[2447]: Error running command: java.net.ConnectException: Failed to connect to localhost/0:0:0:0:0:0:0:1:8060
如果我删除 properties 部分 Presto 可以完美运行。
设置kafka目录的正确方法是什么?有人可以帮助我吗?我在其他 stackoverflow 主题和在线都找不到与此问题相关的信息。
【问题讨论】:
标签: apache-kafka presto google-cloud-dataproc