【发布时间】:2021-06-10 11:57:49
【问题描述】:
我在设置 GCP AI Platform Pipelines - Kubeflow Pipelines v1.4.1 和“使用托管存储”时遇到问题 没有任何配置不允许我(KFP 服务上的错误)使用“使用托管存储”,但让我们关注下面描述的特定配置。
我的设置是:
- 在自定义网络/子网中使用版本“1.17.15-gke.800”并启用工作负载身份的私有集群
- 与 GKE 在同一自定义网络/子网中的私有 mysql 8.0
- GCS
- “使用托管存储”,其中指定了所有必需信息:GCS 名称、数据库的连接名称、用户、密码和数据库前缀
- 使用的工作负载身份(为了简化所有 KSA(K8s 服务帐户)都映射到具有所有者角色的单个 Google 服务帐户)
请注意,如果没有“使用托管存储”选项,使用 GKE 和 KFP 设置可以正常工作,但如果使用“使用托管存储”,则会失败:
- ml-管道:
- 状态:
- Pod 错误:CrashLoopBackOff
- 没有最低可用性
- 日志:
packets.go:36: unexpected EOF
CETdriver: bad connection
- 元数据-grpc-部署:
- 状态:
- Pod 错误:CrashLoopBackOff
- 没有最低可用性
- 日志:
Non-OK-status: status status: Internal: mysql_real_connect failed: errno: 2013, error: Lost connection to MySQL server at 'handshake: reading inital communication packet', system error: 11MetadataStore cannot be created with the given connection config.
- cloudsqlproxy & mysql(相同的日志):
- 状态:好的
- 日志:
couldn't connect to "<db_connection_string>": googleapi: Error 401: Request had invalid authentication credentials. Expected OAuth 2 access token, login cookie or other valid authentication credential. See https://developers.google.com/identity/sign-in/web/devconsole-project.
More details:
Reason: authError, Message: Invalid Credentials
cloudsqlproxy 服务/pod 中似乎存在问题,无法建立与 DB 的连接。是此功能的错误还是配置错误?
【问题讨论】:
标签: google-ai-platform google-cloud-ai-platform-pipelines