【发布时间】:2021-10-22 02:07:42
【问题描述】:
我一直在尝试在我的 GCP 帐户分配有“所有者”角色的项目中执行数据流管道 (Python)。
管道执行以下任务。
- 从 BigQuery(运行 Dataflow 流水线的同一项目)读取数据。
- 应用一些转换
- 最终将结果数据加载到 GCS
据我了解,Dataflow 工作人员使用默认计算引擎服务帐户 (-compute@developer.gserviceaccount.com) 访问 GCP 上的其他服务,包括 BigQuery 和 -compute@developer.gserviceaccount.com 具有“编辑”角色。
但是当我尝试使用 DataflowRunner 运行管道时出现以下错误。
错误:
BigQuery 执行失败。,错误:消息:访问被拒绝:项目:用户在项目中没有 bigquery.jobs.create 权限。 HTTP 代码:403
使用 DirectRunner 运行良好。
我还尝试通过将 DataFlow worker 和 Dataflow Admin 角色分配给
来运行此管道
-compute@developer.gserviceaccount.com 尽管这具有“编辑”角色。但是这个管道失败并出现同样的错误。
能否请您提供意见以解决此问题?
执行命令:
python -m bigquery_to_gcs --input gs://
【问题讨论】:
标签: google-cloud-platform google-cloud-dataflow