【发布时间】:2019-06-21 15:29:06
【问题描述】:
我在 BigQuery 的 southamerica-east1 位置,当我尝试运行气流功能 GoogleCloudStorageToBigQueryOperator 时收到错误消息:BigQuery 作业状态检查失败。最终错误是:%s'
搜索我需要“强制”转移到 BigQuery 的 BigQueryCursor 操作表的位置。
即使创建一个具有相同位置的空表,我也无法导入 Cloud Storage 中的数据。
我想更详细地了解我需要在我的代码中做什么(如果可能,通过示例)以成功完成我的流程。
我强调我的数据集和空表配置为相同的位置
json_gcs_to_bq = GoogleCloudStorageToBigQueryOperator(
task_id='gcs_to_bq',
bucket='big-data',
source_objects=[nm_arquivo],
destination_project_dataset_table='teste.tab1',
schema_object='sc_tab1.json',
source_format='NEWLINE_DELIMITED_JSON',
create_disposition='CREATE_IF_NEEDED',
write_disposition='WRITE_TRUNCATE',
bigquery_conn_id='gcp_conn',
google_cloud_storage_conn_id='gcp_conn',
dag=dag
)
错误信息:
[2019-06-21 14:39:38,639] {{logging_mixin.py:95}} INFO - [2019-06-21
14:39:38,630] {{discovery.py:873}} INFO - URL being requested: POST
https://www.googleapis.com/bigquery/v2/projects/big-data/jobs?alt=json
[2019-06-21 14:39:39,525] {{logging_mixin.py:95}} INFO - [2019-06-21
14:39:39,525] {{discovery.py:873}} INFO - URL being requested: GET
https://www.googleapis.com/bigquery/v2/projects/big-data/jobs/job_zyDDpy94ReP_X6qqR6DrbqGnb-Ar?alt=json
[2019-06-21 14:39:39,881] {{models.py:1760}} ERROR - ('BigQuery job
status check failed. Final error was: %s', 404) Traceback (most recent
call last): File
"/usr/local/lib/python3.6/site-ackages/airflow/contrib/hooks/bigquery_hook.py",
line 1014, in run_with_configuration
【问题讨论】:
-
@RyanTheCoder,我不明白答案:请给我看一个例子,我如何将 BigQueryCursor 运算符放在我的脚本中来解决这个问题......
标签: python google-api google-bigquery airflow