【发布时间】:2019-09-01 20:57:31
【问题描述】:
我正在使用 Python 应用程序处理 Google BigQuery。
我有一个包含列表的字段的数据框,我们称之为“关键字”。我还有一个 BigQuery 表,其关键字字段为 STRING 且 mode=REPEATED。
这是我的 BigQuery 表的架构:
SCHEMA = [
bq.SchemaField("id", "STRING", mode="NULLABLE"),
bq.SchemaField("fecha", "DATE", mode="NULLABLE"),
bq.SchemaField("keywords", "STRING", mode="REPEATED")
]
这是我的代码:
import pandas as pd
from datetime import date
from google.cloud import bigquery as bq
df_dict = {
"id": ["asdf173","qwer783","vcda619"],
"fecha": [date(2019,1,15), date(2019,1,28), date(2019,2,12)],
"keywords": [['a','b'], ['c','d','e'],['f']]
}
df = pd.DataFrame(df_dict)
client = bq.Client()
dataset = client.dataset(dataset_name)
table_ref = dataset.table(table_name)
client.load_table_from_dataframe(df, table_ref).result()
当我尝试将数据框上传到 BigQuery 表时出现以下错误:
400 提供的架构与表项目 ID:数据集名称.表名称不匹配。字段关键字的类型已从 STRING 更改为 RECORD。
我该如何解决?
【问题讨论】:
-
您好 Felipe,欢迎您,您能否提供 WebUI 中表格结构的屏幕截图以进行高级故障排除
-
谢谢 Tamir,您是指架构吗?我的桌子还是空的。
-
是的架构,所以我们将能够在您的代码和表结构之间进行比较,给出您遇到的错误