【发布时间】:2021-07-06 12:08:19
【问题描述】:
我正在构建数据管道,通过在 AWS Glue 中创建自定义连接器,通过 AWS Glue 将数据从 S3 存储桶迁移到 Snowflake。
运行胶水作业时出现以下错误:
**An error occurred while calling o100.pyWriteDynamicFrame. Glue ETL Marketplace: JDBC Data Sink: Column "serial_number" not found in schema Some(StructType(StructField(SERIAL_NUMBER,DoubleType,true), StructField(COMPANY_NAME,StringType,true), StructField(EMPLOYEE_MARKME,StringType,true), StructField(DESCRIPTION,StringType,true), StructField(LEAVE,LongType,true)))**
注意:连接器和驱动程序分别使用以下版本-
- Snowflake Spark 连接器 - spark-snowflake_2.11-2.4.14-spark_2.3.jar
- Snowflake JDBC 驱动程序 - snowflake-jdbc-3.8.3.jar
- 与 Glue 位于同一区域的 S3 存储桶。
如果我遗漏了什么或者我使用了不正确的版本/不支持的连接器和驱动程序版本,请告诉我......
【问题讨论】:
-
检查序列号列
标签: pyspark snowflake-cloud-data-platform aws-glue snowflake-schema aws-glue-spark