【问题标题】:COPY INTO snowflake table not loading data - No errorsCOPY INTO 雪花表未加载数据 - 无错误
【发布时间】:2020-04-10 12:41:47
【问题描述】:

作为 Snowflake WebUI Essentials 课程的一部分,我正在尝试将 AWS S3 存储桶上的“WEIGHT.TXT”中的数据加载到 Snowflake DB 表中。

select * from weight_ingest

> Result: 0 rows
list @S3TESTBKT/W

> Result:1 
> s3://my-s3-tstbkt/WEIGHT.txt  509814  6e66e0c954a0dfe2c5d9638004a98912 Tue, 17 Dec 2019 14:52:52 GMT
COPY INTO WEIGHT_INGEST
FROM @S3TESTBKT/W
FILES = 'WEIGHT.TXT'
FILE_FORMAT = (FORMAT_NAME=USDA_FILE_FORMAT)

> Result: Copy executed with 0 files processed.

有人可以帮我解决这个问题吗?提前致谢。

更多信息:

S3 对象 URL:https://my-s3-tstbkt.s3.amazonaws.com/WEIGHT.txt(我可以在浏览器中打开文件内容)

文件路径:s3://my-s3-tstbkt/WEIGHT.txt

文件格式定义:

ALTER FILE FORMAT "USDA_NUTRIENT_STDREF"."PUBLIC".USDA_FILE_FORMAT 
SET COMPRESSION = 'AUTO' 
FIELD_DELIMITER = '^' 
RECORD_DELIMITER = '\n' 
SKIP_HEADER = 0 
FIELD_OPTIONALLY_ENCLOSED_BY = 'NONE' 
TRIM_SPACE = FALSE 
ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE 
ESCAPE = 'NONE' 
ESCAPE_UNENCLOSED_FIELD = '\134' 
DATE_FORMAT = 'AUTO' 
TIMESTAMP_FORMAT = 'AUTO' 
NULL_IF = ('\\N');

阶段定义:

ALTER STAGE "USDA_NUTRIENT_STDREF"."PUBLIC"."S3TESTBKT" 
SET URL = 's3://my-s3-tstbkt';
```

【问题讨论】:

    标签: amazon-s3 snowflake-cloud-data-platform snowflake-schema


    【解决方案1】:

    我认为问题出在您的复制命令上。请尝试以下步骤:

    执行list命令获取文件列表:

    List @S3TESTBKT
    

    如果您的源文件出现在此处,只需确保复制命令中的文件夹名称即可。

    COPY INTO WEIGHT_INGEST
    FROM @S3TESTBKT/
    FILES = ('WEIGHT.txt')
    FILE_FORMAT = (FORMAT_NAME = USDA_FILE_FORMAT);
    

    【讨论】:

    • 感谢 Sriga 的回复,它成功了!!
      观察到我的 cmd 中遗漏了 2 件事
      'WEIGHT.txt' 周围的括号丢失了,而不是 'WEIGHT.txt',我提到了 'WEIGHT.TXT'(全部大写)
      忽略我的cmd中的舞台名称@S3TESTBKT/W,之前我也尝试过@S3TESTBKT,但由于上面提到的2个差异而没有工作。
      我不喜欢我们必须在文件名周围提到括号,无论如何再次感谢您!
    • 我注意到的另一件事是,如果我为同一个文件重新运行 COPY cmd,cmd 会成功,但会记录一个错误,即 File 之前已加载。这是意外重新加载给定文件的一个很好的功能。我想它会确保它在像这样出错之前执行 chksum。否则,假设每天必须将同名但不同数据的每日文件加载到表中,不应该说该文件是较早加载的。
    • @Prashanth Yes Snowflake 维护加载文件的元数据,所以即使你再次提交复制命令它也不会复制数据,直到你强制它。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-09-07
    • 2020-03-04
    • 2023-03-09
    • 1970-01-01
    • 2020-11-13
    • 2020-10-07
    • 1970-01-01
    相关资源
    最近更新 更多