【发布时间】:2019-10-13 10:03:00
【问题描述】:
我正在从 S3 位置读取数据集 dataset1 和 dataset2。然后我对它们进行转换并写回从数据集2读取的相同位置。
但是,我收到以下错误消息:
An error occurred while calling o118.save. No such file or directory 's3://<myPrefix>/part-00001-a123a120-7d11-581a-b9df-bc53076d57894-c000.snappy.parquet
如果我尝试写入新的 S3 位置,例如s3://dataset_new_path.../ 然后代码可以正常工作。
my_df \
.write.mode('overwrite') \
.format('parquet') \
.save(s3_target_location)
注意:我在读取数据框后尝试使用.cache(),但仍然出现相同的错误。
【问题讨论】:
标签: apache-spark amazon-s3 pyspark aws-glue