【问题标题】:Force overwrite when saving to GCP bucket (pd.to_csv)保存到 GCP 存储桶时强制覆盖 (pd.to_csv)
【发布时间】:2021-09-22 12:41:29
【问题描述】:

我有一个我无法解决的小问题,非常感谢您对此的任何意见。你看,每当我使用pd.to_csv() 将文件写入文件夹时,它都完成了我期望做的事情,即覆盖任何同名文件。

我现在只在 GCP 上工作,我需要刷新令牌才能使用现有的 API 访问某些 API。这样做没有任何问题,但我所做的是将所有 API 令牌的副本保存在我存储在存储桶中的数据帧中。我所有的文件都有一个日期戳:

保存

base = datetime.date.today()
bucket_name_tokens = 'project-tokens'
bucket_path_tokens = 'gs://' + bucket_name_tokens
tokens.to_csv(bucket_path_tokens +'/tokens_{}.csv'.format(base))

阅读

bucket_name_tokens = 'project-tokens'
bucket_path_tokens = 'gs://' + bucket_name_tokens
tokens_new = pd.read_csv(bucket_path_tokens +'/tokens_{}.csv'.format(base))

我发现如果我(出于某种原因)刷新我的令牌并使用上面的代码保存新的令牌(显然是在同一天),它不会!用同名。

我到处寻找解释或pandas.to_csv() 的选项,但运气不好我不知道。

关于如何确保文件被覆盖的任何想法?我错过了什么吗?

注意这对于我保存在我创建的任何存储桶中的所有文件也是如此。

提前致谢

【问题讨论】:

  • 在上传新版本之前删除旧版本即可。

标签: python pandas google-cloud-platform google-cloud-storage


【解决方案1】:

不要创建有保留的存储桶。

保留很好,但如果关闭,它将不允许覆盖或删除存储桶中的项目。

就我个人而言,我觉得没有任何保留会更好。

【讨论】:

    猜你喜欢
    • 2011-10-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-10-13
    • 2020-11-23
    • 1970-01-01
    • 2022-06-10
    • 2021-09-21
    相关资源
    最近更新 更多