【发布时间】:2011-05-04 21:21:19
【问题描述】:
我有两个 Google App Engine 模型。我运行了几次 cron,现在我的数据存储中有重复的条目。如果删除我的整个数据存储并再次上传我的数据很容易,我会的。但是上次上传花了 4 个小时,所以我想知道是否有一种快速的方法可以删除模型中“标题”字段中具有重复名称的条目?
【问题讨论】:
标签: python google-app-engine google-cloud-datastore duplicates
我有两个 Google App Engine 模型。我运行了几次 cron,现在我的数据存储中有重复的条目。如果删除我的整个数据存储并再次上传我的数据很容易,我会的。但是上次上传花了 4 个小时,所以我想知道是否有一种快速的方法可以删除模型中“标题”字段中具有重复名称的条目?
【问题讨论】:
标签: python google-app-engine google-cloud-datastore duplicates
快吗?应该不会吧。
如果您确实想删除受骗者,我的方法是编写一个 remote_api 脚本。查询所有实体的模型,按标题排序,并获取 100 个批次。保留本地 Python 标题字典。如果您遇到新标题,请将其添加到字典中。如果您遇到已知标题,请将实体添加到删除批次,并在继续下一个查询批次之前刷新删除。
当您可以清除数据存储并重新导入时,可能工作量过多。
【讨论】: