【发布时间】:2021-08-25 06:34:50
【问题描述】:
在 MongoDB 中,我有一个大学数据集。我只需要获取不同的名称和 sourceURL,我的收藏包含:
dict_keys(['_id', 'name','univ_id','sourceUrl'])
使用 PyMongo,我可以通过以下方式获得不同/唯一的 URL:
data = data_col.find({"univ_id": "glaacuk"}).distinct('sourceUrl')
并且我可以通过以下方式获取名称和 sourceURL(但不是不同的值):
data = data_col.find({"univ_id": "glaacuk"}, {'sourceUrl': 1, 'name': 1, '_id': 0})
我曾尝试使用 data = data_col.find({"univ_id": "glaacuk"}, {'sourceUrl': 1, 'name': 1, '_id': 0}).distinct('sourceUrl') 仅获取不同的名称和 sourceUrl,但没有成功。
我怎样才能只获得不同的名称和 sourceURL ?
提前致谢。
【问题讨论】: