【发布时间】:2021-08-28 17:57:02
【问题描述】:
我正在使用 MovieLens 数据集 (https://grouplens.org/datasets/movielens/latest/) 在 Python 中构建推荐系统。为了让我的系统正常工作,我需要所有用户和所有项目都出现在训练集中。但是,我还没有找到一种方法来做到这一点。我尝试在与每个用户相关的数据集分区上使用sklearn.model_selection.train_test_split,然后将结果连接起来,从而成功创建了包含每个用户给出的至少一个评分的训练和测试数据集。我现在需要的是找到一种方法来创建训练和测试数据集,这些数据集也至少包含每部电影的评分。
【问题讨论】:
标签: python training-data recommender-systems test-data