【发布时间】:2021-01-16 01:40:36
【问题描述】:
我想使用在 mlxtend 库 apriori 算法中实现的关联规则来构建推荐系统。在我的销售数据中,有关于 3600 万笔交易和 50k 种独特产品的信息。 我尝试使用 sklearn OneHotEncoder 和 pandas get_dummies() 但两者都给出 OOM 错误,因为它们无法创建形状为 (36 mil, 50k) 的帧
MemoryError: Unable to allocate 398. GiB for an array with shape (36113798, 50087) and data type uint8
还有其他解决办法吗?
【问题讨论】:
标签: pandas scikit-learn one-hot-encoding apriori mlxtend