【发布时间】:2019-07-12 11:01:45
【问题描述】:
我的数据是轻尾的,在两个极端都有几个异常值。我正在使用 Birch 对数据进行聚类,在此之前我使用 RobustScaler 来转换数据,然后使用 PCA 来减少维度。但是我收到一个 MemoryError:
这对我来说有点不寻常,因为当我尝试另一种仅映射来自 [0,1] 的原始数据的转换方法时,Birch 算法会起作用。
我阅读了 SKLearn 的 Birch 文档并了解了 partial_fit() 函数,但那里没有足够的细节让我了解它的用途以及如何使用它。文档只是说:'在线学习。防止从头开始重建 CFTree。'
【问题讨论】:
标签: python pandas scikit-learn cluster-analysis hierarchical-clustering