【发布时间】:2020-01-06 13:27:14
【问题描述】:
我想使用 KNN 在 sklearn 管道中估算分类特征(缺少多个分类特征)。
我对现有的 KNN 解决方案(fancyimpute、sklearn KneighborRegressor)做了很多研究。他们似乎都没有工作
- 在 sklearn 管道中工作
- 估算分类特征
我的一些问题是(非常感谢任何建议):
- 是否有任何现有方法允许使用 KNN(或任何其他回归器)来估算缺失值(在本例中为分类)以使用 sklearn 管道
- fancyimpute KNN 实现似乎没有使用汉明距离来估算缺失值(这对于分类特征来说是理想的)。
- 考虑到 KNN 在估算缺失值时非常耗时(即针对整个数据集对缺失值运行预测),是否有任何可用的快速 KNN 方法实现
【问题讨论】:
标签: scikit-learn