【发布时间】:2021-08-20 05:19:18
【问题描述】:
我正在处理二进制分类问题,并且我正在使用应该用于数据匹配的大型文本数据集。数据不平衡,但我正在使用一种方法来解决此问题。
我想在这个数据集的小子集中尝试一些带有 sklearn 的分类器。 sklearn中有没有办法将此数据集划分为N个子集,保持类的比例,那么我可以将这些子集中的每一个划分为训练/测试并为每个子集独立拟合分类器吗?
【问题讨论】:
-
你能举个例子吗?就像您提供的输入和您想要的输出/结果一样。
标签: python machine-learning scikit-learn classification record-linkage