【发布时间】:2020-01-16 22:33:23
【问题描述】:
我正在使用 PASCAL VOC 2012 数据集进行图像分类。一些图像具有多个标签,其中一些具有单个标签,如下所示。
0 2007_000027.jpg {'person'}
1 2007_000032.jpg {'aeroplane', 'person'}
2 2007_000033.jpg {'aeroplane'}
3 2007_000039.jpg {'tvmonitor'}
4 2007_000042.jpg {'train'}
我想对这些标签进行 one-hot 编码来训练模型。但是,我不能使用 keras.utils.to_categorical,因为这些标签不是整数,而且 pandas.get_dummies 没有给我预期的结果。 get_dummies 给出了如下不同的类别,即将每个唯一的标签组合作为一个类别。
{'aeroplane', 'bus', 'car'} {'aeroplane', 'bus'} {'tvmonitor', 'sofa'} {'tvmonitor'} ...
对这些标签进行一次热编码的最佳方法是什么,因为我们没有为每张图像指定特定数量的标签。
【问题讨论】:
标签: python pandas keras one-hot-encoding multilabel-classification