【发布时间】:2020-09-02 15:45:05
【问题描述】:
所以我使用这里的数据集https://www.kaggle.com/crawford/emnist 即emnist-letters-train-labels-idx1-ubyte.gz
当我浏览它时,它会返回 27 个类,而应该只有 26 个,因为它是用于字母表的。 我尽可能多地挖掘,但未能在这些标签中找到。
任何帮助都会很棒。
【问题讨论】:
所以我使用这里的数据集https://www.kaggle.com/crawford/emnist 即emnist-letters-train-labels-idx1-ubyte.gz
当我浏览它时,它会返回 27 个类,而应该只有 26 个,因为它是用于字母表的。 我尽可能多地挖掘,但未能在这些标签中找到。
任何帮助都会很棒。
【问题讨论】:
我的猜测是,如果标志不是给定字母表中的字母,或者例如一个号码。所以如果标志不能分类,第27个备用类(“不是字母”)将被分配给它。 你是否已经尝试过给它一些不是字母的符号,看看它是否大部分时间都在同一个类中?
【讨论】: