【发布时间】:2016-10-01 09:04:32
【问题描述】:
我正在使用 TensorFlow 来实现对象识别。我遵循了本教程,但使用了我自己的数据集。 https://www.tensorflow.org/versions/r0.8/tutorials/mnist/pros/index.html#deep-mnist-for-experts
我使用 212 个正样本和 120 个负样本进行训练。测试集包含 100 个正样本和 20 个负样本。 训练精度只有32.15%,但测试精度是83.19%
我想知道是什么让测试精度高于训练精度,是我的数据集不够大吗?数据没有显示任何统计意义?或者是一般的东西,因为我看到有人说训练精度没有任何意义。但这是为什么呢?
【问题讨论】:
-
根据您的描述,pos/neg-examples 的比率差异显然会导致这种观察结果(训练比率约为 64%,比率测试约为 83%)!您是否在训练期间使用样本权重/类别权重(处理不平衡数据的技术)?
-
不..我没有使用那种技术。我将我的比率更改为相同(训练中:212 pos,80 neg。在测试中:100 pos,40 neg)。训练精度变为 0.27,测试精度为 0.71……我是否应该将负样本放大到训练和测试中正样本数量的两倍?
标签: machine-learning tensorflow conv-neural-network