【发布时间】:2019-12-18 16:13:57
【问题描述】:
尝试使用 Python + Keras 训练 cnn(卷积神经网络)。但即使是最简单的问题似乎也很难回答,而且那里的教程也没有我想要的答案。
我可以访问我想识别的少数类的数千张图像。但是我如何准备图像?例如:
- 是否应该将图像裁剪为完全我想要识别的对象?本例中的对象是完美的矩形,因此如果这有助于训练,我可以将它们裁剪为完美。
- 图像应该是什么尺寸?我是让它们保持高分辨率,还是将它们调整为小? MNIST 之类的许多示例使用 18x18 像素的图像,但在这种尺寸下,这些类的对象是毫无意义的模糊,彼此相似。
- 在训练期间,我是否应该只拥有我想要识别的类的图像?或者我应该在混合中插入一些我不关心的其他事物的图像?
- 在训练期间,是否可以在单个图像中包含对象的多个实例?还是应该将训练图像限制为单个类中只有 1 个对象的图像?
编辑:被问及我是否需要知道对象的位置。答案是我需要做物体检测:
(这张图片取自关于 Mask-RCNN 的 blog post,但我的问题比这更新手,它并不特定于 Mask-RCNN。)
【问题讨论】:
-
您只是想对图像进行分类(例如它是椅子、狗、猫、树、灯等的图像),还是您还想在图像中找到物体的位置也一样?
标签: machine-learning keras classification conv-neural-network