【发布时间】:2016-12-15 08:06:02
【问题描述】:
我的灰度图像上有未知频率的手写数字 (0-9)。
我正在尝试构建机器学习模型来确定:
- 每个数字的 x,y 坐标。
- 数字标签(即 0-9)。
示例
(我无法上传灰度图像,所以假设.表示“黑色背景”,数字代表自己):
Image1: Image2: Image3:
7....... .2...... ........
........ .....3.. ........
....1... ........ ........
........ ....2... ........
因此,让f 表示我们应该拥有的机器学习模型/功能:
f(Image1) = [ label0:[], f(Image2) = [ label0:[], f(Image3) = [ label0:[],
label1:[(x=4,y=2)], label1:[], label1:[],
label2:[], label2:[(x=1,y=0), label2:[],
(x=1,y=3)],
label3:[], label3:[(x=5,y=1)], label3:[],
label4:[], label4:[], label4:[],
label5:[], label5:[], label5:[],
label6:[], label6:[], label6:[],
label7:[(x=0,y=0)], label7:[], label7:[],
label8:[], label8:[], label8:[],
label9:[], label9:[], label9:[],
]
我正在尝试使用 Keras 应用深度学习方法来同时解决这两个问题,但我很难设置我的标签,因为每个图像的标签数量未知。
任何人对如何为深度学习设置这样的问题有任何想法?我是否应该将问题分为 2 个阶段(定位然后分类 - 但定位问题仍然有未知数量的标签)?谢谢!
【问题讨论】:
标签: image regression deep-learning conv-neural-network keras