【发布时间】:2021-06-29 17:33:56
【问题描述】:
我正在通过从 MNIST 数据集中获取的数字的水平连接图像生成手写数字(多于一位)的图像,目标是生成的数字看起来有点自然(因为它们看起来像是由一个人)。
为此,我从数据集中为 0-9 的每个数字采样一张图像,然后使用这些图像生成我想要的任何数字的图像。
我面临的一个问题是,在 MNIST 数据集中,数字的粗细不同,所以我生成的最终数字有一些数字太粗(如附图所示,其中 9 太粗,而 5 则相反)。
Image of a number generated by the mentioned method
我想知道是否有某种图像处理技术可以用来处理所有数字图像,使它们具有相同或大致相同的厚度(也许厚度可以通过某些参数来控制)?
【问题讨论】:
-
我发现this stackoverflow post 提供了一种算法,该算法使用距离变换来查找迹线的平均厚度。我想我可以使用此算法将厚度与厚度参数进行比较,并根据比较结果腐蚀/膨胀图像。如果有人知道任何更好的算法,请将其作为答案或评论发布。
标签: image-processing