【发布时间】:2014-09-01 15:48:49
【问题描述】:
看看下面的图片。如果你不是色盲,你应该看到一些 A 和 B。图像中有3个A和3个B,它们都有一个共同点:它们的颜色是背景+value、saturation和的10%色调,按此顺序。对于大多数人来说,中心字母很难看到 - 饱和似乎没有多大作用!
这有点麻烦,因为我正在制作一些字符识别软件,并且我正在根据 known foreground 和 background 颜色。但有时它们非常接近,而图像嘈杂。为了确定一个像素属于字母还是背景,我的程序检查了欧几里得 RGB 距离:
(r-fr)*(r-fr) + (g-fg)*(g-fg) + (b-fb)*(b*fb) <
(r-br)*(r-br) + (g-bg)*(g-bg) + (b-bb)*(b*bb)
这很好用,但对于近距离的背景和前景,有时效果很差。
是否有一些更好的指标可供寻找?我研究了颜色感知模型,但那些主要是模型 brightness 而不是我正在寻找的感知 difference。也许是一种将饱和度建模为不太有效的模型,以及某些色调差异?任何指向一些有趣指标的指针都会非常有用。
【问题讨论】:
-
您是否尝试过使用任何著名的色差算法? en.wikipedia.org/wiki/Color_difference 另外,您的公式似乎使用 RGB 颜色空间而不是 LAB en.wikipedia.org/wiki/Lab_color_space#Perceptual_differences
-
谢谢!您的 Lab 颜色空间参考正是我所需要的,我在这里找到了一些很好的代码 stackoverflow.com/questions/4593469/… 可以使用。现在我的程序在区分颜色方面做得更好了。
-
很高兴我能帮上忙 :) 我建议您发布您的解决方案作为未来参考的答案。
标签: colors artificial-intelligence perception