【发布时间】:2013-05-10 14:55:09
【问题描述】:
我想将扫描的图像转换为黑白图像,目标是在图像通过互联网传输以进行 OCR 之前减小文件大小。
扫描仪/通用图像编辑软件创建的正常二值化/黑白图像会产生不良结果。
留下大量随机黑色像素,它们实际上只是二值化产生的噪声,这导致 OCR 尝试识别没有字符的字符,或在字符后插入句号、冒号等。
我可以在 OpenCV 中使用什么来对图像进行二值化,保持线条、字符和暗区为实心,并减少白色区域中的像素噪点?
我玩过 cvThreshold 和 cvAdaptiveThreshold,但结果还不是很好。
例如,查看original image 和desired result。
【问题讨论】:
-
你的例子似乎是三元的,我看到除了黑色和白色之外至少有一种灰色。
-
@MarkRansom 当我回去查看 IrfanView 中的图像时,我认为您是对的,我一定是保存了错误的黑白图像。但是,在 Gimp 中查看图像时,像素只是黑白的。你用什么来查看图像?就我而言,我相信 gimp 胜过 IrfanView。
-
我在 Chrome 中查看它。今天在 Firefox 中看起来不错,不知道发生了什么。