【发布时间】:2015-03-04 03:00:48
【问题描述】:
在使用 tesseract-OCR 引擎提取文本之前,我使用 ImageMagick 服务对收据图像进行预处理。我需要删除收据的背景。我已经通过遮罩去除了边框 here. 但我无法为收据创建遮罩。
但是,我尝试从收据图像中移除阴影。
初始图像(收据示例)
convert input.png -colorspace gray \
\( +clone -blur 0x2 \) +swap -compose divide -composite \
-linear-stretch 5%x0% photocopy.png
代码应用后:
我已尝试使用下面的代码将除白色以外的所有颜色变为黑色,但这似乎并没有完全遮盖 photocopy.png 的背景。
convert receipt.jpg -fill black -fuzz 20% +opaque "#ffffff" black_border.jpg
有什么办法可以去掉收据图片的边框吗?或者从图像中创建任何类型的蒙版?注意:我需要为具有不同背景的多个图像去除噪点和边框。
【问题讨论】:
标签: ruby imagemagick ocr tesseract image-masking