【发布时间】:2021-01-12 15:45:13
【问题描述】:
我使用 tesseract.js 来检测 Node JS 中的数字。 例如这是我的图片:
我运行我的脚本,它检测到这样的事情:
289 ,0
并且由于图像中的噪声,它会考虑空格,以及逗号等其他符号。
有没有我可以指定只是数字,而没有其他符号,如空格和逗号?
这也是我的代码:
tesseract.recognize(
__dirname + '/Captcha.png',
'eng',
{ logger: m => console.log(m) }
).then(({ data: { text } }) => {
console.log(text);
});
【问题讨论】:
-
我已经尝试过相同的图像,我得到
289 0没有,。 -
如果您只想返回数字,您可以过滤文本并从最终结果中删除标点符号,但这并不能提高 OCR 的准确性。
-
@NenadVracar 请注意例如声明。
-
@Kay 非常感谢。
标签: javascript node.js ocr