【发布时间】:2022-11-13 04:57:49
【问题描述】:
这是一张纸的照片。它包括文本、相机图像和二维码图像。是否有一个 API 可以从这个较大的图像中提取这两个(相机和二维码)并将它们分成各自的图像。我知道这对文本(OCR)是可行的,但如果它甚至存在的话,我需要找到一些方法来进行图像识别。目前,除了从 pdf 中提取图像之外,我找不到任何关于这样做的参考,这些软件都没有能力从不完美的 pdf 中提取它们。
API 的价格(首选 node.js,但我可以适应使用任何语言)不是一个大问题,我只是不确定如果没有使用机器学习编写合法的人工智能,这是否可能,我会如果我试图这样做,无疑会导致全球互联网关闭破坏一切。
无论如何,任何建议都会很棒,非常感谢。谢谢!
编辑:图像并不总是那些,它可以是任何东西的图像,从土豆到旗帜
【问题讨论】:
-
Adobe Acrobat 完美地做到了这一点——您只需单击“编辑 PDF”,它就会对图片甚至字体进行 OCR。
-
苏普萨扬,谢谢你的建议。 adobe 可以处理转换为 pdf 的图像吗?所以基本上模糊的pdf是倾斜的和不完美的。从我测试的所有其他 pdf 图像提取器中,没有一个可以完成任务。我还没有测试过adobe,所以我试试看。
-
征求建议是题外话。 help center
-
啊,好吧。我不会再这样做了。最后一件事:您对我可以要求推荐的网站有任何推荐吗?
标签: node.js image-processing ocr image-recognition image-extraction