【问题标题】:API to retrieve images from within an image or pdf用于从图像或 pdf 中检索图像的 API
【发布时间】:2022-11-13 04:57:49
【问题描述】:

我正在寻找一种从另一个图像中提取图像的方法。例如:

这是一张纸的照片。它包括文本、相机图像和二维码图像。是否有一个 API 可以从这个较大的图像中提取这两个(相机和二维码)并将它们分成各自的图像。我知道这对文本(OCR)是可行的,但如果它甚至存在的话,我需要找到一些方法来进行图像识别。目前,除了从 pdf 中提取图像之外,我找不到任何关于这样做的参考,这些软件都没有能力从不完美的 pdf 中提取它们。

API 的价格(首选 node.js,但我可以适应使用任何语言)不是一个大问题,我只是不确定如果没有使用机器学习编写合法的人工智能,这是否可能,我会如果我试图这样做,无疑会导致全球互联网关闭破坏一切。

无论如何,任何建议都会很棒,非常感谢。谢谢!

编辑:图像并不总是那些,它可以是任何东西的图像,从土豆到旗帜

【问题讨论】:

  • Adobe Acrobat 完美地做到了这一点——您只需单击“编辑 PDF”,它就会对图片甚至字体进行 OCR。
  • 苏普萨扬,谢谢你的建议。 adobe 可以处理转换为 pdf 的图像吗?所以基本上模糊的pdf是倾斜的和不完美的。从我测试的所有其他 pdf 图像提取器中,没有一个可以完成任务。我还没有测试过adobe,所以我试试看。
  • 征求建议是题外话。 help center
  • 啊,好吧。我不会再这样做了。最后一件事:您对我可以要求推荐的网站有任何推荐吗?

标签: node.js image-processing ocr image-recognition image-extraction


【解决方案1】:

对于 QR 码,您可以简单地使用 QR 码扫描器库并将输出转换回 QR 码。至于相机,您将需要像Google Cloud Vision 这样的图像识别服务,或者使用 TensorFlow 等工具训练您自己的神经网络来识别相机图片。

【讨论】:

  • 谢谢你的建议。我不知道谷歌云视觉也可以识别图像。我会调查的。
  • 没问题。顺便说一下,如果你的图像只包含一些文本、一个相机和一个 QR 码,你可以去掉文本和 QR 码,只留下相机。这样,您就不必独自处理取出相机的问题。
  • 嗯,没想到。这也是云视觉的一个功能吗?
  • 抱歉,我无法在 API 中找到我能够检测和隔离图像的位置。唯一可用的功能(也许它属于我无法做到的类别)是:标签检测、文本检测、安全搜索、面部检测、名人检测、地标检测、徽标检测、图像属性、裁剪提示、网络检测和对象定位。
【解决方案2】:

对于单个对象,您可以尝试 hotpot API https://hotpot.ai/docs/api 您的代码示例链接到https://hotpot.ai/remove-background

对于剥离,您可能需要辅助自动裁剪任务

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-07-02
    • 1970-01-01
    • 2017-08-30
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多