用于从图像或 pdf 中检索图像的 API答案

【问题标题】：API to retrieve images from within an image or pdf用于从图像或 pdf 中检索图像的 API
【发布时间】：2022-11-13 04:57:49
【问题描述】：

我正在寻找一种从另一个图像中提取图像的方法。例如：

这是一张纸的照片。它包括文本、相机图像和二维码图像。是否有一个 API 可以从这个较大的图像中提取这两个（相机和二维码）并将它们分成各自的图像。我知道这对文本（OCR）是可行的，但如果它甚至存在的话，我需要找到一些方法来进行图像识别。目前，除了从 pdf 中提取图像之外，我找不到任何关于这样做的参考，这些软件都没有能力从不完美的 pdf 中提取它们。

API 的价格（首选 node.js，但我可以适应使用任何语言）不是一个大问题，我只是不确定如果没有使用机器学习编写合法的人工智能，这是否可能，我会如果我试图这样做，无疑会导致全球互联网关闭破坏一切。

无论如何，任何建议都会很棒，非常感谢。谢谢！

编辑：图像并不总是那些，它可以是任何东西的图像，从土豆到旗帜

【问题讨论】：

Adobe Acrobat 完美地做到了这一点——您只需单击“编辑 PDF”，它就会对图片甚至字体进行 OCR。
苏普萨扬，谢谢你的建议。 adobe 可以处理转换为 pdf 的图像吗？所以基本上模糊的pdf是倾斜的和不完美的。从我测试的所有其他 pdf 图像提取器中，没有一个可以完成任务。我还没有测试过adobe，所以我试试看。
征求建议是题外话。 help center
啊，好吧。我不会再这样做了。最后一件事：您对我可以要求推荐的网站有任何推荐吗？

标签： node.js image-processing ocr image-recognition image-extraction

【解决方案1】：

对于 QR 码，您可以简单地使用 QR 码扫描器库并将输出转换回 QR 码。至于相机，您将需要像Google Cloud Vision 这样的图像识别服务，或者使用 TensorFlow 等工具训练您自己的神经网络来识别相机图片。

【讨论】：

谢谢你的建议。我不知道谷歌云视觉也可以识别图像。我会调查的。
没问题。顺便说一下，如果你的图像只包含一些文本、一个相机和一个 QR 码，你可以去掉文本和 QR 码，只留下相机。这样，您就不必独自处理取出相机的问题。
嗯，没想到。这也是云视觉的一个功能吗？
抱歉，我无法在 API 中找到我能够检测和隔离图像的位置。唯一可用的功能（也许它属于我无法做到的类别）是：标签检测、文本检测、安全搜索、面部检测、名人检测、地标检测、徽标检测、图像属性、裁剪提示、网络检测和对象定位。

【解决方案2】：

对于单个对象，您可以尝试 hotpot API https://hotpot.ai/docs/api 您的代码示例链接到https://hotpot.ai/remove-background

对于剥离，您可能需要辅助自动裁剪任务

【讨论】：