【发布时间】:2012-12-10 22:13:38
【问题描述】:
我是“光学字符识别”的新手,需要更多信息和建议,因为我无法找到我需要做的事情。
我有以下任务:
- 图像作为输入给出 - 它们将具有相同的结构 - 一些图标、公司符号和文字。
- 只需要选择文本,然后使用一些 OCR 库。
是否可以使用一些 OCR php 库创建一个函数并仅选择一些带有文本的区域?
如果 PHP 没有好的 OCR 库,你能推荐一些其他语言的吗?
下面的例子展示了我想要做什么(这只是一个例子,我并不是想用金钱做一些违法的操纵):
这是示例图片:
这是输出(被红色矩形包围的文本):
- 这是所有公共和私人债务的法定货币
- L11180916G
- 单美元
欢迎所有文章和建议。
【问题讨论】:
-
当然不是题外话,显然是在寻求开发帮助以使用 php 从图像中获取文本。
-
@MubasharAhmad 不,我找不到提取它的方法。很久以前,一个 stackoverflow 用户分享了一个指向他的工具的链接,它可以做到这一点,但它不是免费的,我没有尝试。后来,他删除了他的答案。
-
@gotqn 显然该解决方案被称为“ABBYY Cloud OCR SDK”,虽然我不知道它是 1. 甚至可以工作还是 2. 物有所值。
-
我会推荐 python 科学生态系统。库和教程非常好,ipython notebook(现在是 jupyter)在调试图像工作流时有很大帮助。一个好的开始是 scipy 教程之一:youtube.com/watch?v=olb7R1cuzyU