【问题标题】:SIFT implementation of OCR in MATLABMATLAB中OCR的SIFT实现
【发布时间】:2011-11-30 18:26:05
【问题描述】:

因此,对于我们的最后一年项目,我们正在制作一个漂亮的 lil 应用程序,让用户可以用手机拍摄名片,在其上应用 OCR 并以可打印的形式获取所有必需的信息......我的问题是SIFT 是旋转不变的,即它不能区分“u”和“n”以及其他此类单词和数字。如果你能分享你们为克服这个问题而提出或提出的任何想法,我将不胜感激。 :) 谢谢。

【问题讨论】:

  • 导致 SIFT 无法区分“u”和“n”的特征是旋转不变性,而不是尺度不变性。尺度不变性意味着它不区分不同大小的事物。您通常可以在最终使用的任何 SIFT 实现中关闭旋转不变性。
  • 你使用的是什么 SIFT 实现?
  • 感谢您的意见,是的,我知道比例和旋转不变性之间的区别......我在写我的问题时一定很困惑。我们使用的 SIFT 的实现最初是为 pushto cursive script 设计和编写的……我们已经对其进行了修改以适应我们的具体问题。你可以在这里读到它。 ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5638470
  • 您能否更具体地说明如何关闭旋转不变性功能?我应该把代码贴在这里吗?
  • 我不知道您正在使用的实现的细节。代码中应该有一个部分确定 SIFT 补丁的主要方向,然后将所有方向调整为相对于该主要方向。如果没有布尔标志来改变这种行为,您可以将主要方向硬编码为等于 0。

标签: matlab ocr sift


【解决方案1】:

尝试剥离该图像 然后使用稀释,如果不起作用则使用神经网络

【讨论】:

  • 谢谢您,先生,您能否进一步详细说明您的答案?恐怕我是新手,欢迎您提供任何帮助。
【解决方案2】:

【讨论】:

  • 是的,先生,我们有详细信息。 Hassan Amin 博士在搬到拉合尔之前是我们的主管。我们甚至有普什图草书脚本版本的源代码,但我们的问题的性质有点不同。因此,我们提出了一种独特的方法。 :)
【解决方案3】:

确实,SIFT 很难找出 'u' 和 'n' 相似的字符,但如果你真的想坚持使用 SIFT(你的最终项目现在可能已经完成了......)你总是可以应用一些 pre-处理像'u'和'n'这样的图像,通过在它们下面以正确的方向放置下划线并让SIFT知道带有下划线的'u'是'u'等。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-02-06
    • 2011-10-27
    • 2011-07-29
    • 2011-07-11
    • 1970-01-01
    • 1970-01-01
    • 2013-01-02
    相关资源
    最近更新 更多