【问题标题】:How does google books highlight text in a scanned image谷歌图书如何突出显示扫描图像中的文本
【发布时间】:2012-02-08 23:46:21
【问题描述】:

如果我在这里进行关键字搜索:

http://books.google.com/ebooks/reader?id=s1gVAAAAYAAJ&printsec=frontcover&output=reader&pg=GBS.PA7

“流动文本”中突出显示的文本看起来很简单,但是如果您切换到显示“扫描页面”,它仍然会显示突出显示的文本?任何人都知道他们是如何做到这一点的。

【问题讨论】:

    标签: hit-highlighting


    【解决方案1】:

    通过 OCR 过程,无论是在他们扫描图像时还是在您请求页面时动态地。

    【讨论】:

    • 他们是否使用 XY 坐标来排列图像上突出显示的单词,因为扫描的图像本身只是文本的表示,而不是实际的文本。我知道要使搜索和“流动文本”起作用,有一个 OCR 流程
    • 是的,大多数 OCR 处理都会输出它识别的带有坐标的字符(通常是一个矩形),这样您就知道正在显示什么以及它在图像上的位置。使用这些坐标,它可以在短语上绘制一个框以突出显示。
    猜你喜欢
    • 1970-01-01
    • 2013-05-25
    • 2018-12-03
    • 2015-12-03
    • 1970-01-01
    • 1970-01-01
    • 2021-09-20
    • 2012-12-21
    • 1970-01-01
    相关资源
    最近更新 更多