【问题标题】:Text recognition with tensorfow使用张量流进行文本识别
【发布时间】:2020-09-10 13:05:04
【问题描述】:

我是 tensorflow 新手,玩过 MNIST 手写数字集。 我想做自己的项目,识别文本而不是数字,但找不到好的教程。

它与数字的原理相同,但最后我必须使用 26 而不是 10 层?或者包括大小写和特殊字符? 如果是这样,我必须首先将单词裁剪到每个字符中,对吗?或者有没有办法识别整个句子?

我想训练三种不同的字体,所以不用手写,也不关心大小写。

稍后我想在照片上使用经过训练的模型。以印刷品为例。如果我对齐图像,模型是否有效,我是否需要重新训练一点或从一开始就使用新数据进行训练?

我从哪里开始? Keras example 是压倒性的。

【问题讨论】:

    标签: tensorflow keras ocr


    【解决方案1】:

    你正在寻找一个OCR模型,一个简单的CNN无法从扫描的图像中检测到文本,你需要先对它们进行分割,这可以根据语言脚本完成。

    您可以从tesseract 开始。有一个名为 pytesseract 的 python 包装器。

    import pytesseract
    from PIL import Image
    text = pytesseract.image_to_string(Image.open("temp.jpg"), lang='eng',
                            config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
    
    print(text)
    

    对于您自己的模型,请尝试 CRNN 模型。 https://github.com/qjadud1994/CRNN-Keras

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-03-13
      • 1970-01-01
      • 2020-02-22
      • 2015-09-10
      • 1970-01-01
      • 2017-08-27
      相关资源
      最近更新 更多