【发布时间】:2018-10-10 05:56:52
【问题描述】:
我需要一些帮助,我正在处理一个问题,我有一张发票图像的 OCR,我想从中提取某些数据,如发票编号、金额、日期等,这些都存在于 OCR 中。我尝试使用分类模型,我将每个句子从 OCR 单独传递到模型并预测发票编号或日期或其他任何内容,但这种方法需要很多时间,我认为这是不正确的接近。
所以,我在想是否有一种算法可以让我有一个输入字符串并从该字符串映射输出,例如发票号、日期和金额都存在于字符串中。
例如:
Inp string: The invoice 1234 is due on 12 oct 2018 with amount of 287
Output: Invoice Number: 1234, Date: 12 oct 2018, Amount 287
那么,我的问题是,有没有一种算法可以让我在多张发票上进行训练然后做出预测?
【问题讨论】:
-
一个神经网络可以有一个输入和多个输出。
-
但是我可以将这些输出映射到输入本身吗?如果是,那么如何?
-
您将不得不训练模型,但基本上,一组带有几个隐藏层的 lstm 输入节点和为您提供所需不同输出的输出层是一种方法。
标签: python machine-learning deep-learning ocr