收据 OCR 类别

【问题标题】：Category for Receipt OCR收据 OCR 类别
【发布时间】：2018-04-24 23:45:01
【问题描述】：

我正在尝试使用 tesseract 创建收据 OCR 应用程序。在识别过程之后，我想确定收据属于哪个类别，例如食品和饮料、交通、电话账单等。我目前的做法是：

在一些常见商店旁边创建一个类别字典。
识别后，我将使用近似字符串匹配尝试在字典中查找商店名称，如果存在，我会将收据分配到该类别。
如果没有找到，我会将收据分配到默认类别，并等待用户从列表中选择一个。然后我会将这对保存在字典中以备将来使用。

问题在于，除了存储到类别对的限制之外，如果我尝试对字典的每一行使用近似字符串识别，它会非常慢。有什么办法可以改进这个过程吗？

【问题讨论】：

标签： android dictionary tesseract

【解决方案1】：

请注意商店类别与有用的支出类别不匹配（想想 - 我在 Target 或 Staples 买了什么？）或在 Staples 与杂货店购买咖啡。

此 API： https://apidocs.itemize.com/enterprise/ 会做你想做的事。

【讨论】：

猜你喜欢

1970-01-01
2019-05-22
1970-01-01
1970-01-01
1970-01-01
1970-01-01
2017-02-25
1970-01-01
2018-11-18

相关资源

下载 2022-12-30
下载 2023-03-07
下载 2023-02-05
下载 2021-11-03

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode