【问题标题】:How to parse name, phone number email from name card after using google cloud vision OCR? Android使用google cloud vision OCR后如何解析名片中的姓名,电话号码电子邮件?安卓
【发布时间】:2021-02-13 16:49:56
【问题描述】:

我终于通过google cloud vision API (OCR)成功拿到了名片内容。 我的问题是,我将所有内容都存储在 TextView 中,我怎样才能从中获取姓名和电话号码以及电子邮件?有什么想法可以从字符串中获取我想要的最重要的细节吗?提前致谢。

【问题讨论】:

  • 你需要解析 JSON 响应并找到你想要的字段,但我很确定你已经知道了,那么你的问题是什么?
  • 我的问题是名片有很多样式取决于设计,你将如何检测哪些文本属于姓名、电话、电子邮件。我已经知道电子邮件和号码可以由 Macher.find 完成。但是名字呢?
  • 不幸的是,它不像电子邮件那么容易,例如......

标签: android parsing google-cloud-vision


【解决方案1】:

我了解到您希望使用 Google Cloud Vision API 从卡片中提取和识别某些数据。

您已经能够通过 OCR 获取数据,但问题在于如何识别这些数据,因为卡片的样式和结构数量不限。

正如 cmets 中提到的 @Inga,您可以尝试使用正则表达式,尽管您想要考虑的样式和结构越多,这可能会变得越难。

所以我还建议您考虑使用机器学习方法。

例如,看看这篇关于Parsing Structured Documents with Custom Entity Extraction 的文章。它使用 Google Cloud Vision API 来读取数据,和你一样;但随后它使用Google Cloud Natural Language API 通过实体提取来识别某些元素。

查看Natural Language Entity's description,了解您可以使用此功能识别哪些类型的元素,例如姓名、电话号码和地址。

同理,如果此功能与您需要识别的所有数据都不匹配,您也可以针对要提取的特定类型的数据考虑使用creating and training a custom AutoML Natural Language model 选项。前面提到的文章也利用它来识别餐厅菜单中的特定数据。

您也不妨考虑看看Google Cloud Document AI,它还提供面向文档分析的 OCR 功能。

【讨论】:

    猜你喜欢
    • 2017-05-05
    • 1970-01-01
    • 2021-06-04
    • 1970-01-01
    • 1970-01-01
    • 2017-12-18
    • 1970-01-01
    • 2018-03-16
    相关资源
    最近更新 更多