【问题标题】:Updates in Google's vision API's responseGoogle 视觉 API 响应中的更新
【发布时间】:2020-05-17 15:35:37
【问题描述】:

在过去的几个月里,我一直在使用 Google 的视觉 API 进行文本检测。 API 返回特定图像/文档中存在的单词的“地图”。 “地图”(JSON)中的每个元素都将包含一个单词的文本及其在文档中的坐标

早期的映射用于根据空格特殊字符将文本分解为单词......现在似乎将文本分解为仅基于单词的单词 关于空间。

例如,带有文本“Foo.Bar Hello World”的文档将有 4 个元素,即 4 个单词,因为“单词”也意味着在特殊字符上破坏文本......但现在“Foo.Bar Hello World”结果只有三个字。

我的问题是 有没有办法选择我们可以使用哪个版本的 API? 或者 有没有办法跟踪引入到 API 的返回结构的更改/TEXT_DETECTION 模型中的更改?

我检查过的内容:

  1. https://cloud.google.com/vision/docs/release-notes -> 这包含整个 API 的版本,而不是为 OCR 运行的模型的更改或模型结果的“后处理”。
  2. cloud-vision-discuss google group 以解决类似问题。

【问题讨论】:

    标签: google-cloud-vision vision-api


    【解决方案1】:

    我们完全遇到了同样的问题。看看 Google 的回答难以置信

    我们刚刚收到 Vision API 工程团队的最新消息,他们上周刚刚发布了一个新的 OCR 模型,并告知我们发布说明将很快发布。

    工程团队还告知我们,他们已了解此问题,并且正在进一步调查。

    因此,我已要求他们向我们提供有关 OCR 模型质量回归的最新信息。我们还向他们询问了使用以前模型版本的可能性。

    没有预计 Vision API 团队何时会回复我们的回复,但请期待我们最迟在本周末之前或在他们更新我们后尽快通知您。

    【讨论】:

    • 我期待您与 Google 的支持人员(如果有)分享进一步的沟通。我无法获得支持,因此将不胜感激。
    【解决方案2】:

    现在(5 月 18 日)Google 已更新了有关 15 日所做更改的发行说明。

    https://cloud.google.com/vision/docs/release-notes?hl=en

    简而言之:“标点错误”的问题将持续存在,并将成为正式的生产版本。从 6 月 30 日起,别无选择!

    如果您有使用 Google Vision 进行生产的应用程序,请立即查看您的计划并做好应急准备。

    enter image description here

    【讨论】:

      猜你喜欢
      • 2017-10-10
      • 2023-03-23
      • 2018-11-11
      • 1970-01-01
      • 2017-02-26
      • 2012-03-27
      • 1970-01-01
      • 1970-01-01
      • 2012-12-07
      相关资源
      最近更新 更多