Google 视觉 API 响应中的更新答案

【问题标题】：Updates in Google's vision API's responseGoogle 视觉 API 响应中的更新
【发布时间】：2020-05-17 15:35:37
【问题描述】：

在过去的几个月里，我一直在使用 Google 的视觉 API 进行文本检测。 API 返回特定图像/文档中存在的单词的“地图”。 “地图”（JSON）中的每个元素都将包含一个单词的文本及其在文档中的坐标

早期的映射用于根据空格和特殊字符将文本分解为单词......现在似乎将文本分解为仅基于单词的单词关于空间。

例如，带有文本“Foo.Bar Hello World”的文档将有 4 个元素，即 4 个单词，因为“单词”也意味着在特殊字符上破坏文本......但现在“Foo.Bar Hello World”结果只有三个字。

我的问题是有没有办法选择我们可以使用哪个版本的 API？或者有没有办法跟踪引入到 API 的返回结构的更改/TEXT_DETECTION 模型中的更改？

我检查过的内容：

https://cloud.google.com/vision/docs/release-notes -> 这包含整个 API 的版本，而不是为 OCR 运行的模型的更改或模型结果的“后处理”。
cloud-vision-discuss google group 以解决类似问题。

【问题讨论】：

【解决方案1】：

我们完全遇到了同样的问题。看看 Google 的回答。 难以置信：

我们刚刚收到 Vision API 工程团队的最新消息，他们上周刚刚发布了一个新的 OCR 模型，并告知我们发布说明将很快发布。

工程团队还告知我们，他们已了解此问题，并且正在进一步调查。

因此，我已要求他们向我们提供有关 OCR 模型质量回归的最新信息。我们还向他们询问了使用以前模型版本的可能性。

没有预计 Vision API 团队何时会回复我们的回复，但请期待我们最迟在本周末之前或在他们更新我们后尽快通知您。

【讨论】：

【解决方案2】：

现在（5 月 18 日）Google 已更新了有关 15 日所做更改的发行说明。

简而言之：“标点错误”的问题将持续存在，并将成为正式的生产版本。从 6 月 30 日起，别无选择！

如果您有使用 Google Vision 进行生产的应用程序，请立即查看您的计划并做好应急准备。

【讨论】：