【发布时间】:2020-05-17 15:35:37
【问题描述】:
在过去的几个月里,我一直在使用 Google 的视觉 API 进行文本检测。 API 返回特定图像/文档中存在的单词的“地图”。 “地图”(JSON)中的每个元素都将包含一个单词的文本及其在文档中的坐标
早期的映射用于根据空格和特殊字符将文本分解为单词......现在似乎将文本分解为仅基于单词的单词 关于空间。
例如,带有文本“Foo.Bar Hello World”的文档将有 4 个元素,即 4 个单词,因为“单词”也意味着在特殊字符上破坏文本......但现在“Foo.Bar Hello World”结果只有三个字。
我的问题是 有没有办法选择我们可以使用哪个版本的 API? 或者 有没有办法跟踪引入到 API 的返回结构的更改/TEXT_DETECTION 模型中的更改?
我检查过的内容:
- https://cloud.google.com/vision/docs/release-notes -> 这包含整个 API 的版本,而不是为 OCR 运行的模型的更改或模型结果的“后处理”。
- cloud-vision-discuss google group 以解决类似问题。
【问题讨论】:
标签: google-cloud-vision vision-api