【发布时间】:2021-11-24 15:41:20
【问题描述】:
希望你一切都好。
在过去的几天里,我一直在花一些时间来研究 google vision 的工作项目。 我对结果很满意,但几乎没有什么我想不通的。 这里是:
我正在尝试使用 Google Vision API 从轮胎图片中读取信息, 例如这个:
这是我用来调用 API 的功能列表:
const features = [
{
"maxResults": 50,
"type": "LOGO_DETECTION"
},
{
"maxResults": 100,
"type": "DOCUMENT_TEXT_DETECTION"
}];
我的结果如下:
description: 'GOOD YEAR\n' +
'POSTER\n' +
'RADIAL\n' +
'YUDELESS\n' +
'EXTRA LOAD\n' +
'CSFY\n' +
'MADE IN GERMANY\n' +
'ROTATION\n' +
'II SGR\n' +
'(ED\n' +
'MINT\n' +
'M66 Lage\n' +
'VEU 900?\n'
对此我很满意,但我知道 API 可以检测到的信息很少。
案例 1: 当我裁剪图片的一部分并使用完全相同的 API 和参数时 我得到以下结果:
{
locale: 'und',
description: '225 55R16 99W\n',
boundingPoly: [Object]
而且,情况 2,即使我使用 online google vision try it service,我也会得到一些数字结果
所以最后,我要从一张图片中寻找最多的信息,即使我需要在之后对其进行整理。
想法、答案、提示,我什么都有。
干杯, 伊万
【问题讨论】:
-
您能具体说明您想要实现的目标吗? Cloud Vision 基于机器学习模型,因此结果可能会有所不同,具体取决于您的需求。例如,如果您使用
Logo Detection,它将识别徽标(徽标数据库由 google 管理)。TEXT_DETECTION检测并从任何图像中提取文本,DOCUMENT_TEXT_DETECTION也从图像中提取文本,但响应针对密集文本和文档进行了优化。结果还取决于图片的质量。您是否在寻找有关 Cloud Vision 的一般知识? -
感谢您的回复。我正在寻找轮胎图片上的文本提取;例如,在上面的第一张图片中,我正在寻找以下信息:品牌(固特异)、尺寸(225 55R16 99W)、名称(矢量)等......对我更好。我只是从 gcloud api 中得到了好坏参半的结果,所以我试图了解如何正确使用它
标签: api google-cloud-platform ocr google-vision