【发布时间】:2018-09-18 09:20:52
【问题描述】:
我在Python 上使用Google Cloud Vision API 来检测通常位于商店/商店上方的囤积板上的文本值。到目前为止,我已经能够检测到单个单词及其边界多边形的坐标。有没有办法根据检测到的单词的相对位置和大小对它们进行分组?
例如,商店的名称通常写成相同的大小,并且单词是对齐的。 API 是否提供了一些函数来对可能是更大句子(商店名称或地址等)的一部分的那些词进行分组?
如果 API 不提供此类功能,那么将它们分组的好方法是什么?以下是我到目前为止所做的图像示例:
description: "SHOP"
bounding_poly {
vertices {
x: 4713
y: 737
}
vertices {
x: 5538
y: 737
}
vertices {
x: 5538
y: 1086
}
vertices {
x: 4713
y: 1086
}
}
, description: "OVOns"
bounding_poly {
vertices {
x: 6662
y: 1385
}
vertices {
x: 6745
y: 1385
}
vertices {
x: 6745
y: 1402
}
vertices {
x: 6662
y: 1402
}
}
【问题讨论】: