【问题标题】:How do I get the color of the text?如何获得文本的颜色?
【发布时间】:2017-06-22 21:11:51
【问题描述】:

我一直在使用 Microsoft OCR API,我正在从图像中获取文本,但我想知道文本是特定颜色还是特定背景颜色。

例如我有下面的图片,我想知道是否有红色的文字 i.e. image

我以为这行:

 string requestParameters = "language=unk&detectOrientation=true";

将帮助我确定我想从图像中接收的参数,所以如果我想知道一行文字中的颜色。所以我添加了这样的视觉功能:

 string requestParameters = "visualFeatures=Color,language=unk&detectOrientation=true";

但这并没有解决问题。

另外:我可以将图像分析中的 uriBase 链接和 OCR 中的链接混合吗?

【问题讨论】:

  • 发明自己的 URL 参数来调用 3rd 方服务似乎是一种奇怪的想法。查看the documentation 时,没有定义URL 参数来获取颜色。另一方面,this example 实际上将visualFeatures 参数与Color 一起使用。
  • 我认为你是对的。我认为这种可能性是因为该 URL 是由 Microsoft 提出的。当您分析图像时,您可以获得类别、描述(标签)和颜色等视觉特征。所以我只是将图像分析中的请求参数与 OCR 的请求参数混合在一起。我从来没有注意到 uriBase 是不同的。那么我可以混合使用 uriBase(来自图像分析的一个和来自 OCR 的一个)吗?

标签: text colors ocr microsoft-cognitive microsoft-ocr


【解决方案1】:

目前无法在一次调用中检索颜色信息和 OCR 结果。

您可以尝试使用从 OCR 返回的边界框来裁剪原始图像,然后将裁剪后的图像发送到 analyze endpoint,并使用 visualFeatures=color 来获取检测到的文本的颜色信息。

【讨论】:

  • 那么,我无法同时使用 uriBase(来自图像分析和 OCR)吗?我应该为独家图像分析建立另一种方法吗?
  • 是的,OCR 请求转到 /ocr,而分析转到 /analyze。您需要先调用 /ocr?language=unk&detectOrientation=true 然后再调用 /analyze?visualFeatures=color
【解决方案2】:

根据documentation,这个api可能的请求参数是:

语言,检测方向

并且返回的元数据具有以下实体:

方向、语言、区域、线条、单词、boundingBox、文本

可以将 OCR 算法与另一种计算机视觉算法相结合,以检测 OCR 识别的文本区域中的主要颜色。

【讨论】:

    猜你喜欢
    • 2021-10-13
    • 2011-10-12
    • 1970-01-01
    • 2019-10-30
    • 2011-12-21
    • 2015-09-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多