【问题标题】:Microsoft Computer Vision API Handwriting微软计算机视觉 API 手写
【发布时间】:2017-04-24 03:04:18
【问题描述】:

我正在尝试使用 Microsoft 的计算机视觉 API 服务来检测笔迹并将其转换为机器可读的文本。但是,当我在提供我的 API 密钥后在他们的网站上测试此服务时,它只返回标头 202 Accepted 而不返回任何结果。如果我将参数笔迹切换为false,它会返回标题200,但结果不可读。

我在这里测试他们的服务: https://westus.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/587f2c6a154055056008f200/console

只需添加您的 API 密钥,将笔迹更改为 true 并包含任何有笔迹的图片。

【问题讨论】:

  • 我也遇到了同样的错误。收到 202 响应。但没有数据。

标签: api azure computer-vision orc


【解决方案1】:

只需按照202 响应中返回的Operation-Location 标头即可。

例如

$ curl https://westus.api.cognitive.microsoft.com/vision/v1.0/textOperations/2bd07b09-f7da-4028-aad1-afd239303722 \
       -H "Ocp-Apim-Subscription-Key: COMPUTER_VISION_API_KEY"
{
    "status": "Succeeded",
    "recognitionResult": {
        "lines": [
            {
                "boundingBox": [
                    0,
                    316,
                    276,
                    321,
                    275,
                    368,
                    0,
                    363
                ],
                "text": "unlikely on my terms.",
    ...
                "text": "writer My real dream is to live and work",
    ...
                "text": "to be a freelance illustrator or a freelance",
    ...

输入图片:

来自https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/faq

问题:手写识别操作需要多长时间?

答案:所需的时间取决于文本的长度。对于较长的文本,最多可能需要几秒钟。因此,在识别手写文本操作完成后,您可能需要等待,然后才能使用获取手写文本操作结果操作检索结果。

【讨论】:

  • 这意味着会有2个API调用?一个用于带有模式参数的视觉 api,另一个用于您提到的 uuid?
  • 不知道它是否算作一次或两次 API 调用。重要的是要在这里提到,计算机视觉 API 在 2019 年发生了显着变化,具有更好的 OCR 精度。 /recognizeText 端点仅在 v1 中处理手写文本,在 v2 中它涵盖了手写和打印文本。 v2 引擎是全新的,尽管调用机制似乎保持不变。更多内容请关注API documentation
【解决方案2】:

此 API 仅在图像包含 100% 手写文本时才有效。如果它混合了打印文本和手写文本,即使您设置 mode=Handwritten(即,您只需要手写文本),它也不会区分它们并同时输出两者。

【讨论】:

猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2023-03-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-10-17
  • 2013-01-23
  • 1970-01-01
相关资源
最近更新 更多