【问题标题】:Indexer failed to process blob due to missing content type, but the blob has a content type由于缺少内容类型,索引器无法处理 blob,但 blob 具有内容类型
【发布时间】:2016-07-12 00:35:15
【问题描述】:

我为 Azure 设置了 Blob 索引和全文搜索,如本文所述:Indexing Documents in Azure Blob Storage with Azure Search

但是,我的一些 pdf 在索引器中失败:

[
    {
        "key": null,
        "errorMessage": "Error processing blob 'https://my-storage.blob.core.windows.net/my-container/mydocument.pdf' with content type '': 422"
    }
]

我仔细检查了 blob 上的属性以确保其内容类型已设置:

{
    "container": "my-container",
    "name": "mydocument.pdf",
    "metadata": {},
    "lastModified": "Fri, 08 Jul 2016 19:43:15 GMT",
    "etag": "0xXXXXXXXXXXXXXXX",
    "blobType": "BlockBlob",
    "contentLength": "3863790",
    "requestId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
    "contentSettings": {
        "contentType": "application/pdf",
        "contentMD5": "xxxxxxxxxxxxxxxxxxxxxx=="
    },
    "lease": {
        "status": "unlocked",
        "state": "available"
    }
}

现在,这个特定的 pdf 有一些安全限制(不能打印),所以我认为这可能会影响它。我从头开始创建了一些 pdf 文件进行测试,无论有无限制,它们都运行良好。

【问题讨论】:

  • 您是否可以与我们分享有问题的 PDF 以查看问题是否在我们这边?如果是这样,请在通常的 Microsoft 域的 eugenesh 上联系我。谢谢!

标签: azure-blob-storage azure-cognitive-search


【解决方案1】:

由于安全限制、文件损坏等原因,Azure 搜索偶尔会无法处理一些文档。有几个旋钮可以控制这些文件的处理方式。详情请见this answer

【讨论】:

    猜你喜欢
    • 2021-02-27
    • 2021-09-17
    • 2021-10-05
    • 2013-03-27
    • 1970-01-01
    • 2018-03-18
    • 2019-03-15
    • 1970-01-01
    • 2017-09-21
    相关资源
    最近更新 更多