【发布时间】:2016-07-12 00:35:15
【问题描述】:
我为 Azure 设置了 Blob 索引和全文搜索,如本文所述:Indexing Documents in Azure Blob Storage with Azure Search。
但是,我的一些 pdf 在索引器中失败:
[
{
"key": null,
"errorMessage": "Error processing blob 'https://my-storage.blob.core.windows.net/my-container/mydocument.pdf' with content type '': 422"
}
]
我仔细检查了 blob 上的属性以确保其内容类型已设置:
{
"container": "my-container",
"name": "mydocument.pdf",
"metadata": {},
"lastModified": "Fri, 08 Jul 2016 19:43:15 GMT",
"etag": "0xXXXXXXXXXXXXXXX",
"blobType": "BlockBlob",
"contentLength": "3863790",
"requestId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"contentSettings": {
"contentType": "application/pdf",
"contentMD5": "xxxxxxxxxxxxxxxxxxxxxx=="
},
"lease": {
"status": "unlocked",
"state": "available"
}
}
现在,这个特定的 pdf 有一些安全限制(不能打印),所以我认为这可能会影响它。我从头开始创建了一些 pdf 文件进行测试,无论有无限制,它们都运行良好。
【问题讨论】:
-
您是否可以与我们分享有问题的 PDF 以查看问题是否在我们这边?如果是这样,请在通常的 Microsoft 域的 eugenesh 上联系我。谢谢!
标签: azure-blob-storage azure-cognitive-search