【发布时间】:2020-03-27 06:10:29
【问题描述】:
在 Azure blob 存储帐户中,我有一个 550 MB 的文件,它是一个 TSV 文件(制表符是分隔文本)。当我尝试在 Azure Congnitive 搜索中使用门户导入数据时,出现如下错误
Sampling data source
Error detecting index schema from data source: "Could not build a prototype index because datasource 'dcswiki' returned no data."
权限看起来不错,但我不确定是文件本身的问题还是门户不支持导入 550 MB 的文件。
【问题讨论】:
-
嗨 Shobhit,我相信 azure 门户网站上存在一个关于如何序列化分隔符的错误。我假设您将解析模式设置为“分隔文本”,将分隔字符设置为“\t”。门户会将其序列化为“\\t”,这会导致不正确的行为。要解决这个问题,您将不得不依赖其余 API 并将分隔字符指定为“\t”。
-
看来情况并非如此,因为同一文件的小版本(只有 20 条记录)工作正常。对我来说,它似乎与大小有关。
-
您的搜索服务的服务层级是多少? Blob 大小的限制因服务层而异 (docs.microsoft.com/en-us/azure/search/…)。
标签: azure-cognitive-search azure-cognitive-services