【问题标题】:Azure Cognitive SearchAzure 认知搜索
【发布时间】:2020-03-27 06:10:29
【问题描述】:

在 Azure blob 存储帐户中,我有一个 550 MB 的文件,它是一个 TSV 文件(制表符是分隔文本)。当我尝试在 Azure Congnitive 搜索中使用门户导入数据时,出现如下错误

Sampling data source Error detecting index schema from data source: "Could not build a prototype index because datasource 'dcswiki' returned no data." 权限看起来不错,但我不确定是文件本身的问题还是门户不支持导入 550 MB 的文件。

【问题讨论】:

  • 嗨 Shobhit,我相信 azure 门户网站上存在一个关于如何序列化分隔符的错误。我假设您将解析模式设置为“分隔文本”,将分隔字符设置为“\t”。门户会将其序列化为“\\t”,这会导致不正确的行为。要解决这个问题,您将不得不依赖其余 API 并将分隔字符指定为“\t”。
  • 看来情况并非如此,因为同一文件的小版本(只有 20 条记录)工作正常。对我来说,它似乎与大小有关。
  • 您的搜索服务的服务层级是多少? Blob 大小的限制因服务层而异 (docs.microsoft.com/en-us/azure/search/…)。

标签: azure-cognitive-search azure-cognitive-services


【解决方案1】:

门户中有一个错误。门户认知搜索管道适用于 Azure SQL 数据库数据源,只是目前不适用于 Cosmos DB 或 Blob 存储

更多详情可以参考这个类似的issue

【讨论】:

  • 我检查了那个问题,但从评论看来它已经解决了。因为我能够从门户网站索引小 TSV 文件
猜你喜欢
  • 2022-01-12
  • 2021-09-21
  • 2021-04-28
  • 1970-01-01
  • 2020-09-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多