【发布时间】:2021-11-27 13:43:24
【问题描述】:
我们希望将测量数据存储在 Azure Datalake 中。数据集由原始数据和元数据组成。这两个数据集位于不同的文件中。对于我们想要使用认知搜索的搜索。
如何将元数据与 Coginitve Search 中的原始数据关联起来,以便在搜索结果(基于元数据)中也关联关联的原始数据。
谢谢。
许多问候 迈克尔
【问题讨论】:
我们希望将测量数据存储在 Azure Datalake 中。数据集由原始数据和元数据组成。这两个数据集位于不同的文件中。对于我们想要使用认知搜索的搜索。
如何将元数据与 Coginitve Search 中的原始数据关联起来,以便在搜索结果(基于元数据)中也关联关联的原始数据。
谢谢。
许多问候 迈克尔
【问题讨论】:
对两个数据集使用相同的索引。如果您的原始数据包含 dataID、colA、colB 和 colC,并且您的元数据包含 dataID、colD 和 colE,则您可以创建一个包含这两者的索引:dataID、colA、colB、colC、colD 和 colE。
要将数据放入索引中,一种选择是索引器。通过转到认知搜索资源并单击“导入数据”按钮,您可以轻松地在 Azure 门户中进行设置。将“ADLS Gen 2”(Azure Datalake 存储)指定为数据源,并将您创建的索引指定为要拉入的索引。
您可以创建两个不同的索引器,一个用于原始数据,一个用于元数据,它们可以正确映射各个字段,但两者都可以写入同一个索引。 (索引器始终包含一个从中提取数据的数据源和一个向其推送数据的索引,因此使用两个索引器,您可以有两个单独的数据源用于原始数据和元数据,并且两者都有相同的索引。)最后,查询该索引将为您提供包含元数据和原始数据的联合搜索结果。
一些可能有用的链接:
【讨论】: