1.开题
最近在学习基于知识图谱的搜索相关知识,发现两个有趣的问题:
1.1. 搜索罗纳尔多,不同的搜索引擎给出的知识卡片不尽相同:
1.1.1 google:
会有一个知识卡片专门展示google的知识图谱搜索结果。
为什么说这个知识卡片是google的知识图谱的结果,而不简单是从罗纳尔多的维基百科页面进行知识抽取的结果呢?
注意看知识卡片包含两个部分:维基百科的罗纳尔多的简介和知识图谱中的各个属性:生于、身高、职业生涯等。
我们首先看第一部分:维基百科的罗纳尔多的简介,从下图罗纳尔多的维基百科划线部分可以看到,知识卡片这部分直接将划线部分截取,展示出来了(包括图篇片)。
其次,看一下第二部分:我们首先看一下生于这个属性,首先在罗纳尔多的维基百科中查找出生日期,可以看到如下的出生日期和出生地址,但是没有现年43岁这个知识点,所以可以推测这部分是google的知识图谱给出的结果。
另外,点击生于,还可以跳转到如下图所示的页面,另一方面也说明这部分是知识图谱结果。
那么第二个问题是:什么搜索关键词会给出知识图谱搜索结果呢?
1.名词:人名、地名、机构名…
2.动词:走,运动就没有知识卡片,但是跑有知识卡片,不过这个是当作名词使用的话才会有。
1.1.2 百度:
没有知识卡片,百科结果展示应该是做了一定的处理,使得展示的知识更加类似于谷歌的知识卡片。
但是这部分完全是从百度百科中提取出来的知识,没有推理与知识图谱的参与,原本以为生涯:足球(已退役)这个属性是另外推理出来的,看了一下如下图所示的百度百科里面的资料可以看到是两个属性拼凑的:
1.1.3 搜狗
没有知识卡片,展示作用与百度搜索的结果一致,只是将搜狗百科结果抽取展示到搜索页。
1.1.4 bing
国内版没有知识图谱,国际版类似于谷歌使用了知识图谱。(顺便说一下,另外国外版知识卡片结果显示的是C罗,而google的知识卡片显示的是老罗纳尔多,是不是可以说bing国际版有点喜新厌旧233)