【发布时间】:2010-10-11 06:10:43
【问题描述】:
我正在尝试查找与单个单词相关的单词(特别是物理对象)。例如:
网球:网球拍、网球、网球鞋
斯诺克:斯诺克球杆、斯诺克球、粉笔
国际象棋:棋盘、棋子
书柜:书
我尝试过使用WordNet,特别是meronym语义关系;但是,这种方法并不一致,如下结果所示:
网球:发球、截击、脚误、设定点、回球、优势
斯诺克:没什么
国际象棋:国际象棋走法,棋盘(其自身的meronym关系显示“正方形”和“对角线”)
书柜:搁置
最终将需要对术语进行加权,但现在这不是一个真正的问题。
有人对如何做到这一点有任何建议吗?
只是更新:最终混合使用了 Jeff 和 StompChicken 的答案。
从 Wikipedia 检索到的信息质量非常好,特别是(与某些不存在“blog”和“ipod”等术语的语料库相比)如何(毫不奇怪)有如此多的相关信息。
维基百科的结果范围是最好的部分。该软件能够匹配诸如(为简洁起见的列表)之类的术语:
- 高尔夫:[球、铁、发球台、球包、球杆]
- 摄影:[相机、胶卷、照片、艺术、图像]
- 钓鱼:[鱼、网、钩、陷阱、饵、饵、竿]
最大的问题是将某些词归类为物理人工制品;默认 WordNet 不是可靠的资源,因为其中不存在许多术语(例如“ipod”,甚至“蹦床”)。
【问题讨论】:
-
您好,我尝试了这种方法,但结果通常是随机的,并且与搜索查询无关。你能详细说明你做了什么吗?例如,您是否使用了维基百科的反向链接、链接和类别?