【发布时间】:2011-10-13 10:01:39
【问题描述】:
我想知道WordNet中单词之间的层次关系是如何检索的。
是手动完成的还是通过计算机技术完成的。
如果基于计算机技术,它们是什么?
【问题讨论】:
我想知道WordNet中单词之间的层次关系是如何检索的。
是手动完成的还是通过计算机技术完成的。
如果基于计算机技术,它们是什么?
【问题讨论】:
来自常见问题解答:
q.1.2 您从哪里获得 WordNet 的定义? (简短回答)我们的 词典编纂者编写它们。
您从哪里获得 WordNet 的定义? (长答案)从 WordNet 的前言:电子词汇数据库,第 xviii-xix:
人们有时会问:“你的话是从哪里来的?”我们始于 1985 年 用 Kučera 和 Francis 的现代标准语料库中的话 编辑过的英语(众所周知的布朗语料库),主要是 因为它们为不同的词性提供了频率。 当亨利库切拉警告我们时,我们很好地进入了那个名单, 尽管他和弗朗西斯拥有布朗语料库,但句法标记 数据已出售给 Houghton Mifflin。因此我们放弃了我们的计划 使用他们的频率计数(1988 年,Richard Beckwith 开发了一个 我们使用的多义索引)。我们还整合了所有 查尔斯·奥斯古德用来发展语义的形容词对 微分。由于同义词对我们至关重要,我们 在各种词库中查找单词:例如,Laurence Urdang 的 小“同义词和反义词基本书”(1978 年),Urdang 的修订版 罗代尔的“同义词查找器”(1978 年)和罗伯特查普曼的第四部 “Roget 的国际词库”(1977 年)版——在此类作品中, 一个词很快就会引向其他词。 1986 年末,我们收到了一份清单 由 Fred Chang 在海军人事研究中心汇编的词汇 开发中心,我们将其与我们自己的列表进行了比较;我们曾经 沮丧地发现只有 15% 的重叠。
因此,Chang 的列表成为输入。并且在 1993 年我们获得了 拉尔夫·格里什曼 (Ralph Grishman) 和他在纽约的同事的 39,143 个单词 大学包含在他们的通用词典 COMLEX 中;这次我们是 对 WordNet 仅包含 74% 的 COMLEX 单词感到沮丧。但是那个 列表也成为输入。简而言之,各种来源都有 贡献了;我们在建立词汇量方面没有得到很好的训练。 事实是英语词典非常庞大,我们很幸运 当我们慢慢爬上去时,我们的赞助商对我们很有耐心 山。
【讨论】: