【问题标题】:How to integrate "WordNet Domains" into WordNet DB?如何将“WordNet 域”集成到 WordNet 数据库中?
【发布时间】:2012-10-17 10:38:12
【问题描述】:

我正在使用WordNet 2.1 tool 并通过pro-grammatically 通过JAWS(Java API for WordNet Searching) 访问它。

今天我遇到了一个名为 WordNet Domains 的新东西,它为WordNet 中的每个单词分配了DOMAIN 标签。

链接:- http://wndomains.fbk.eu/labels.html

我已经从上面的链接下载了相同的内容。它是一个 zip 文件。

我的问题是:- 如何在 Java 中使用“WordNet 域”和“WordNet”?

【问题讨论】:

  • 我的答案是:- 阅读自述文件
  • 是的,Qnan,我已经读过了。具体来说,这就是我想要的——“wn-domains-3.2-20070223”包含普林斯顿 WordNet 2.0 同义词集与其相应域之间的映射。 但他们没有提到如何将此文件集成到 wordnet 数据库中,还是我必须以编程方式将其与 wordnet dict 一起调用?你能解决我的疑问吗?
  • 这是一种以某种方式整合它们的方法吗?
  • This question's answer 展示了如何在 Python 中执行此操作。你可以在 Java 中尝试类似的东西。
  • 请发布您当前的代码(已编辑到重要信息)以及您的堆栈跟踪。

标签: java nlp wordnet jaws-wordnet word-sense-disambiguation


【解决方案1】:

由于您使用的是 java,因此您可以将标签加载为 HashMap<String, List<String>>

根据个人经验,我想说的是,您可以使用域的值来代替域标签:WordNet 3.0 上的扩展 WordNet 域项目 (http://adimen.si.ehu.es/web/XWND)。

【讨论】:

    【解决方案2】:

    答案是:WNDomains 项目附带一个 doc 文件,该文件提供 wordID 和 word 域。这个 wordID 是 wordnet 2.1 wordID。所以在java中你可以编写一个程序,通过映射(逐行读取doc文件)来映射相应的ID

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-03-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多