【发布时间】:2017-07-06 06:47:13
【问题描述】:
我有几组词,例如 A组:苹果、梨、香蕉、水果、葡萄、西瓜; B组:猫、动物、狗、猪、猴、鸭; C组:意大利、澳大利亚、国家、中国、希腊。
如何自动识别这 3 组中的上位词(例如,A 组的水果,B 组的动物和 C 组的国家)?非常感谢。
【问题讨论】:
标签: python r nlp semantic-analysis hypernym
我有几组词,例如 A组:苹果、梨、香蕉、水果、葡萄、西瓜; B组:猫、动物、狗、猪、猴、鸭; C组:意大利、澳大利亚、国家、中国、希腊。
如何自动识别这 3 组中的上位词(例如,A 组的水果,B 组的动物和 C 组的国家)?非常感谢。
【问题讨论】:
标签: python r nlp semantic-analysis hypernym
您可以使用 nltk 中内置的 WordNet。有关更多信息,请在此处查看此问题:Determining Hypernym or Hyponym using wordnet nltk
重要的是要理解,上位词的识别只有在训练数据允许的情况下才能好。除了使用标记数据进行训练之外,没有任何神奇的系统可以识别相似对象的分组。
【讨论】: