【发布时间】:2016-08-13 02:55:16
【问题描述】:
Google Cloud Natural Language API 可用于分析文本并返回一个句法分析树,其中每个单词都标有词性标签。
有没有办法判断一个名词是否是复数?
如果 Google Cloud NL 能够解决引理,那么信息可能存在但未通过 API 返回?
【问题讨论】:
标签: google-cloud-platform google-cloud-nl
Google Cloud Natural Language API 可用于分析文本并返回一个句法分析树,其中每个单词都标有词性标签。
有没有办法判断一个名词是否是复数?
如果 Google Cloud NL 能够解决引理,那么信息可能存在但未通过 API 返回?
【问题讨论】:
标签: google-cloud-platform google-cloud-nl
更新
随着 NL API 的 GA 发布,annotateText 端点现在为每个标记返回一个 number 键,指示单词是单数、复数还是双数。对于“这里有一些猫”这句话,API 返回“猫”的以下标记数据(注意 number 是 PLURAL):
{
"text": {
"content": "cats",
"beginOffset": -1
},
"partOfSpeech": {
"tag": "NOUN",
"aspect": "ASPECT_UNKNOWN",
"case": "CASE_UNKNOWN",
"form": "FORM_UNKNOWN",
"gender": "GENDER_UNKNOWN",
"mood": "MOOD_UNKNOWN",
"number": "PLURAL",
"person": "PERSON_UNKNOWN",
"proper": "PROPER_UNKNOWN",
"reciprocity": "RECIPROCITY_UNKNOWN",
"tense": "TENSE_UNKNOWN",
"voice": "VOICE_UNKNOWN"
},
"dependencyEdge": {
"headTokenIndex": 1,
"label": "DOBJ"
},
"lemma": "cat"
}
查看完整文档here。
【讨论】:
感谢您试用 NL API。
现在除了注意基本词与引理不同并猜测它是否是复数(在英语中,它可能以 -s 结尾)之外,没有一种干净的方法来检测复数。
不过,我们计划发布一种更好的方法来检测诸如复数之类的形态信息,敬请期待。
【讨论】: