【发布时间】:2019-08-30 23:40:45
【问题描述】:
我目前正在与使用语音识别和检测语音名称的人合作。这很好用,但是我遇到了名称问题。我在威尔士,周围很多人都有威尔士名字(包括我)。我有所有威尔士名字的 CSV。一些名字也被选为地方(如 Osian) 有没有办法扩展 NSLinguisticTagger 以包含威尔士名称?或者有没有办法检测威尔士名字?
这是我当前的代码:
let text = "Hey I'm Osian"
// 2
let tagger = NLTagger(tagSchemes: [.nameType])
tagger.string = text
let options: NLTagger.Options = [.omitPunctuation, .omitWhitespace, .joinNames]
let tags: [NLTag] = [.personalName, .organizationName, .placeName]
// 3
tagger.enumerateTags(in: text.startIndex..<text.endIndex, unit: .word, scheme: .nameType, options: options) { tag, tokenRange in
if let tag = tag, tags.contains(tag) {
print("\(text[tokenRange]): \(tag.rawValue)")
}
return true
}
【问题讨论】:
-
这不是新自然语言框架的重点吗?你可以用机器学习来教解析器。例如,请参阅本教程。 heartbeat.fritz.ai/…
-
@matt 但我不是也必须给它一个非名称数据集吗?那么字典的其余部分是这样的吗?