【发布时间】:2020-01-31 06:40:54
【问题描述】:
我确实有一组不同的名称标记以及组合不同名称的数据。 例如。如果该名称有 3 个标记,如“abc def ghi”并给出名称“abcdef”或“abcdefghi”,我想识别该组合名称字符串的不同有效标记。我们可以构建一个名称标记字典并使用一些 NLP 技术或 python 库来实现这一点吗?请就如何开始提供您的意见。
【问题讨论】:
-
“abc def ghi”是印度名字吗?
-
请考虑在@DYZ 建议的实际示例中包含minimal reproducible example。还请提供您目前正在使用的任何当前代码或方法。
标签: python-3.x nlp nltokenizer