【发布时间】:2012-03-23 22:38:48
【问题描述】:
我最近开始使用本体,我正在使用 Protege 构建一个本体,我还想用它来自动分类字符串。下面说明了一个非常基本的类层次结构:
String
|_ AlphabeticString
|_ CountryName
|_ CityName
|_ AlphaNumericString
|_ PrefixedNumericString
|_ NumericString
最终像Spain 这样的字符串应该被归类为CountryName 或UE4564 将是PrefixedNumericString。
但是我不确定如何对这些知识进行建模。我是否必须首先定义一个字符是字母、数字等,然后从现有字符构造一个单词,还是有办法使用正则表达式?到目前为止,我只能根据 String and hasString value "UE4565" 之类的确切短语对字符串进行分类。
或者最好为本体中的每个类都设置一个正则表达式,然后使用这些正则表达式在 Java 中对字符串进行分类?
【问题讨论】:
标签: regex string classification ontology protege