【发布时间】:2017-02-05 19:16:30
【问题描述】:
假设我有以下数据
string data1 = "2014SP";
string data2 = "2014DP";
string data3 = "2014AP-S1"
在比较字符串时,我有没有办法判断它们遵循的是 NumberWordSpecialCharacter 等模式。所以在这种情况下,data1 和 data2 具有相同的模式,而 data3 是不同的。
如果我定义了模式,我可以使用 Regex 来完成,但我没有。我有一个需要比较的数据列表,同时增加未定义的模式,因此可能一个比较集是 213S-P12 和 2014S,第二个是 S-P2015 和 SP123。
【问题讨论】:
-
第一步是明确指定“模式”对您的案例意味着什么。比比较每个字符串的模式应该是微不足道的。
-
如果你希望得到任何有用的答案,你需要提供一堆正面和负面的例子。
-
这个问题是重复的。有一种已知的模式,在这种情况下,已经有数百个关于堆栈溢出的正则表达式问题。或者,如果没有已知的模式,那么“比较字符串相似度”问题将是相关的