【发布时间】:2015-01-14 21:14:27
【问题描述】:
我有一个字符串列表(包含门牌号),如下所示:
List<string> myList = new List<string> { "11", "11a", "11 a", "11-1", "11a-1" };
myList.Sort(new MyComparer());
现在我希望将列表排序为{ "11", "11a", "11 a", "11a-1", "11-1" },这意味着首先是所有没有后缀的软管编号,然后是后面有字母的软管编号,然后是所有其他软管编号。因此,我将字符串拆分为前缀(实际数字)和后缀(数字本身后面的所有内容)。
private class MyComparer : IComparer<string>
{
protected virtual int compareHouseNumbers(string hnr1, string hnr2)
{
// ...
// split number and suffix
// ...
// housenumbers (integers) are also equal so let the suffix decide which one is greater
// the suffixes do not contain any spaces now
if (String.IsNullOrEmpty(suffix1)) return -1;
else if (String.IsNullOrEmpty(suffix2)) return 1;
// the following shell ensure that a letter comes "before" any other special char (such as "-" or "/")
if (Char.IsLetter(suffix1.FirstOrDefault()) && !Char.IsLetter(suffix2.FirstOrDefault())) return -1;
else if (!Char.IsLetter(suffix1.FirstOrDefault()) && Char.IsLetter(suffix2.FirstOrDefault())) return 1;
// if we have more complexity (compare 11a-1 with 11a-2) we use standard string-comparison
return String.Compare(suffix1, suffix2);
}
/// <inheritDoc/>
public int Compare(string lbz1, string lbz2)
{
return this.compareHouseNumbers(lbz1, lbz2);
}
}
但我无法根据这些后缀对列表进行排序。我得到的列表是{"11", "11 a", "11a", "11-1", "11a-1"} 虽然互换的条目"11a" 和"11 a" 对于我们的目的来说是可以的,但我不明白为什么最后一个条目是"11a-1" 而不是"11-1"。我已经通过比较进行了调试,但显然这两个成员从未直接比较,因此很难理解这里到底发生了什么。我可以做些什么来获得以"a" 开头的后缀?
如果可能有更优雅的方式来实现这一点,我愿意接受任何 cmet 的改进。
编辑:将输入拆分为实际数字和后缀主要是使用此正则表达式(\\d+)\\s*(\\S*) 完成的。这会产生一个整数部分(实际的 housnumber)和该数字后面的字符串部分。之后,我们只使用suffix1 = suffix1.Trim(' ', '-', '/');(适当地使用suffix2)从后缀中修剪任何非字母数字字符。话虽如此,我们实际上并未将-1与a-1进行比较,而是将1与a-1进行比较。然而,这并不会改变结果本身的任何内容(因为-1 和1 都小于a)。
EDIT2:我删除了列表中的一些成员,因此只剩下两个有问题的成员:List<string> myList = new List<string> { "11-1", "11a-1" }; 更改后排序结果符合预期:{ "11a-1", "11-1" }
EDIT3:我刚刚更改了列表中成员的顺序(将11放在列表末尾)。现在结果也符合预期。所以它似乎取决于列表中元素的初始顺序。好奇怪……
【问题讨论】:
-
“11a-1”的顺序比“11-1”更靠后,因为“-”的字符值比“a”低。看一下 ASCII 表。您可能需要以某种方式定义您的自定义字符顺序。
-
当你比较后缀
"-1"和"a-1"时,'"-1"' 排在第一位,因为它更小;并且它更小,因为减号的 ASCII 代码小于'a'的代码。 -
这就是为什么我引入了这个中间步骤来检查第一个字符是否为字母......因此
11-1会输给11a-1,不是吗? -
@HimBromBeere 很难说,因为我们看不出你到底是如何分割字符串的。
-
@S_F 看到我的编辑,我希望它能澄清事情。