【问题标题】:Compare and sort strings Java比较和排序字符串 Java
【发布时间】:2019-04-21 20:58:21
【问题描述】:

我有字符串数组:15MB、12MB、1TB、1GB。我想通过遵循 MB 小于 GB 和 TB 的规则来按字典顺序比较它们。 所以最后我想得到:12MB、15MB、1GB、1TB。我找到了一种比较字母的方法:

 final static String ORDER="MGT";

public int compare(String o1, String o2) {
       int pos1 = 0;
       int pos2 = 0;
       for (int i = 0; i < Math.min(o1.length(), o2.length()) && pos1 == pos2; i++) {
          pos1 = ORDER.indexOf(o1.charAt(i));
          pos2 = ORDER.indexOf(o2.charAt(i));
       }

       if (pos1 == pos2 && o1.length() != o2.length()) {
           return o1.length() - o2.length();
       }

       return pos1  - pos2  ;
    }

我正在考虑按数字和字母拆分字符串,但是我怎样才能按字母“MB..”对它们进行排序,然后按它们的数字排序。我是使用两个比较器还是其他什么东西?

【问题讨论】:

标签: java compare


【解决方案1】:

如果您首先将数据转换为通用单位(例如 MB),则比较会容易得多。如果转换后的值相同,那么您应该应用字典排序,它可能如下所示:

private int convertToMegaBytes(String s) {

    char c = s.charAt(s.length() - 2);

    if(c == 'G')
        return 1024 * Integer.parseInt(s.substring(0, s.length() - 2));
    if(c == 'T')
        return 1024 * 1024 * Integer.parseInt(s.substring(0, s.length() - 2));

    return Integer.parseInt(s.substring(0, s.length() - 2));

}

final static String ORDER = "MGT";

public int compare(String o1, String o2) {
    int v = convertToMegaBytes(o1)  - convertToMegaBytes(o2);
    // if values are equal then compare lexicographically
    return v == 0 ? ORDER.indexOf(o1.charAt(o1.length() - 2)) - ORDER.indexOf(o2.charAt(o2.length() - 2)) : v;
}

【讨论】:

  • 这很有帮助,但不是我想要做的。我只需要比较给定的值而不是解析它们。因此,例如,如果给我 1GB,1024MB,我仍然需要对它们进行排序:1024MB,1GB
【解决方案2】:

这可能会奏效。 compare 方法获取每个 String 表示为 long 的字节数(10KB 变为 10000),然后进行比较。 getSizeOfString 方法将 String 转换为 long,表示它所代表的字节数。

  public int compare(String o1, String o2) {
    long size1 = getSizeOfString(o1);
    long size2 = getSizeOfString(o2);
    return Long.compare(size1, size2);
  }

  private long getSizeOfString(String sizeString) {
    Pattern validSizePattern = Pattern.compile("(\\d+)([KMG])B");
    Matcher matcher = validSizePattern.matcher(sizeString);
    matcher.find();
    long size = Long.valueOf(matcher.group(1));

    switch (matcher.group(2)) {
      case "K":
        size *= 1024;
        break;
      case "M":
        size *= (1024 * 1024);
        break;
      case "G":
        size *= (1024 * 1024 * 1024);
        break;
    }
    return size;
  }

【讨论】:

  • 有帮助,但不是我想要做的。无需解析。如果我得到 1001MB 和 1GB,我仍然需要按相同的顺序对它们进行排序。
  • 用这两个数字试试,它会说 1001MB 大于 1GB。这不是你要找的吗?
  • 解析只是让它们更容易比较,您是否也在寻找性能要求?
  • 不,我希望 1001MB 被排序为小于 1GB
  • 但我认为您希望 1025MB 大于 1GB。所以顺序是 1GB,1025MB。
【解决方案3】:

现在首先按单位排序,然后按单位内的值排序。这已更改以反映 OP 的最后评论。

import java.util.*;

enum Memory {
   B(1), KB(2), MB(3), GB(4), TB(5);
   public long val;

   private Memory(long val) {
      this.val = val;
   }
}

public class MemorySort {
   public static void main(String[] args) {
      List<String> memory = Arrays.asList("122003B",
            "1TB",
            "2KB",
            "100000MB",
            "1027MB",
            "2024GB");

      Comparator<String> units = Comparator.comparing(
            a -> Memory.valueOf(a.replaceAll("\\d+", "")).val);

      Comparator<String> values = Comparator.comparing(
            a -> Integer.parseInt(a.replaceAll("[A-Z]+", "")));

      Collections.sort(memory, units.thenComparing(values));
      System.out.println(memory);
   }
}


【讨论】:

  • 非常有帮助,但根本不是我需要的。简单地说,如果我有:1200MB、2MB、1GB 我希望它们排序为:2MB、1200MB、1GB
  • 我修改了它以反映需求。字符串替换仍然不是很有效,但它可以工作。
猜你喜欢
  • 2022-12-05
  • 2015-04-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-06-06
  • 1970-01-01
  • 2014-11-11
  • 2012-06-28
相关资源
最近更新 更多