【问题标题】:Remove duplicate values from a string in java从java中的字符串中删除重复值
【发布时间】:2011-10-11 01:35:22
【问题描述】:

谁能告诉我如何从

中删除重复值
String s="Bangalore-Chennai-NewYork-Bangalore-Chennai"; 

输出应该是这样的

String s="Bangalore-Chennai-NewYork-";

使用 Java..

任何帮助将不胜感激。

【问题讨论】:

  • 确定要在结果末尾添加"-"

标签: java string duplicates duplicate-removal


【解决方案1】:

这在一行中完成:

public String deDup(String s) {
    return new LinkedHashSet<String>(Arrays.asList(s.split("-"))).toString().replaceAll("(^\\[|\\]$)", "").replace(", ", "-");
}

public static void main(String[] args) {
    System.out.println(deDup("Bangalore-Chennai-NewYork-Bangalore-Chennai"));
}

输出:

Bangalore-Chennai-NewYork

请注意订单被保留:)

重点是:

  • split("-") 将不同的值作为数组提供给我们
  • Arrays.asList() 把数组变成List
  • LinkedHashSet 保留唯一性插入顺序 - 它完成了为我们提供唯一值的所有工作,这些值通过构造函数传递
  • 列表的toString()[element1, element2, ...]
  • 最后的replace 命令从toString() 中删除“标点符号”

此解决方案要求值不包含字符序列", " - 对此类简洁代码的合理要求。

Java 8 更新!

当然是1行:

public String deDup(String s) {
    return Arrays.stream(s.split("-")).distinct().collect(Collectors.joining("-"));
}

正则表达式更新!

如果您不关心保留顺序(即可以删除 first 出现的重复项):

public String deDup(String s) {
    return s.replaceAll("(\\b\\w+\\b)-(?=.*\\b\\1\\b)", "");
}

【讨论】:

  • 我会使用 substring() 来切割括号,而是在两行上进行。
  • @MartijnCourteaux 你可以把它分成多行,但这个答案也是如何在一行中完成的演示。
【解决方案2】:
public static String removeDuplicates(String txt, String splitterRegex)
{
    List<String> values = new ArrayList<String>();
    String[] splitted = txt.split(splitterRegex);
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < splitted.length; ++i)
    {
        if (!values.contains(splitted[i]))
        {
            values.add(splitted[i]);
            sb.append('-');
            sb.append(splitted[i]);
        }
    }
    return sb.substring(1);

}

用法:

String s = "Bangalore-Chennai-NewYork-Bangalore-Chennai";
s = removeDuplicates(s, "\\-");
System.out.println(s);

打印:

Bangalore-Chennai-NewYork

【讨论】:

    【解决方案3】:

    您可以将字符串添加到 HashSet。

    1. 用“-”分割字符串。
    2. 将单个单词存储在数组中。即 arr[]

    诗篇:

    Set<String> set = new HashSet<String>();
    
        for(int i=0; i < arr.length; i++){
          if(set.contains(arr[i])){
            System.out.println("Duplicate string found at index " + i);
          } else {
            set.add(arr[i]);
          }
    

    【讨论】:

    • 或者一个LinkedHashSet来保持原来的顺序
    • 来吧,你是真的吗?您正在检查字符串是否已经在集合中。但是 Set 的全部意义在于它不包含重复项。那是多余的代码!!!
    【解决方案4】:

    通过-分割创建字符串数组,然后从中创建一个hashSet。

    String s="Bangalore-Chennai-NewYork-Bangalore-Chennai"; 
    String[] strArr = s.split("-");
    Set<String> set = new HashSet<String>(Arrays.asList(strArr));
    

    如果您想将其作为字符串数组返回,请执行以下操作:

    String[] result = new String[set.size()];
    set.toArray(result);
    

    以下是执行此操作的示例代码:

    String s="Bangalore-Chennai-NewYork-Bangalore-Chennai"; 
    String[] strArr = s.split("-");
    Set<String> set = new LinkedHashSet<String>(Arrays.asList(strArr));
    String[] result = new String[set.size()];
    set.toArray(result);
    StringBuilder res = new StringBuilder();
    for (int i = 0; i < result.length; i++) {
        String string = result[i];
        if(i==result.length-1)
            res.append(string);
        else
            res.append(string).append("-");
    }
    System.out.println(res.toString());
    

    输出:-

    Bangalore-Chennai-NewYork
    

    【讨论】:

      【解决方案5】:

      只是想法:

      1. 解析字符串并使用分隔符“-”分割标记
      2. 将令牌加载到Collection
      3. 迭代Collection 并删除重复项
      4. 使用结果Collection 构建新字符串

      最棘手的部分应该是 3,但并非不可能。如果您使用Set,则可以跳过此步骤。

      编辑也许您可以在添加元素之前用存在检查替换 2&3

      【讨论】:

        【解决方案6】:
        static String RemoveDuplicateCharInString(String s){
            for (int i = 0; i < s.length(); i++) {
                if((s.substring(i+1)).indexOf(s.charAt(i))!=-1){
                    s=s.substring(0,i+1)+(s.substring(i+1)).replaceAll(""+s.charAt(i),"");
                }
            }
            return s;
        }
        

        【讨论】:

        • 您应该对您的代码解决方案以及它如何回答 OP 的问题说几句话,以便他们能够理解它,而不仅仅是发布代码。
        【解决方案7】:
        wordsArray = s.split("-");
        List<String> wordsList = new Arrays.asList(wordsArray);
        Set<String>  wordsSet  = new LinkedHashSet<String>(wordsList);
        
        String[] noDuplicates = new String[wordsSet.size()];
        wordsSet.toArray(noDuplicates);
        

        【讨论】:

          【解决方案8】:

          我更喜欢这个比上面所有的都简单。

          public void removeDuplicates() {
            String myString = "Bangalore-Chennai-NewYork-Bangalore-Chennai";
          
            String[] array = myString.split("-");
          
            Set<String> hashSet = new HashSet<String>(Arrays.asList(array));
          
            String newString = StringUtils.join(hashSet, "-");        
          }
          

          【讨论】:

            【解决方案9】:
            public static void main(String[] args) {
                String str="Bangalore-Chennai-Newyork-Bangalore-Chennai";
                String output="";
                String [] arr=str.split("-");
            
                LinkedHashSet<String> lhs=new LinkedHashSet<String>();
                for (int i = 0; i < arr.length; i++) {
                    lhs.add(arr[i]);
                }
                for(String s:lhs){
                    output=output+s+"-";
                }
            
                System.out.println(output);
            }
            

            【讨论】:

            • 最好解释一下解决方案是什么,而不是仅仅粘贴解决方案的代码。
            【解决方案10】:

            游戏有点晚了,但我会简单地使用 HashMap。这很容易理解并且可以快速查找键,可能不是最好的方法,但它仍然是 IMO 的一个很好的答案。当我需要快速和肮脏的格式化时,我一直使用它:

                                String reason = "Word1 , Word2 , Word3";
                                HashMap<String,String> temp_hash = new HashMap<String,String>();
                                StringBuilder reason_fixed = new StringBuilder();
                                //in:
                                for(String word : reason.split(",")){
                                    temp_hash.put(word,word);
                                }
                                //out:
                                for(String words_fixed : temp_hash.keySet()){
                                    reason_fixed.append(words_fixed + " , ");
                                }
                                //print:
                                System.out.println(reason_fixed.toString());
            

            【讨论】:

              【解决方案11】:
              public class RemDuplicateWordFromString {
              public static void main(String[] args) {
                  String s1 = "Hello India Hello India Hello India Hello India";
                  countWords(s1);
              }
              public static void countWords(String s1) {
                  String[] s2 = s1.split(" ");
                  for (int i = 0; i < s2.length; i++) {
                      for (int j = i + 1; j < s2.length; j++) {
                          if (s2[i].equals(s2[j])) {
                              if (i != j) {
                                  s2[i] = "";
                              }
                          }
                      }
                  }
                  for (int i = 0; i < s2.length; i++) {
                      if (s2[i] != "") {
                          System.out.print(s2[i] + " ");
                      }
              
                  }
              
              }
              

              }

              【讨论】:

                【解决方案12】:
                StringBuilder builderWord = new StringBuilder(word);
                for(int index=0; index < builderWord.length(); index++) {
                    for(int reverseIndex=builderWord.length()-1; reverseIndex > index;reverseIndex--) {
                        if (builderWord.charAt(reverseIndex) == builderWord.charAt(index)) {
                            builderWord.deleteCharAt(reverseIndex);
                        }
                    }
                }
                return builderWord.toString();
                

                【讨论】:

                • 请不要只发布没有上下文的代码块 - 还要包括解释
                【解决方案13】:
                import java.util.HashSet;
                
                public class SplitString {
                    public static void main(String[] args) {
                        String st = new String("New Delhi-Chennai-New York-Bangalore-Chennai-New Delhi-Chennai-New York");
                        StringBuffer stb = new StringBuffer();
                
                        HashSet<String> hashset = new HashSet<String>();
                        for (String a : st.split("-"))
                            hashset.add(a);
                
                        Object[] str = (Object[]) hashset.toArray();
                
                        for (int i = 0; i < str.length; i++) {
                            stb.append(str[i]);
                
                            if (i < str.length - 1)
                                stb.append("-");
                
                        }
                
                        System.out.println(stb);
                    }
                }
                

                【讨论】:

                  【解决方案14】:
                  import java.util.*;
                  
                  public class RemoveDuplicateWord {
                  
                      public static void main(String[] args) {
                          String str = "Hai hello Hai how hello are how you";
                          removeDupWord(str);
                      }
                  
                      public static void removeDupWord(String input) {
                          List<String> list = Arrays.asList(input.split(" "));
                          LinkedHashSet<String> lhs = new LinkedHashSet<String>(list);
                          for(String s : lhs) {
                              System.out.print(s+" ");
                          }                   
                      }
                  }
                  

                  【讨论】:

                    猜你喜欢
                    • 2012-10-21
                    • 2014-02-19
                    • 1970-01-01
                    • 2013-08-12
                    • 2015-11-14
                    • 2015-02-19
                    • 2011-06-26
                    • 2019-09-10
                    • 2013-09-30
                    相关资源
                    最近更新 更多