【问题标题】:Regex split java正则表达式拆分java
【发布时间】:2021-12-04 13:40:54
【问题描述】:

各位大侠,能不能帮我找个正则表达式用split来分隔字符串(txt文件)的属性,字符串如下:

{'title': 'The signal', 'description': 'Una crisis nerviosa. Un ataque de pánico en pleno sermón, 'img': '9b9f6e903588a16bf90eb86ff7b079ba.jpg', 'Format': 'physic book', 'Author': 'Young, wm. paul - jersak, bradley', 'Editorial': 'Diana', 'Year': '2021', 'Idiom': 'Español', 'Isbn': '9789584293817', 'Isbn13': '9789584293817'}{'titulo': 'Quemar el Miedo', 'descripcion': 'Este es el manifiesto escrito por el Colectivo LASTESIS. , 'img': 'f56123687ddc0167a0f4186612293435.jpg', 'Formato': 'Libro físico', 'Autor': '', 'Año': '2021', 'Idioma': 'Español', 'Isbn': '9789584293626', 'Isbn13': '9789584293626'}

我需要获取每个元素的值才能重建对象

public static boolean cargarlibros(){    
  File f = new File(FILENAME);
  FileReader reader;
  try {
    reader = new FileReader(f);
    BufferedReader buffr = new BufferedReader(reader);
    String registro; 
    while((registro = buffr.readLine()) != null){
      String[] datos = registro.split("\\{\\}");
      System.out.println(Arrays.toString(datos));                              
    }
    buffr.close();
    reader.close();
  } catch (IOException ex) {
    return false;
  }        
  return true;
}

【问题讨论】:

  • 看起来像 sermón 后面缺少引号的 JSON 文本,用 JSON 库解析会更容易
  • 为什么不在逗号上分割字符串?
  • 这个数据应该是什么?因为虽然它看起来像 JSON,但实际上并非如此:单引号不符合规范。 JSON 中只使用双引号。
  • 我会为这种格式寻找一个专门的解析器,而不是尝试使用正则表达式。有什么方法可以使用 JSON 来代替这个变体?这将为您提供更多选择。
  • 这是一个具有该结构的纯文本文件,它是包含所有数据的单行,每个数据都用 {book1} {book2} {book3} ...

标签: java regex split bufferedreader


【解决方案1】:

您可以尝试添加和更改引号以将数据转换为 JSON,但这可能并非易事,尤其是在字符串包含撇号的情况下,而且我认为按原样解析它更容易。您的split 尝试无效,因为"\\{\\}" 模式只会在{} 处拆分,而{} 不存在。你可以替换

      String[] datos = registro.split("\\{\\}");

      String[] datos = registro.replaceFirst("^\\{", "").split("}\\{|}$");
      for (var dato: datos)
      {
        String[] elems = dato.replaceFirst("^'", "").split("'?[:,] '|'$");
        Map<String, String> book = new LinkedHashMap<String, String>();
        for (int i = 0; i < elems.length; ) book.put(elems[i++], elems[i++]);
        …
      }

由于你没有说你希望获取每个元素的值的数据结构是什么,所以我选择了Map

【讨论】:

  • 非常感谢,这是我需要的正则表达式,我将重建对象,然后我有一个方法可以将它们插入到 Arraylist 中,谢谢
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2010-11-03
  • 1970-01-01
  • 1970-01-01
  • 2015-05-02
  • 1970-01-01
  • 2011-10-16
  • 1970-01-01
相关资源
最近更新 更多