【问题标题】:Why is my matcher failing?为什么我的匹配器失败了?
【发布时间】:2009-08-24 15:41:17
【问题描述】:

我正在将一个字符串传递给我的歌曲解析器方法,但它失败了,我不知道为什么。每件事都返回 null 或 0。

我的解析器方法是

 public static Song parseSong(String songString){
  Map<String, String> songMap = new HashMap<String, String>();
  Pattern pattern = Pattern.compile(".*<key>(.+)</key><(.+)>(.+)</.+>.*\n");
  Scanner scanner = new Scanner(songString);
  if(scanner.hasNext(pattern))
  {
     String line = scanner.next(pattern);
     Matcher matcher = pattern.matcher(line);
     MatchResult result = matcher.toMatchResult();
     songMap.put(result.group(1), result.group(3));
  }
  int count = 0, rating = 0;
  try{
     count = Integer.parseInt(songMap.get("Play Count"));
  }
  catch(Exception e)
  {
     //bury this for now will handle when rest is working
  }
  try{
     rating = Integer.parseInt(songMap.get("Rating"));
  }
  catch(Exception e)
  {
     //bury this for now will handle when rest is working
  }
  return new Song(songMap.get("Name"), songMap.get("Artist"), songMap.get("Album"),
        songMap.get("Genre"), count, rating, songMap.get("Location"));

}

      String songString = "<key>Track ID</key><integer>160</integer>\n"+
     "<key>Name</key><string>Ashley</string>\n"+
    " <key>Artist</key><string>Escape the Fate</string>\n"+
    " <key>Composer</key><string>Luca Gusella</string>\n"+
    " <key>Album</key><string>This War Is Ours</string>\n"+
  "   <key>Genre</key><string>Metal</string>\n"+
     "<key>Kind</key><string>AAC audio file</string>\n"+
  "  <key>Size</key><integer>7968219</integer>\n"+
   "  <key>Total Time</key><integer>246503</integer>\n"+
  "   <key>Track Number</key><integer>17</integer>\n"+
   "  <key>Year</key><integer>2005</integer>\n"+
   "  <key>Date Modified</key><date>2009-07-27T01:17:29Z</date>\n"+
    " <key>Date Added</key><date>2009-07-27T01:17:00Z</date>\n"+
    "<key>Play Count</key><integer>150</integer>\n"+
    " <key>Bit Rate</key><integer>256</integer>\n"+
    " <key>Sample Rate</key><integer>44100</integer>\n"+
    " <key>Comments</key><string>\"Amanda\" performed by Aisha Duo from the CD Quiet Songs, courtesy of Obliq Sound.  Written by Luca Gusella, published by Editions ObliqMusic (GEMA).  All Rights Reserved.  Used by Permission. </string>\n"+
    " <key>Skip Count</key><integer>1</integer>\n"+
    " <key>Skip Date</key><date>2009-07-27T01:46:32Z</date>\n"+
    " <key>Artwork Count</key><integer>1</integer>\n"+
    " <key>Persistent ID</key><string>A4D6F35FE9F41B58</string>\n"+
    " <key>Track Type</key><string>File</string>\n"+
    " <key>Location</key><string>file://localhost/C:/Documents%20and%20Settings/MB24244/Desktop/music/07%20Knees.m4a</string>\n"+
     "<key>File Folder Count</key><integer>4</integer>\n"+
     "afgjdhfshsgsughghanoise\n"+
     "<key>Library Folder Count</key><integer>1</integer>\n"+
     "<key>Rating</key><integer>100</integer>";

任何人都可以帮助解释我的方法有什么问题以及为什么这些小组不起作用(这似乎是问题所在)

【问题讨论】:

    标签: java regex


    【解决方案1】:

    为什么不使用 XML 解析器解析 XML

    虽然查看 XML 示例,但它并不是很好,因为它本质上是在建模 map 而不是建模 &lt;song&gt;

    查看您的正则表达式,您为什么要查找以 \n 结尾的行。看来您正在依次匹配每一行,我不相信这些将包含换行符。

    但是,这种不使用扫描仪的方法有效。请注意,我已更改正则表达式以删除行尾。

        Map<String, String> songMap = new HashMap<String, String>();
    
        Pattern pattern = Pattern
                .compile(".*<key>(.+)</key><(.+)>(.+)</.+>.*");
    
        String[] lines = songString.split("\n");
    
        for (String line : lines) {
            Matcher matcher = pattern.matcher(line);
            if (matcher.matches()) {
                songMap.put(matcher.group(1), matcher.group(3));
            }
        }
    

    你也可以让它与扫描仪一起工作。

    【讨论】:

    • 好吧,我正在编写这个应用程序作为训练练习,我希望能学到一些关于解析的知识,我的意思是说到这一点很容易。我正在尝试为一个宠物项目解析一个 iTunes 音乐 library.xml。如果我无法弄清楚,我将切换到其他人已经写过的。
    • 我进行了一些小改动以使您的代码能够正常工作。
    【解决方案2】:

    第二次投票将 XML 变成有效的 XML(单个顶级节点),然后使用 XML 解析器。

    但我会怀疑结尾的 \n,不确定 Java 的正则表达式库有多喜欢它?

    【讨论】:

      【解决方案3】:
      if(scanner.hasNext(pattern))
      {
         String line = scanner.next(pattern);
         Matcher matcher = pattern.matcher(line);
         matcher.toMatchResult();
         songMap.put(result.group(1), result.group(3));
      }
      

      您使用 pattern.matcher(line) 创建的匹配器是一个全新的对象,它对您刚刚使用 Scanner 找到的匹配项一无所知。你想要的是这样的:

      MatchResult result = scanner.match();
      

      那个正则表达式也需要一些工作。如果每条记录都出现在自己的行上,则不需要在两端用".*" 填充它,也不需要匹配换行符。另外,我建议您使用".+?" 而不是".+",无论它出现在哪里。原因,read this

      【讨论】:

        【解决方案4】:

        不要尝试编写解析器,除非您已经知道要解析的文件的规则。

        您编写的正则表达式并没有遵循很多 XML 文件的规则。

        如果这是您第一次编写正则表达式,您可能应该尝试学习一些更容易解析的东西。甚至可能是您自己创建的简单文件格式。

        【讨论】:

          【解决方案5】:

          +1 使用 .+?

          此外,我建议不要在这种情况下使用该模式,因为您似乎有一个非常容易解析的文件。我会: - 逐行拆分文件 - 使用简单的字符串方法来获取内容(您的 XML 中似乎只有 3 个不同的标签)

          如果文件格式会改变并且变得更复杂,我会使用真正的 XMLParser,然后遍历 XML 树来获得你需要的内容:)

          【讨论】:

            猜你喜欢
            • 2015-03-16
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 2019-01-27
            • 2012-10-18
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            相关资源
            最近更新 更多