【问题标题】:Use XSLT to exactly match XML text containing " or '使用 XSLT 精确匹配包含 " 或 ' 的 XML 文本
【发布时间】:2020-11-09 20:05:39
【问题描述】:

我正在开发一个 Java 应用程序,其中包括 Saxon 包,以使用 XSLT 匹配 XML 中的文本字符串并返回 ISBN 号。

以下是库 XML 的示例:

<Library>
        <Book>
            <Title>Easy Book</Title>
            <ISBN>978-3-16-148410-0</ISBN>
        </Book>
        <Book>
            <Title>Tiger&apos;s Naptime Book</Title>
            <ISBN>978-3-16-148410-1</ISBN>
        </Book>
        <Book>
            <Title>How to &quot;Capture&quot; a Clever Tiger&apos;s Toe</Title>
            <ISBN>978-3-16-148410-2</ISBN>
        </Book>
</Library>

使用 XSLT 很容易找到第一本“简易书”:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:ns1="urn:developJava.com/NotWorking">
<xsl:output omit-xml-declaration="yes"/>
<xsl:template match="Book/Title[text()='Easy Book']">
<xsl:value-of select='../ISBN' separator= ","/>
</xsl:template>
<xsl:template match="text()"/>
</xsl:stylesheet>

但是,例如,我找不到标题:

<Title>Tiger&apos;s Naptime Book</Title> 

使用这个 XSLT:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:ns1="urn:developJava.com/NotWorking">
<xsl:output omit-xml-declaration="yes"/>
<xsl:template match="Book/Title[text()='Tiger&apos;s Naptime Book']">
<xsl:value-of select='../ISBN' separator= ","/>
</xsl:template>
<xsl:template match="text()"/>
</xsl:stylesheet>

或查找:

<Title>How to &quot;Capture&quot; a Clever Tiger&apos;s Toe</Title>

使用这个 XSLT:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:ns1="urn:developJava.com/NotWorking">
<xsl:output omit-xml-declaration="yes"/>
<xsl:template match="Book/Title[text()='How to &quot;Capture&quot; a Clever Tiger&apos;s Toe']">
<xsl:value-of select='../ISBN' separator= ","/>
</xsl:template>
<xsl:template match="text()"/>
</xsl:stylesheet>

它正在处理标题中&amp;quot;&amp;apos; 的嵌入文本分隔符,这是问题所在。非常感谢您对如何处理此 XML/XSLT 的想法。

谢谢!

【问题讨论】:

    标签: java xml xslt saxon


    【解决方案1】:

    您可能会发现这很有用:

    Using an xpath to find text with an apostrophe ( " ' ")

    一般规则是:

    • 要转义用作 XPath 字符串分隔符的引号,请将它们加倍:'Tiger''s Naptime Book'

    • 要转义用作 XML 属性分隔符的引号,请将它们写为 &amp;quot;&amp;apos;match="Book/Title[text()='How to &amp;quot;Capture&amp;quot; a Clever Tiger''s Toe']"

    要了解它的工作原理,请记住 XML 解析发生在 XPath 解析之前,因此像 &amp;quot; 这样的 XML 实体的扩展需要提供一个有效的 XPath 表达式的属性值。

    另外,还有另一种可能更具可读性的解决方案:

    <xsl:variable name="q">How to "Capture" a Clever Tiger's Toe</xsl:variable>
    <xsl:template match="*[contains(., $q)]"/>
    

    【讨论】:

      【解决方案2】:

      谢谢你迈克尔!

      这是我的问题的正确答案,来自写这本书的绅士!我将添加一个简短的代码示例:

        public static void main(String[] args) {
            
            String inXML = "<Library>\r\n" + 
                  "       <Book>\r\n" +
                  "           <Title>Easy Book</Title>\r\n" + 
                  "           <ISBN>978-3-16-148410-1</ISBN>\r\n" + 
                  "      </Book>\r\n" + 
                  "       <Book>\r\n" + 
                  "           <Title>Tiger&apos;s Naptime Book</Title>\r\n" + 
                  "           <ISBN>978-3-16-148410-1</ISBN>\r\n" + 
                  "      </Book>\r\n" + 
                  "       <Book>\r\n" + 
                  "           <Title>How to &quot;Capture&quot; a Clever Tiger&apos;s Toe</Title>\r\n" + 
                  "           <ISBN>978-3-16-148410-2</ISBN>\r\n" + 
                  "      </Book>\r\n" +
                  "   </Library>";
            
             // BUILD THE CUSTOM XSLT FOR THE modelPath
                  String stylesheet1 = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n" + 
                          "<xsl:stylesheet version=\"2.0\"\r\n" +
                          "xmlns:xsl=\"http://www.w3.org/1999/XSL/Transform\"\r\n" +
                          " xmlns:ns1=\"urn:developJava.com/Working\">\r\n" +
                          "<xsl:output omit-xml-declaration=\"yes\"/>\n" + "<xsl:template match=\"Book/Title[text()='Tiger&apos;&apos;s Naptime Book']\">\n" +
                          "<xsl:value-of select='../ISBN' separator= \",\"/>\r\n" +
                          "</xsl:template>\r\n" +
                          "<xsl:template match=\"text()\"/>\r\n" + 
                          "</xsl:stylesheet>\r\n";
                  
                  // BUILD THE CUSTOM XSLT FOR THE modelPath
                  String stylesheet2 = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n" + 
                          "<xsl:stylesheet version=\"2.0\"\r\n" +
                          "xmlns:xsl=\"http://www.w3.org/1999/XSL/Transform\"\r\n" +
                          " xmlns:ns1=\"urn:developJava.com/Working\">\r\n" +
                          "<xsl:output omit-xml-declaration=\"yes\"/>\n" + "<xsl:template match=\"Book/Title[text()='How to &quot;Capture&quot; a Clever Tiger&apos;&apos;s Toe']\">\r\n" +
                          "<xsl:value-of select='../ISBN' separator= \",\"/>\r\n" +
                          "</xsl:template>\r\n" +
                          "<xsl:template match=\"text()\"/>\r\n" + 
                          "</xsl:stylesheet>\r\n";
                  
          
                  String result1 = "";
                  try {
                      result1 = XsltMethods.transformUsingXslt(stylesheet1, inXML);
                  } catch (IOException e) {
                      // TODO Auto-generated catch block
                      e.printStackTrace();
                  }
      
                  
                  System.out.println("result 1:---" + result1 + "---");
                  
                  String result2 = "";
                  try {
                      result2 = XsltMethods.transformUsingXslt(stylesheet2, inXML);
                  } catch (IOException e) {
                      // TODO Auto-generated catch block
                      e.printStackTrace();
                  }
                  
                  System.out.println("result 2:---" + result2 + "---");
            }
            
            private static String transformUsingXslt(String stylesheet, String inXml)
                      throws IOException {
      
                  // CONVERT Strings TO AN INPUT FORM ACCEPTABLE TO XSLT TRANSFORMER
                  Source xsltSource = new StreamSource(new StringReader(stylesheet));
                  Source xmlSource = new StreamSource(new StringReader(inXml));
      
                  StringWriter writer = null;
                  String result = null;
      
                  try {
      
                      writer = new StringWriter();
      
                      TransformerFactory tFactory = TransformerFactory.newInstance("net.sf.saxon.TransformerFactoryImpl", null);
                      // TransformerFactory tFactory = TransformerFactory.newInstance();
                      Transformer transformer = tFactory.newTransformer(xsltSource);
                      transformer.transform(xmlSource, new javax.xml.transform.stream.StreamResult(writer));
      
                      result = writer.toString();
      
                  } catch (TransformerConfigurationException e) {
                      e.printStackTrace();
                  } catch (TransformerException e) {
                      e.printStackTrace();
                  }
      
                  return result;
              }
      

      执行代码返回如下结果:

      结果1:---978-3-16-148410-1---

      结果2:---978-3-16-148410-2---

      【讨论】:

      • 您不需要单引号的实体引用,即您可以简单地使用&amp;apos;&amp;apos; 而不是''
      • 您已经将 XPath 嵌入到 Java 中嵌入的 XSLT 中,每个级别都有自己的转义约定,这无疑使事情变得复杂。很遗憾,Java 没有像 C# 这样的逐字字符串文字。
      • 我完全同意!这实际上是我继承的一个应用程序,我正试图以最小的增强使其运行。应用程序的“真实”XML 实际上非常丑陋,几乎可以包含任何内容。我想重写搜索类来解析源 XML 数据并完全排除 XSLT。再次感谢您的知识和见解!
      猜你喜欢
      • 1970-01-01
      • 2014-05-25
      • 1970-01-01
      • 1970-01-01
      • 2021-05-22
      • 2011-07-26
      • 1970-01-01
      • 2013-05-16
      • 2017-10-02
      相关资源
      最近更新 更多