【问题标题】:How to split string in XML如何在 XML 中拆分字符串
【发布时间】:2014-05-11 19:38:51
【问题描述】:

我有这种 XSL

<xsl:stylesheet  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output indent="yes"/>

    <xsl:template match="dataroot">
        <xml><xsl:apply-templates/></xml>
    </xsl:template>

    <xsl:template match="M_17">
        <package id="{package_id}" cat="{cat}">
            <nazwa><xsl:value-of select="nazwa"/></nazwa>
            <xsl:if test="author"><author><xsl:value-of select="author"/></author></xsl:if>
            <xsl:if test="www"><www><xsl:value-of select="translate(www,'#','')"/></www></xsl:if>
            <xsl:if test="opis"><opis><xsl:value-of select="opis"/></opis></xsl:if>
            <xsl:if test="img"><img><xsl:value-of select="translate(img,'#','')"/></img></xsl:if>

            <xsl:if test="depends"><depends><xsl:value-of select="depends"/></depends></xsl:if>
            <xsl:if test="conflicts"><conflicts><xsl:value-of select="conflicts"/></conflicts></xsl:if>
            <xsl:if test="after"><after><xsl:value-of select="after"/></after></xsl:if>
            <xsl:if test="replaces"><replaces><xsl:value-of select="replaces"/></replaces></xsl:if>
        </package>
    </xsl:template>

</xsl:stylesheet>

但是当有例如。取决于此代码中将显示的 2 个值

<depends>modload com1node</depends>

但我想通过跟随的 XSL 将其转换为:

<depends>modloader</depends>
<depends>com1node</depends>

这应该发生在:依赖、冲突、之后和替换

如何将这些字符串(如果它们出现在源 XML 中)拆分成简单的字符串(如示例所示,每行一个)?

核心 XML 的一部分

<?xml version="1.0" encoding="UTF-8"?>
<dataroot xmlns:od="urn:schemas-microsoft-com:officedata" generated="2014-05-11T15:51:32">
    <Mnc_172>
        <ID>1</ID>
        <package_id>minecraft</package_id>
        <cat>lib</cat>
        <www>#http://minecraft.net/#</www>
        <nazwa>Minecraft</nazwa>
        <author>Mojang</author>
        <opis>Game - build your own world!</opis>
        <img>#/mc.png#</img>
    </Mnc_172>
    <Mnc_172>
        <ID>2</ID>
        <package_id>modloader</package_id>
        <cat>lib</cat>
        <www>#http://minecraftforum.net/topic/75440-x/#</www>
        <nazwa>ModLoader</nazwa>
        <author>Risugami</author>
        <opis>ModLoader - library to load mods</opis>
        <img>#/gen.png#</img>
        <replaces>modL forging</replaces>
    </Mnc_172>
    ...
</dataroot>

【问题讨论】:

  • 我对这种东西一无所知。这段代码不是我的。我在 5 小时前遇到了 XSL,所以当有我还不完全理解的代码组合时,你能告诉我如何在这段代码中插入它吗?
  • 您能否发布一个您的 XML 源代码示例?
  • @Admaster,抱歉——我一直在使用 XQuery 和 XPath,它们使用相同的功能,因此我可以为您指出正确的功能,但我不知道/不知道 XSLT。
  • @CharlesDuffy 您的建议需要 XSLT 2.0; OP 的样式表显示 XSLT 1.0。

标签: xml string xslt split


【解决方案1】:

XML 与您的 XSLT 不匹配:M_17Mnc_172。无论如何,在 XSLT 1.0 中,您需要使用递归模板来标记内容。所以尝试改变:

<depends><xsl:value-of select="depends"/></depends>

到:

<xsl:call-template name="tokenize">
    <xsl:with-param name="text" select="depends"/>
    <xsl:with-param name="elemName" select="'depends'"/>
</xsl:call-template>

并将以下模板添加到您的样式表中:

<xsl:template name="tokenize">
    <xsl:param name="text"/>
    <xsl:param name="elemName"/>
    <xsl:param name="sep" select="' '"/>
    <xsl:choose>
        <xsl:when test="contains($text, $sep)">
            <xsl:element name="{$elemName}">
                <xsl:value-of select="substring-before($text, $sep)"/>
            </xsl:element>
            <!-- recursive call -->
            <xsl:call-template name="tokenize">
                <xsl:with-param name="text" select="substring-after($text, $sep)" />
                <xsl:with-param name="elemName" select="$elemName" />
            </xsl:call-template>
        </xsl:when>
        <xsl:otherwise>
            <xsl:element name="{$elemName}">
                <xsl:value-of select="$text"/>
            </xsl:element>
        </xsl:otherwise>
    </xsl:choose>
</xsl:template>

【讨论】:

  • 我知道这个“错误”。我在数据库中有 4 个完全相同的表。代码工作正常,但不明白为什么有和没有 {} 的 $elemName
  • @Admaster 搜索属性值模板
【解决方案2】:

XSLT 2.0 有一个简单的函数来标记字符串,但是在 XSLT 1.0 中你必须更有创意。我通常会攻击这样的事情的方式是使用递归模板,它对第一个空格之前的文本执行某些操作,然后使用剩余的文本递归调用自身,当它用完时停止。

<xsl:stylesheet  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output indent="yes"/>

    <xsl:template match="dataroot">
        <xml><xsl:apply-templates/></xml>
    </xsl:template>

    <xsl:template match="M_17">
        <package id="{package_id}" cat="{cat}">
            <nazwa><xsl:value-of select="nazwa"/></nazwa>
            <xsl:if test="author"><author><xsl:value-of select="author"/></author></xsl:if>
            <xsl:if test="www"><www><xsl:value-of select="translate(www,'#','')"/></www></xsl:if>
            <xsl:if test="opis"><opis><xsl:value-of select="opis"/></opis></xsl:if>
            <xsl:if test="img"><img><xsl:value-of select="translate(img,'#','')"/></img></xsl:if>

            <xsl:apply-templates select="depends | conflicts | after | replaces" />
        </package>
    </xsl:template>

    <xsl:template match="depends | conflicts | after | replaces">
        <xsl:param name="text" select="concat(normalize-space(), ' ')" />
        <xsl:if test="$text">
            <xsl:copy>
                <xsl:value-of select="substring-before($text, ' ')" />
            </xsl:copy>
            <xsl:apply-templates select=".">
                <xsl:with-param name="text" select="substring-after($text, ' ')" />
            </xsl:apply-templates>
        </xsl:if>
    </xsl:template>
</xsl:stylesheet>

这里的窍门是我们对text 参数所做的事情。最初我将它设置为concat(normalize-space(), ' '),这意味着目标元素的整个文本带有

  • 删除了前导和尾随空格
  • 内部空格标准化为单个空格字符和
  • 添加了一个尾随空格

所以$text 最初是word1-space-word2-space-...-wordN-space

现在,我们在每一步都创建一个与原始元素同名的新元素,并将$text 的第一个单词作为其内容。然后我们递归,将第一个空格之后的所有内容传递到下一步(即word2-space-...-wordN-space)。最终我们到达$text 只是wordN-space 的点,此时我们为wordN 生成一个元素,然后完成,因为substring-after($text, ' ') 是空的。

注意

<xsl:copy>
    <xsl:value-of select="substring-before($text, ' ')" />
</xsl:copy>

将复制输入元素范围内的命名空间声明。这是无害的,但您可能会认为它看起来有点乱。为避免这种情况,您可以使用

<xsl:element name="{local-name()}">
    <xsl:value-of select="substring-before($text, ' ')" />
</xsl:element>

改为。

【讨论】:

  • 在跟踪之前有一个错误,导致此代码添加类似 w3.org/2001/XMLSchema-instance">modL</replaces>xmlns:od="urn:schemas-microsoft-com:officedata"跨度>
  • @Admaster 这不是 错误 本身,只是 &lt;xsl:copy&gt; 从源元素复制范围内命名空间的方式。由于这些命名空间未在输出元素中使用,因此它们不会对语义产生任何影响,但如果您出于美观的原因想要摆脱它们,则只需使用 &lt;xsl:element name="{local-name()}"&gt;...&lt;/xsl:element&gt; 而不是 &lt;xsl:copy&gt;...&lt;/xsl:copy&gt;
猜你喜欢
  • 1970-01-01
  • 2018-04-09
  • 1970-01-01
  • 2016-02-03
  • 2017-02-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-02-29
相关资源
最近更新 更多