我建议分几次这样做:
第一遍将对每个subject 的literal 元素中列出的类别进行标记,并为每个类别创建一个category 节点。在给定的示例中,这将导致:
<category path="">ANTIQUES</category>
<category path="ANTIQUES/">Americana</category>
<category path="">ANTIQUES</category>
<category path="ANTIQUES/">Art</category>
<category path="">COOKING</category>
<category path="COOKING/">Beverages</category>
<category path="COOKING/Beverages/">General</category>
<category path="">COOKING</category>
<category path="COOKING/">Beverages</category>
<category path="COOKING/Beverages/">Bartending</category>
下一步将选择所有顶级类别(即具有空 @path 属性的类别):
<category path="">ANTIQUES</category>
<category path="">ANTIQUES</category>
<category path="">COOKING</category>
<category path="">COOKING</category>
并进一步减少它以仅包含不同的值:
<category path="">ANTIQUES</category>
<category path="">COOKING</category>
现在我们终于有了一个不错的起点,我们可以将模板应用到每个这样的类别来做:
<xsl:template match="category">
<node name="{.}" id="{generate-id()}">
<xsl:apply-templates select="$child-categories"/>
</node>
</xsl:template>
其中$child-categories 表示选择其@path 属性与当前@path 和当前值的串联匹配的类别的表达式。
我使用每个类别的完整路径,以防止在类别名称跨分支不唯一的情况下出现误报匹配。
作为概念验证,我编写了以下样式表,它利用了一些 EXSLT 扩展函数,即:exsl:node-set()、str:tokenize() 和 set:distinct():
XSLT 1.0 + EXSLT
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:exsl="http://exslt.org/common"
xmlns:set="http://exslt.org/sets"
xmlns:str="http://exslt.org/strings"
extension-element-prefixes="exsl set str">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<!-- first-pass -->
<xsl:variable name="categories">
<xsl:for-each select="/Subjects/subject">
<xsl:variable name="steps" select="str:tokenize(literal, ' / ')" />
<xsl:for-each select="$steps" >
<category>
<xsl:attribute name="path">
<xsl:for-each select="preceding-sibling::token" >
<xsl:value-of select="concat(., '/')" />
</xsl:for-each>
</xsl:attribute>
<xsl:value-of select="." />
</category>
</xsl:for-each>
</xsl:for-each>
</xsl:variable>
<xsl:variable name="category-set" select="exsl:node-set($categories)/category" />
<xsl:template match="/">
<!-- output-->
<nodes>
<xsl:apply-templates select="set:distinct($category-set[not(string(@path))])"/>
</nodes>
</xsl:template>
<xsl:template match="category">
<node name="{.}" id="{generate-id()}">
<xsl:apply-templates select="set:distinct($category-set[@path=concat(current()/@path, current(), '/')])"/>
</node>
</xsl:template>
</xsl:stylesheet>
在支持所有这些扩展功能 (libxslt) 的处理器上运行,结果是:
<?xml version="1.0" encoding="UTF-8"?>
<nodes>
<node name="ANTIQUES" id="idp4576">
<node name="Americana" id="idp4704"/>
<node name="Art" id="idp327680"/>
</node>
<node name="COOKING" id="idp25520">
<node name="Beverages" id="idp25648">
<node name="General" id="idp400976"/>
<node name="Bartending" id="idp27984"/>
</node>
</node>
</nodes>