我在转换的正确配方方面遇到了一些麻烦。我正在生成CSV文件。 我可以轻松生成以下csv:
"version","","stuff",
"version1version2","annotation1annotation2","yadda",
但是,我希望子字段的不同实例在字符串中以逗号分隔,如下所示:
"version","","stuff",
"version1,version2","annotation1,annotation2","yadda",
我的输入看起来像
<?xml version="1.0" encoding="UTF-8"?>
<collection>
<record>
<datafield tag="020">
<subfield code="a">version</subfield>
</datafield>
<datafield tag="040">
<subfield code="b">stuff</subfield>
</datafield>
</record>
<record>
<datafield tag="020">
<subfield code="a">version1</subfield>
<subfield code="9">annotation1</subfield>
</datafield>
<datafield tag="020">
<subfield code="a">version2</subfield>
<subfield code="9">annotation2</subfield>
</datafield>
<datafield tag="040">
<subfield code="b">yadda</subfield>
</datafield>
</record>
</collection>
使用以下xsl(和xsltproc)
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output method="text"/>
<xsl:template match="/">
<xsl:apply-templates select="collection/record"/>
</xsl:template>
<xsl:template match="record">
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='020']/subfield[@code='a']"/>
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='020']/subfield[@code='9']"/>
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='040']/subfield[@code='b']"/>
<xsl:text>",</xsl:text>
<xsl:text>
</xsl:text>
</xsl:template>
我猜想跟随-sibling ::或not(position()= last())与call-template的某些组合将会涉及到,但我还没有找到工作解决方案。有什么帮助吗?
我不是在寻找通用的XML-to-csv转换 - 任何适合这个特定数据集的东西都可以。
答案 0 :(得分:1)
<xsl:template match="record">
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='020']/subfield[@code='a']" />
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='020']/subfield[@code='9']" />
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="datafield[@tag='040']/subfield[@code='b']" />
<xsl:text>",</xsl:text>
<xsl:text>
</xsl:text><!-- line break -->
</xsl:template>
<xsl:template match="subfield">
<xsl:value-of select="." />
<xsl:if test="position() != last()">,</xsl:if>
</xsl:template>
对于较大的输入数据集,引入密钥将带来更好的整体性能:
<xsl:key name="kSubfield" match="datafield/subfield" use="
concat(
generate-id(ancestor::record), '|', parent::datafield/@tag, '|', @code
)
" />
<!-- ... -->
<xsl:template match="record">
<xsl:variable name="recordId" select="generate-id()" />
<xsl:text>"</xsl:text>
<xsl:apply-templates select="key('kSubfield', concat($recordId, '|020|a'))" />
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="key('kSubfield', concat($recordId, '|020|9'))" />
<xsl:text>",</xsl:text>
<xsl:text>"</xsl:text>
<xsl:apply-templates select="key('kSubfield', concat($recordId, '|040|b'))" />
<xsl:text>",</xsl:text>
<xsl:text>
</xsl:text><!-- line break -->
</xsl:template>
答案 1 :(得分:1)
更一般地说,这个样式表:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text"/>
<xsl:key name="field" match="subfield" use="concat(../@tag,'
',@code)"/>
<xsl:variable name="fields" select="/*/*/*/subfield[count(.|key('field',concat(../@tag,'
',@code))[1])=1]"/>
<xsl:template match="record">
<xsl:variable name="me" select="."/>
<xsl:for-each select="$fields">
<xsl:text>"</xsl:text>
<xsl:apply-templates select="$me/*/*[concat(../@tag,'
',@code)=concat(current()/../@tag,'
',current()/@code)]"/>
<xsl:text>"</xsl:text>
<xsl:if test="position() != last()">,</xsl:if>
</xsl:for-each>
<xsl:text>
</xsl:text>
</xsl:template>
<xsl:template match="subfield">
<xsl:value-of select="."/>
<xsl:if test="position() != last()">,</xsl:if>
</xsl:template>
</xsl:stylesheet>
结果:
"version","stuff",""
"version1,version2","yadda","annotation1,annotation2"