如何从XMLType节点中提取元素路径?

时间:2013-04-09 07:44:29

标签: sql xml oracle xpath xmltype

我想在XML文档上有一个select语句,一列应该返回每个节点的路径

例如,给定数据

SELECT * 
FROM TABLE(XMLSequence(
  XMLTYPE('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>').extract('/*//*[text()]'))) t;

结果是

column_value
--------
<user><name>user1</name></user>
<user><name>user2</name></user>
<user><name>user3</name></user>
<user><name>user4</name></user>

我想得到这样的结果:

path                     value
------------------------ --------------
/users/user/name         user1
/users/user/name         user2
/users/group/user/name   user3
/users/user/name         user4

我看不出怎么做到这一点。我认为有两件事需要妥善合作:

  • 我可以使用单一操作或方法从path中提取XMLType ,还是必须使用字符串魔法执行此操作?
  • 什么是正确的XPath表达式,以便我获得整个元素路径(如果可能),例如。 <users><group><user><name>user3</name></user></group></user>的{​​{1}} {/ 1}} {/ 1}}

也许我还没有完全理解<user><name>user3</name></user>。可能我需要一种不同的方法,但我看不到它。

图片的标题说明:

  • 在最终版本中,XML文档将来自表的CLOB,而不是静态文档。
  • XMLType列当然也可以使用点或其他任何内容,并且初始斜杠不是问题,任何表示都可以。
  • 另外我不介意每个内部节点是否也会得到一个结果行(可能pathnull),而不仅仅是value的结果行(这就是我我真的很感兴趣。)
  • 最后,我需要text()尾部元素分开(此处示例中总是path,但这会稍后变化),即{{1}我可以单独处理。

3 个答案:

答案 0 :(得分:4)

您可以借助XMLTable中的Oracle XML DB XQuery function set函数来实现这一目标:

select * from 
  XMLTable(
    '
     declare function local:path-to-node( $nodes as node()* )  as xs:string* {
       $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
     };
     for $i in $rdoc//name 
       return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>
    '
    passing 
    XMLParse(content '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>'
    )
    as "rdoc"
    columns 
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  )

对我来说,XQuery对XML数据操作的看法至少比XSLT更直观。

您可以找到有用的XQuery函数集here

更新1

我想你需要在最后阶段使用完整数据的完全简单的数据集。 这个目标可以通过复杂的方式实现,下面逐步构建,但这种变体非常容易生成资源。我建议审查最终目标(选择一些特定记录,计算元素数量等),然后简化此解决方案或完全改变它。

更新2

此更新中删除的所有步骤除了最后一步因为@ A.B.Cade在评论中提出了更优雅的解决方案。 此解决方案在下面的 Update 3 部分中提供。

第1步 - 使用相应的查询结果构建id的数据集

第2步 - 聚合到单个XML行

第3步 - 最后通过使用XMLTable查询带有构造的XML来获取完整的纯数据集

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all 
  select 30 id, xml_string xml_data from xmlsource 
) 
select  *
from
  XMLTable(
    '
        for $entry_user in $full_doc/full_list/list_entry/name_info
          return <tuple>
                   <id>{data($entry_user/../@id_value)}</id>
                   <path>{$entry_user/name_path/text()}</path>
                   <name>{$entry_user/name_value/text()}</name>
                  </tuple> 
    '
    passing ( 
      select  
        XMLElement("full_list", 
          XMLAgg(     
            XMLElement("list_entry",
              XMLAttributes(id as "id_value"),
              XMLQuery(
                '
                 declare function local:path-to-node( $nodes as node()* )  as xs:string* {
                   $nodes/string-join(ancestor-or-self::*/name(.), ''/'')
                 };(: function to construct path :) 
                 for $i in $rdoc//name return <name_info><name_path>{local:path-to-node($i)}</name_path><name_value>{$i/text()}</name_value></name_info>
                '
                passing by value XMLParse(content xml_data) as "rdoc"
                returning content
              )
            )
          )
        )        
        from xml_table
    )   
    as "full_doc"      
    columns
      id_val   varchar2(4000) path '//tuple/id',
      path_val varchar2(4000) path '//tuple/path',
      name_val varchar2(4000) path '//tuple/name'
  )    

更新3

正如@ A.B.Cade在评论中所提到的,有很简单的方法可以将ID与XQuery结果结合起来。

因为我不喜欢答案中的外部链接,下面的代码代表his SQL fiddle,稍微适应了这个答案中的数据源:

with xmlsource as (
  -- only for purpose to write long string only once
  select '
      <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
      </users>' xml_string
   from dual   
),
xml_table as ( 
  -- model of xmltable
  select 10 id, xml_string xml_data from xmlsource union all 
  select 20 id, xml_string xml_data from xmlsource union all
  select 30 id, xml_string xml_data from xmlsource
)
select xd.id, x.*  from
xml_table xd,
  XMLTable(
    'declare function local:path-to-node( $nodes as node()* )  as xs:string* {$nodes/string-join(ancestor-or-self::*/name(.), ''/'')     };     for $i in $rdoc//name        return <ret><name_path>{local:path-to-node($i)}</name_path>{$i}</ret>    '
    passing
    XMLParse(content xd.xml_data
    )
    as "rdoc"
    columns
      name_path  varchar2(4000) path '//ret/name_path',
      name_value varchar2(4000) path '//ret/name'

  ) x

答案 1 :(得分:2)

这不是完美的,但可以是一个开始:

Here is a sqlfiddle

with xslt as (
  select '<?xml version="1.0" ?><xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:template match="/">
  <records>
    <xsl:apply-templates/>
   </records>
  </xsl:template>
  <xsl:template match="//name">
      <columns>
        <path>
        <xsl:for-each select="ancestor-or-self::*">
            <xsl:call-template name="print-step"/>
        </xsl:for-each>
        </path>
  <value>
    <xsl:value-of select="."/>
  </value>
        <xsl:apply-templates select="*"/>
      </columns>
    </xsl:template>
    <xsl:template name="print-step">
        <xsl:text>/</xsl:text>
        <xsl:value-of select="name()"/>
        <xsl:text>[</xsl:text>
        <xsl:value-of select="1+count(preceding-sibling::*)"/>
        <xsl:text>]</xsl:text>
    </xsl:template>
   </xsl:stylesheet>'
  xsl from dual)
, xmldata as
(select xmltransform(xmltype('<?xml version="1.0"?>
    <users><user><name>user1</name></user>
           <user><name>user2</name></user>
           <group>
              <user><name>user3</name></user>
           </group>
           <user><name>user4</name></user>
    </users>'), xmltype(xsl)) xd from xslt)

select  XT.* 
from xmldata c,
xmltable('$x//columns' passing c.xd
   as "x"
         columns
         path_c VARCHAR2(4000) PATH 'path',
         value_c VARCHAR2(4000) PATH 'value'
        ) as XT 

这就是我试图做的事情:

因为你想要&#34;路径&#34;我不得不使用xslt(credits to this post

然后我使用xmltransform将原始xml转换为xsl 期望的输出(路径,值)

然后我使用xmltable将其作为表格读取

答案 2 :(得分:1)

这改善了A.B.Cade的上述答案:

<xsl:template name="print-step">
    <xsl:variable name="name" select="name()" />
    <xsl:text>/</xsl:text>
    <xsl:value-of select="$name"/>
    <xsl:text>[</xsl:text>
    <xsl:value-of select="1+count(preceding-sibling::*[name()=$name])"/>
    <xsl:text>]</xsl:text>
</xsl:template>

结果:

/ users [1] / user [1] / name [1] user1

/ users [1] / user [2] / name [1] user2

/ users [1] / group [1] / user [1] / name [1] user3

/ users [1] / user [3] / name [1] user4

而不是:

/ users [1] / user [1] / name [1] user1

/ users [1] / user [2] / name [1] user2

/ users [1] / group [3] / user [1] / name [1] user3

/ users [1] / user [4] / name [1] user4