从cdata中删除href标记

时间:2012-04-03 14:47:22

标签: xml xpath

我有以下xml文件:

<ab>
 <![CDATA[ 

    <table>
        <tbody>
            <tr>
                <th>abcdef</th>             
            </tr>
            <tr>
             <p>
              <a href="/1/2" target="_blank">Home</a>
             </p>
            </tr>
        </tbody>
    </table>
 ]]>
</ab>

我想删除一个链接为1/2的href标签。与上面的例子一样,我想使用xpath删除一个href链接,只留下text:Home。

1 个答案:

答案 0 :(得分:1)

CDATA只是一串任意文本,直到您处理它为止。

所以:

  1. 解压缩<ab>
  2. 的textNode子项
  3. 通过HTML解析器运行
  4. 在解析器的输出上运行XPath