XMLStarlet不会选择任何内容

时间:2012-01-26 21:19:24

标签: command-line-interface pom.xml xmlstarlet

我有一个典型的pom.xml,想要打印groupId,artifactId和version,用冒号分隔。我认为XMLStarlet是正确的工具。我尝试了几种方法,但我总是得到一个空行。

xml sel -t -m project -v groupId -o : -v artifactId -o : -v version pom.xml

预期产出:

org.something.apps:app-acct:5.4

实际输出:空行

即使我尝试只打印groupId,我什么也得不到:

xml sel -t -v project/groupId pom.xml

我确信该工具可以看到这些元素,因为我可以毫无问题地列出它们:

xml el pom.xml

打印以下内容(正确):

project
project/modelVersion
project/parent
project/parent/groupId
project/parent/artifactId
project/parent/version
project/groupId
project/artifactId
project/version
project/packaging

怎么了?

这是pom.xml的简化版本:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0
                        http://maven.apache.org/maven-v4_0_0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <parent>
        <groupId>org.something</groupId>
        <artifactId>base</artifactId>
        <version>1.16</version>
    </parent>

    <groupId>org.something.apps</groupId>
    <artifactId>app-acct</artifactId>
    <version>5.4</version>
    <packaging>war</packaging>

</project>

2 个答案:

答案 0 :(得分:38)

不幸的是,XMLStarlet对默认命名空间非常挑剔。如果文档声明了它(xmlns=),你也必须为XMLStarlet声明它,并在元素前面加上你选择的名称(参见here):

  

xml sel -N my = http://maven.apache.org/POM/4.0.0 -t -m my:project -v my:groupId -o:-v my:artifactId -o:-v my:version pom.xml

运行上面的命令会得到预期的输出:

org.something.apps:app-acct:5.4

但是,如果文档没有声明默认名称空间(或名称空间的URL略有不同),则上述命令将不起作用,这是一个真正的PITA。更通用的解决方案是在选择元素之前删除默认命名空间声明。从XMLStarlet 1.3.1开始,将XML转换为PYX格式并返回将删除命名空间声明:

  

xml pyx pom.xml | xml p2x | xml sel -t -m project -v groupId -o:-v artifactId -o:-v version 2&gt; nul

更新(2014-02-12):自XMLStarlet 1.4.2起,PYX&lt; - &gt; XML转换是固定的(不删除命名空间声明),因此上述命令将不起作用(感谢Peter Gluck的提示)。请改用以下命令:

  

xml pyx pom.xml | grep -v ^ A | xml p2x | xml sel -t -m project -v groupId -o:-v artifactId -o:-v version

注意:上面的grep从文档中删除所有属性,而不仅仅是命名空间声明。对于这种特定情况(从pom.xml中选择元素值,其中不期望具有非默认命名空间的元素),它是好的,但对于通用XML,您将仅删除默认的命名空间声明,而不是其他:

  

xml pyx pom.xml | grep -v“^ Axmlns”| xml p2x | xml sel -t -m project -v groupId -o:-v artifactId -o:-v version


注意(已废弃):错误重定向(2>nul)是隐藏有关(现在)未知命名空间xsi的投诉所必需的:

  

- :1.28:未定义项目上schemaLocation的命名空间前缀xsi

摆脱投诉的另一种方法是删除schemaLocation属性(实际上,此命令从PYX文档中删除所有属性,而不仅仅是xsi:schemaLocation):

  

xml pyx pom.xml | grep -v ^ A | xml p2x | xml sel -t -m project -v groupId -o:-v artifactId -o:-v version

答案 1 :(得分:8)

XML-&gt; PYX - &gt; XML技巧对我不起作用(使用XMLStarlet 1.4.2版)。但是,XMLStarlet documentation包含这个方便的sed命令,用于从XML文档中删除命名空间声明:

sed -e 's/ xmlns.*=".*"//g'

那很有用。对于原始问题,语法为:

cat pom.xml | sed -e 's/ xmlns.*=".*"//g' | xml sel -t -m project -v groupId -o : -v artifactId -o : -v version