xmlstarlet - 删除换行符

时间:2013-02-19 08:06:00

标签: xml linux xmlstarlet

我有以下文件log.xml

<entry>
  <message>Line 1
  Line 2 and so on</message>
</entry>

在CentOS 5.4上使用xmlstarlet 1.0.1,如果我运行以下命令,同时删除message中的换行符:

xml sel -t -m //entry -v "translate(message,'&#xa;' ,'@')" log.xml

结果是:

Line 1@  Line 2 and so on

在CentOS 6上使用xmlstarlet:

1.3.1
compiled against libxml2 2.7.6, linked with 20706
compiled against libxslt 1.1.26, linked with 10126

我会收到:

Line 1
  Line 2 nd so on

注意“和”转换为空。我想这不是xmlstarlet的问题,而是libxslt中的一些变化。

任何想法如何解决?

更新

添加了将字母“a”转换为空的问题。

3 个答案:

答案 0 :(得分:6)

您可以通过定义包含换行符值的变量来以一般方式解决此问题:

--var linebreak -n --break 

然后使用该变量作为translate函数的第二个参数:

xml sel -t -m //entry
        --var linebreak -n --break
        -v "translate(message, \$linebreak ,'@')"
        log.xml

答案 1 :(得分:3)

当XPath表达式本身位于XML文件(例如XSLT样式表)中时,

&#xa;仅表示换行符。我怀疑这里发生的是当你说

translate(message,'&#xa;' ,'@')

在命令行上,'&#xa;'被视为五个字符的字符串,因此您告诉translate&替换为@,并且什么都不替换所有#xa;

使用ctrl-V

尝试使用文字换行符
xml sel -t -m //entry -v "translate(message,'<ctrl-V><CR>' ,'@')" log.xml

(即按下ctrl-V,然后在输入命令时回车) - 它将在屏幕上显示为^M)。

答案 2 :(得分:1)

我不了解xmlstarlet,但您可以尝试Xidel

xidel log.xml -e '//message/translate(., $line-ending, "@")'

我写了所有这些内容,从解析器到查询引擎,因此它没有依赖关系,并且在所有系统上的行为都相同。