正则表达式从Bash脚本中删除注释

时间:2011-07-13 14:02:09

标签: regex bash

这看起来很复杂。我需要一个正则表达式来从Bash shell脚本中删除注释。

请记住$#${#foo}string="this # string"string='that # string'${foo#bar}${foo##baar}

string="really complex args=$# ${applejack##"jack"} $(echo "$#, again")"; `echo this is a ${#nasty[*]} example`

是所有有效的shell表达式,应该被剥离。

修改 请注意:

# This is a comment in bash
  # But so is this
echo "foo bar" # This is also a comment

修改 请注意,可能被误解为评论的行可能隐藏在HEREDOC内部,但由于它是多行的,我可以在不处理/解释它的情况下生活:

cat<<EOF>>out.txt
This is just a heredoc
# This line looks like a comment, but it isn't
EOF

3 个答案:

答案 0 :(得分:7)

你不能用正则表达式做到这一点。

echo ${baz/${foo/${foo/#bar/foo}/bar}/qux}

您需要匹配嵌套大括号。正则表达式不能这样做,除非你愿意考虑PCRE的“正则表达式”,在这种情况下,在Perl中编写解析器会更简单。

答案 1 :(得分:4)

只是为了好玩......

我不相信你可以在不使用/实现解析器的情况下做到这一点,但是如果不这样做,你可以获得多大的成就。

我最接近的是使用 sed 的简单正则表达式。它保留了哈希爆炸,这是必须但不能应付HEREDOC。你可以走得更远,但那可能不再有趣了。

示例bash脚本(称为doit)

#!/bin/bash
#This
#  is a 
echo $1 #comment

运行那个......

cat doit | sed -e 's/#[^!].*$//'
#!/bin/bash


echo $1

但显然有一些你不想要的空行而且它不处理HERE文档。

同样,不是一个严肃的建议,但请玩它。

答案 2 :(得分:2)

编辑:我承认了!由于评论中给出的原因,sed不起作用 - sed不处理前瞻/外观。谢谢你指出来了!

我认为bash中的评论是以#开头的一行。如果是这样,这是你的正则表达式:

^#

这是将剥离它们的sed命令:

sed -i '' -e 's/^\s*#(?!!).*$//' myfile.sh

编辑以考虑downvoter的评论:即

  • 在#using \s*
  • 之前允许空格
  • 排除#使用否定前瞻!后面(?!!)的行