正则表达式排除字符串?

时间:2010-09-30 20:26:13

标签: regex

我有一个正则表达式,它通过html标签运行并获取值。 我目前有这个来获取标签内的所有值。

<title\b[^>]*>(.*\s?)</title>

完美无缺。所以如果我有一堆有标题的页面:

<title>Index</title>

<title>Artwork</title>

<title>Theory</title>

返回的值是: 索引下, 的图形下, 的理论

如何使这个正则表达式忽略其中包含值Theory的所有标记?

先谢谢

2 个答案:

答案 0 :(得分:0)

基本了解would probably handle that

<title\b[^>]*>(((?!Juju - Search Results).)*)(.*\s?)</title>

答案 1 :(得分:0)

如果您的文件input_file.txt包含:

<title>Index</title>

<title>Artwork</title>

<title>Theory</title>

然后,以下命令将从input_file.txt中删除包含Theory的行,并将结果放在output_file.txt中。

sed '/Theory/d' input_file.txt > output_file.txt 

如果你在vim工作: 这将删除包含的行     克/符\ v ^(。*理论)@!/ d