正则表达式发现所有单词都以两个斜杠开头

时间:2012-08-18 17:19:15

标签: php regex pattern-matching

我想找到<body>标记后以两个斜杠开头的所有字符 例如: -

http://www
// this is first comment
<body>
<div>
// this is comment
<p>//this is another comment.

所以我想要同时匹配:

// this is comment.
//this is another comment.

但不是:

//www
// this is first comment

这只是一个例子,它可能还包含数字和括号。 语言php只想要正则表达式

2 个答案:

答案 0 :(得分:4)

您可以使用此PHP代码:

$html = <<< EOF
http://www
// this is first comment
<body>
<div>
// this is comment
<p>//this is another comment.
EOF;

解决方案1:负前瞻

if (preg_match_all('~//(?!.*?<body>)[^\n]*~is', $html, $arr))
   print_r($arr);

解决方案2:没有前瞻

$html = preg_replace('#^.*?<body>#is', '', $html);
if (preg_match_all('~//[^\n]*~', $html, $arr))
   print_r($arr);

输出:

Array
(
    [0] => Array
        (
            [0] => // this is comment
            [1] => //this is another comment.
        )

)

答案 1 :(得分:1)

您可以使用此模式执行此操作:

(?<!http:)\/\/(\s?[\w\.])+

example