正则表达式:是否有AND运算符?

时间:2009-01-22 16:49:14

标签: regex lookahead

显然,您可以使用|(管道?)来表示OR,但有没有办法表示AND

具体来说,我想匹配包含某个短语的所有文本的段落,但没有特定的顺序。

14 个答案:

答案 0 :(得分:343)

使用非消费性正则表达式。

典型(即Perl / Java)表示法是:

(?= EXPR )

这意味着“匹配 expr ,但之后在原始匹配点继续匹配。”

您可以根据需要执行其中任意多项操作,这将是“和”。例如:

(?=match this expression)(?=match this too)(?=oh, and this)

如果您需要在其中保存一些数据,您甚至可以在非消费表达式中添加捕获组。

答案 1 :(得分:297)

你需要像其他一些响应者所说的那样使用前瞻,但是前瞻必须考虑其目标词和当前匹配位置之间的其他字符。例如:

(?=.*word1)(?=.*word2)(?=.*word3)

第一个先行中的.*可以让它在到达“word1”之前匹配它需要的许多字符。然后重置匹配位置,第二个前瞻搜索“word2”。再次重置,最后一部分匹配“word3”;因为它是你要检查的最后一个词,所以它没有必要超前,但它并没有受到伤害。

为了匹配整个段落,您需要在两端锚定正则表达式并添加最终.*以消耗剩余的字符。使用Perl风格的表示法,即:

/^(?=.*word1)(?=.*word2)(?=.*word3).*$/m

'm'修饰符用于多线模式;它允许^$匹配段落边界(正则表达式中的“行边界”)。在这种情况下,你必须使用's'修饰符,它允许点元字符匹配换行符以及所有其他字符。

最后,您要确保匹配整个单词而不仅仅是较长单词的片段,因此您需要添加单词边界:

/^(?=.*\bword1\b)(?=.*\bword2\b)(?=.*\bword3\b).*$/m

答案 2 :(得分:29)

看看这个例子:

我们有2个正则表达式A和B,我们希望匹配它们,所以在伪代码中它看起来像这样:

pattern = "/A AND B/"

可以在不使用AND运算符的情况下编写它:

pattern = "/NOT (NOT A OR NOT B)/"
PCRE中的

"/^(^A|^B)/"

regexp_match(pattern,data)

答案 3 :(得分:27)

你可以用正则表达式做到这一点,但可能你会想要其他的。例如,使用几个正则表达式并将它们组合在一个if子句中。

您可以使用标准正则表达式枚举所有可能的排列,如下所示(按任意顺序匹配a,b和c):

(abc)|(bca)|(acb)|(bac)|(cab)|(cba)

然而,如果您有多个条款,这会产生一个非常长且可能效率低下的正则表达式。

如果你使用的是一些扩展的正则表达式版本,比如Perl或Java,他们有更好的方法来做到这一点。其他答案建议使用积极的先行操作。

答案 4 :(得分:20)

AND运算符在RegExp语法中是隐式 相反,OR运算符用管道指定 以下RegExp:

var re = /ab/;

表示字母a AND 字母b 它也适用于群组:

var re = /(co)(de)/;

表示群组co AND 群组de 用OR替换(隐式)AND将需要以下行:

var re = /a|b/;
var re = /(co)|(de)/;

答案 5 :(得分:10)

在您的情况下,您是否可以在多个匹配结果上执行AND?在伪代码中

regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...

答案 6 :(得分:9)

为什么不使用awk?
与awk正则表达式和,或者事情是如此简单

awk '/WORD1/ && /WORD2/ && /WORD3/' myfile

答案 7 :(得分:8)

如果使用Perl正则表达式,则可以使用正向前瞻:

例如

(?=[1-9][0-9]{2})[0-9]*[05]\b

将是大于100且可被5整除的数字

答案 8 :(得分:6)

您可以将输出传输到另一个正则表达式。使用grep,你可以这样做:

grep A | grep B

答案 9 :(得分:5)

除了接受的答案

我将为您提供一些实用示例,让您的某些人更清楚。例如,假设我们有三行文字:

[12/Oct/2015:00:37:29 +0200] // only this + will get selected
[12/Oct/2015:00:37:x9 +0200]
[12/Oct/2015:00:37:29 +020x]

在此处查看演示 DEMO

我们在这里要做的是选择+号,但只有在两个带空格的数字之后,以及它是否在四个数字之前。这些是唯一的限制因素。我们将使用此正则表达式来实现它:

'~(?<=\d{2} )\+(?=\d{4})~g'

请注意,如果您将表达式分开,它将为您提供不同的结果。

或许你想在标签之间选择一些文字......但不是标签!然后你可以使用:

'~(?<=<p>).*?(?=<\/p>)~g'

本文:

<p>Hello !</p> <p>I wont select tags! Only text with in</p> 

在此处查看演示 DEMO

答案 10 :(得分:2)

顺序总是隐含在正则表达式的结构中。要完成你想要的,你必须多次匹配不同表达式的输入字符串。

您想要做的是使用单个正则表达式而不是

答案 11 :(得分:1)

这是“and”运算符的一种可能的“形式”:

以下面的正则表达式为例:

如果我们想匹配没有“e”字符的单词,我们可以这样做:

/\b[^\We]+\b/g
  • \W 表示不是“单词”字符。
  • ^\W 表示“单词”字符。
  • [^\We] 表示“单词”字符,但不是“e”。

查看实际效果:word without e

正则表达式的“and”运算符

我认为这种模式可以用作正则表达式的“and”运算符。

一般来说,如果:

  • A = not a
  • B = not b

然后:

[^AB] = not(A or B) 
      = not(A) and not(B) 
      = a and b

差异集

所以,如果我们想在正则表达式中实现 difference set 的概念,我们可以这样做:

a - b = a and not(b)
      = a and B
      = [^Ab]

答案 12 :(得分:0)

在正则表达式之外使用AND。在PHP中,lookahead运算符似乎并不适合我,而是使用了这个

if( preg_match("/^.{3,}$/",$pass1) && !preg_match("/\s{1}/",$pass1))
    return true;
else
    return false;

如果密码长度为3个字符或更多且密码中没有空格,则上述正则表达式将匹配。

答案 13 :(得分:-1)

((yes).*(no))|((no).*(yes))

匹配句子同时具有yesno的句子,无论它们出现的顺序如何:

Do i like cookies? **Yes**, i do. But milk - **no**, definitely no.

**No**, you may not have my phone. **Yes**, you may go f yourself.

两者都会匹配,忽略大小写。