正则表达式执行只返回第一场比赛

时间:2011-03-12 14:26:07

标签: javascript regex

我正在尝试在golfscript syntax page上实现以下正则表达式搜索。

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;
input = ptrn.exec(input);

输入只是regexp的第一个匹配项。例如: "hello" "world"应该返回["hello", "world"],但它只返回["hello"]

3 个答案:

答案 0 :(得分:59)

RegExp.exec只能一次返回单个匹配结果。

要检索多个匹配项,您需要多次在表达式对象上运行exec。例如,使用简单的while循环:

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;

var match;
while ((match = ptrn.exec(input)) != null) {
    console.log(match);
}

这会将所有匹配记录到控制台。

请注意,为了使其工作,您需要确保正则表达式具有g (global) flag。此标志确保在对表达式执行某些方法后,lastIndex property会更新,因此在之前的结果之后,将进一步调用

答案 1 :(得分:16)

可以在字符串上调用match方法,以便检索整个匹配集合:

var ptrn = /[a-zA-Z_][a-zA-Z0-9_]*|'(?:\\.|[^'])*'?|"(?:\\.|[^"])*"?|-?[0-9]+|#[^\n\r]*|./mg;
var results = "hello world".match(ptrn);

results是(根据正则表达式):

["hello", " ", "world"]

match spec is here

答案 2 :(得分:1)

我在你的问题中没有得到"hello" "world"的含义,是用户输入还是正则表达式但是我被告知RegExp对象有一个状态 - 它的lastIndex位置开始搜索从。它不会立即返回所有结果。它只带来第一场比赛,你需要恢复.exec以从lastIndex位置开始获得剩余的结果:

const re1 = /^\s*(\w+)/mg; // find all first words in every line
const text1 = "capture discard\n me but_not_me" // two lines of text
for (let match; (match = re1.exec(text1)) !== null;) 
      console.log(match, "next search at", re1.lastIndex);

打印

["capture", "capture"] "next search at" 7
[" me", "me"] "next search at" 19

为结果构建迭代器的功能JS6方法是

RegExp.prototype.execAllGen = function*(input) {
    for (let match; (match = this.exec(input)) !== null;) 
      yield match;
} ; RegExp.prototype.execAll = function(input) {
  return [...this.execAllGen(input)]}

请注意,与poke不同,我更好地使用match循环中包含的for变量。

现在,您可以轻松地在一行中捕捉您的比赛

const matches = re1.execAll(text1)

log("captured strings:", matches.map(m=>m[1]))
log(matches.map(m=> [m[1],m.index]))
for (const match of matches) log(match[1], "found at",match.index)

打印

"captured strings:" ["capture", "me"]

[["capture", 0], ["me", 16]]
"capture" "found at" 0
"me" "found at" 16