一个更简单的正则表达式来解析引用的字符串

时间:2012-06-27 13:34:20

标签: javascript regex

问题很简单。我有一个包含多个元素的字符串,这些元素嵌入在单引号中:

var str = "'alice'   'anna marie' 'benjamin' 'christin'     'david' 'muhammad ali'"

我想解析它,以便我将所有这些名称都放在一个数组中:

result = [
 'alice',
 'anna marie',
 'benjamin',
 'christin',
 'david',
 'muhammad ali'
]

目前我正在使用此代码来完成这项工作:

var result = str.match(/\s*'(.*?)'\s*'(.*?)'\s*'(.*?)'\s*'(.*?)'/);

但是这个正则表达式太长而且不灵活,所以如果我在str字符串中有更多元素,我必须编辑正则表达式。

进行此分析的最快,最有效的方法是什么?在我们的Web应用程序中,性能和可靠性非常重要。

我看了下面的问题,但他们不是我的答案:

4 个答案:

答案 0 :(得分:8)

定义模式一次并使用全局g标记。

var matches = str.match(/'[^']*'/g);

如果你想要没有单引号的令牌,通常的方法是在REGEX中使用子匹配 - 但是当使用g标志时,JavaScript不支持捕获子组。最简单(虽然不一定最有效)的方法是在迭代后删除它们:

if (matches)
    for (var i=0, len=matches.length; i<len; i++)
        matches[i] = matches[i].replace(/'/g, '');

[编辑] - 正如其他答案所说,您可以使用split()代替,但前提是您可以依赖于字符串中每个标记之间始终存在空格(或一些常用分隔符)。

答案 1 :(得分:1)

当正则表达式对象设置了global标志时,您可以对字符串执行多次以查找所有匹配项。它的工作原理是在上一次运行中匹配的最后一个字符后开始下一个搜索:

var buf = "'abc' 'def' 'ghi'";
var exp = /'(.*?)'/g;
for(var match=exp.exec(buf); match!=null; match=exp.exec(buf)) {
  alert(match[0]);
}

就个人而言,我发现它是解析字符串的一种非常好的方法。

编辑:表达式/'(.*?)'/g匹配单引号(')之间的任何内容,修饰符*?非贪婪,它极大地简化了模式。

答案 2 :(得分:1)

一种不同的方法

我来到这里需要一种方法,可以解析引号和非引号的字符串,保留引号和非引号的顺序,然后输出它包含React或React Native的特定标签,所以我最终没有使用这里的答案是因为我不确定如何让它们满足我的需要然后做了这个。

function parseQuotes(str) {
  var openQuote = false;
  var parsed = [];
  var quote = '';
  var text = '';
  var openQuote = false;

  for (var i = 0; i < str.length; i++) {
    var item = str[i];
    if (item === '"' && !openQuote) {
      openQuote = true;
      parsed.push({ type: 'text', value: text });
      text = '';
    }
    else if (item === '"' && openQuote) {
      openQuote = false;
      parsed.push({ type: 'quote', value: quote });
      quote = '';
    }
    else if (openQuote) quote += item;
    else text += item;  
  }

  if (openQuote) parsed.push({ type: 'text', value: '"' + quote });
  else parsed.push({ type: 'text', value: text });

  return parsed;
}

当得到这个时:

'Testing this "shhhh" if it "works!" " hahahah!'

产生:

[
  {
    "type": "text",
    "value": "Testing this "
  },
  {
    "type": "quote",
    "value": "shhhh"
  },
  {
    "type": "text",
    "value": " if it "
  },
  {
    "type": "quote",
    "value": "works!"
  },
  {
    "type": "text",
    "value": " "
  },
  {
    "type": "text",
    "value": "\" hahahah!"
  }
]

允许您根据内容轻松地将标签包裹起来。

https://jsfiddle.net/o6seau4e/4/

答案 3 :(得分:0)

单向;

var str = "'alice' 'benjamin' 'christin' 'david'";
var result = {};

str.replace(/'([^']*)'/g, function(m, p1) {
    result[p1] = "";
});

for (var k in result) {
    alert(k);
}