Question

我希望匹配html标记名（例如＆lt; div＆gt;中的div），然后将该字符串拆分到匹配位置。

＆＃13;

var str = '&lt;div&gt; div';
var regex = /(?:&lt;)(\w*)(?=&gt;)?/g;
var arr = str.split(regex);
console.log(arr);
//result:   ["", "div", "&gt; div"]
//expected: ["&lt;", "&gt; div"]

＆＃13;

然而，＆＃34;＆amp; lt;＆＃34;这样做会迷路，而且我想要＆lt;和＆gt;除去。我怎样才能实现它？

这个也不起作用，因为那时＆＃34;假-d＆＃34;在字符串的末尾也会被分割，即使它不在＆lt;和＆gt;：

＆＃13;

var str = '&lt;div&gt; div';
var regex = /(?:&lt;)(\w*)(?=&gt;)?/g;
var match = regex.exec(str);
var arr = match.input.split(match[1]);
console.log(arr);
//result:   ["&lt;", "&gt; ", ""]
//expected: ["&lt;", "&gt; div"]

＆＃13;

Answer 1

如果您只想使用单个正则表达式，最接近的一个是：

var regex = /\b(?:\w+)(?=&gt;)/gi;
'&lt;div&gt; div'.split(regex);//["&lt;", "&gt; div"]

它给出了预期的行为，但这个问题的明显问题是它不检查前面的<。并且javascript本身不支持lookbehind。

更好的方法可能是将<和>分开，然后将它们合并：

var str = '&lt;div&gt; div';
var ltRgx = /(?:\s|\b|^)(?=&lt)/gi;
var gtRgx = /\b(?:\w+)(?=&gt;)/gi;
var result = str.split(ltRgx).map(function(d,i){
    return d.split(gtRgx)
}).reduce(function(ac,d){
    return ac.concat(d);
});
console.log(result);//["&lt;", "&gt; div"]
/*Another example*/
str = '&lt;div&gt; &lt;img&gt; div';
result = str.split(ltRgx).map(function(d,i){
    return d.split(gtRgx)
}).reduce(function(ac,d){
    return ac.concat(d);
});
console.log(result);//["&lt;", "&gt;", "&lt;", "&gt; div"]

正则表达式与非捕获组分开

1 个答案: