Question

我想获取<tag></tag>个标签对之间的任何值的内容。

<tag>
This is one block of text
</tag>

<tag>
This is another one
</tag>

我提出的正则表达式是

/<tag>(.*)</tag>/m

尽管如此，它似乎是贪婪的，并且在最后</tag>之前捕获括号内的所有内容。我希望它尽可能地懒惰，以便每当它看到一个结束标记时，它会将其视为匹配组并重新开始。

如何编写正则表达式以便在给定方案中能够获得多个匹配项？

我在以下链接中包含了我所描述的示例

注意：这不是XML，也不是基于任何现有的标准格式。我不需要任何复杂的东西，比如一个带有一个很好的解析器的完整库。

Answer 1

使用正则表达式：

/<tag>(.*?)<\/tag>/im

懒惰（非贪婪）是.*?，而不是.*。

要查找多个匹配项，请使用：

string.scan(/<tag>(.*?)<\/tag>/im)