使用正则表达式提取文本

时间:2012-02-07 09:04:11

标签: c# regex

我有一个包含

的字符串变量
"A regular expression is an object that describes a pattern of characters.

<strong>Regular expressions are used to perform pattern-matching.</strong> and "search-and-replace" functions on text.

我必须提取

 "<strong>Regular expressions are used to perform pattern-matching</strong>"

为此我正在使用

^<strong>([A-Za-z0-9-\s]+)</strong>$

正则表达式。 但它没有用。 知道为什么吗?

2 个答案:

答案 0 :(得分:3)

试试这个

<strong>([^<]*)</strong>

或者

<strong>([A-Za-z0-9-\s.]+)</strong>

由于以下原因,您的表达无效:

  1. ^和$表示字符串的开头和结尾。因此,只有在<strong>之前没有任何内容且</strong>之后没有任何内容时,模式才会匹配。在您的情况下,您有</strong>
  2. 之后的文字
  3. 您错过了角色类表达的句号。它将是([A-Za-z0-9- \ s。] +)

答案 1 :(得分:0)

如果您尝试匹配<strong>Regular expressions are used to perform pattern-matching.</strong>

,则不会匹配结束标记之前的点