获取标记内的值

时间:2014-08-22 03:53:23

标签: c# html regex

变量HTML标记:

<td class="center line"><strong>Banana</strong></td>
<td class="center line red"><strong>(Apple)</strong></td>
<td class="center">Orange</td>
<td class="center red">Cherry</td>

这不起作用。

<td class=\"center[ line]?[ red]?\">[<strong>]?[(]?[A-Za-z]*[)]?[</strong>]?</td>

行,红色,强标记是常量。

帮助!

1 个答案:

答案 0 :(得分:0)

您可以尝试使用以下正则表达式匹配以上所有四行

<td\s*class=\"center(?: line(?: red)?| red)?\">(?:<strong>)?\(?[A-Za-z0-9]*\)?(?:<\/strong>)?<\/td>

DEMO

使用非捕获组或捕获组而不是[ line]?来使<space>line成为可选组。它将是( line)?(?: line)?