使用正则表达式获取TD标签的innerHTML

时间:2011-11-15 11:19:01

标签: c# regex html-parsing grouping

我想用正则表达式解析HTML。这是html源代码:

<table border="1">
    <tr>
        <td>row 1, cell 1</td>
        <td>row 1, cell 2</td>
    </tr>
    <tr>
        <td>row 2, cell 1</td>
        <td>row 2, cell 2</td>
    </tr>
</table>

我想在集合中使用TD标签的innerHTML。

PS:我不知道html源中会存在多少个TD标签。 我认为这可以通过REGEX GROUPING完成。请在答案中添加有关分组和代码的说明。

提前致谢....

1 个答案:

答案 0 :(得分:3)

Regex是一种搜索工具,不适合解析HTML(或任何编程语言) 如果你想要解析HTML HTML Agility Pack可能就是这样。