正则表达式提取代码来自...?

时间:2014-02-20 22:53:35

标签: regex html-parsing regex-lookarounds

如何以正则表达式格式捕获html ....中的所有代码?目前我尝试了几个代码,但它没有全部捕获,我试过这个

<body>([^*]*)<\/body>

但它没有捕获所有代码,因为一些javascript代码正在影响正则表达式命令。

你知道任何链接或样本来解决这个问题吗?

TIA

2 个答案:

答案 0 :(得分:1)

使用此正则表达式

'#<body>(.*?)<\/body>#s'

答案 1 :(得分:1)

这可能会捕获标准<body>标记

之间的任何内容
(?:<body>((?s).*)<\/body>)

示例:http://regex101.com/r/iS4eE3