Jsoup解析错误(标记p中的标记表)

时间:2012-04-03 13:26:41

标签: html jsoup

当我用Jsoup解析这段代码时:

<p>
<table>[...]</table>
</p>

Jsoup回归:

<p></p>
<table>[...]</table>

这是一个错误吗?我该如何解决这个问题?

2 个答案:

答案 0 :(得分:0)

我认为这与你的例子不是“有效”的HTML有关。我相信一个表不能存在于p标签中。 Jsoup可能正在执行正确的HTML。

答案 1 :(得分:0)

jsoup非常聪明。如果你使用它的默认解析方法,它会将你的输入文本改为有效的html conent。

Document doc = Jsoup.parse(html);

实际上,jsoup可以处理类似xml的文本(当然,包括html和xml)。您可以尝试使用follwing方法来解析类似xml的文本。它不会改变你的输入,并按原样解析输入。

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

相关问题