Question

我已使用此Java NIO从Google方向下载xml文件。

在IE中打开的screenshot xml文件。这是它应该看起来正确的另一个screenshot。

由于某些原因，似乎无法识别标记，因此当我使用xPath来评估和查询XML文件时，我得到如下输出：

Continue onto <b>Derwent St</b>

 338
 0.3 km

At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>

 102
 0.1 km

有没有更简单的方法来解决这个问题，还是我必须使用SAX解析器？

Answer 1

<b>显示为数据而不是标记。它将表示为<b>或出现在CDATA块中。

即。 XML包含HTML片段作为数据。它不包括命名空间的XHTML。

输出是你应该期待的。

下一步取决于你想要达到的目标。无论是什么，您需要将数据作为字符串（而不是textNode）获取，并将该字符串视为HTML而不是文本。

如果要查询HTML，则需要先通过HTML解析器运行它。