从URL <b> / </b>下载的XML文件无法识别

时间:2013-01-08 11:06:18

标签: java xml xpath google-direction

我已使用此Java NIO从Google方向下载xml文件。

在IE中打开的screenshot xml文件。这是它应该看起来正确的另一个screenshot

由于某些原因,似乎无法识别 标记,因此当我使用xPath来评估和查询XML文件时,我得到如下输出:

Continue onto <b>Derwent St</b>

 338
 0.3 km

At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>

 102
 0.1 km

有没有更简单的方法来解决这个问题,还是我必须使用SAX解析器?

1 个答案:

答案 0 :(得分:1)

<b>显示为数据而不是标记。它将表示为&lt;b&gt;或出现在CDATA块中。

即。 XML包含HTML片段作为数据。它不包括命名空间的XHTML。

输出是你应该期待的。

下一步取决于你想要达到的目标。无论是什么,您需要将数据作为字符串(而不是textNode)获取,并将该字符串视为HTML而不是文本。

如果要查询HTML,则需要先通过HTML解析器运行它。