从文本文件中提取XML标记

时间:2015-06-06 10:04:32

标签: java xml text extract

我的目的是从文本文件中提取单个或嵌套的XML标记。我的输入文件结构是纯文本和XML(在我的例子中是HTML)格式。我想要做的是扫描输入丢弃所有内容,直到达到XML标记;然后将其全部解压缩(嵌入所有内容)并继续这种方式,直到处理完整个文件。 在尝试自己做之前,我想看看是否有一些我不知道哪些java库可以帮助我。

谢谢大家。

1 个答案:

答案 0 :(得分:0)

您需要解析XML文件并创建它的相对DOM树。点击此处Java XML-DOM parser tutorial