包含多个根元素的XML文件

时间:2015-06-22 15:41:49

标签: java xml parsing dom

我有一个包含多组根元素的文件。如何逐个提取根元素?

这是我的XML

<Person>
    <empid></empid>
    <name></name>
</Person>
<Person>
    <empid></empid>
    <name></name>
</Person>
<Person>
    <empid></empid>
    <name></name>
</Person>

如何一次提取一组Person

3 个答案:

答案 0 :(得分:7)

使用java.io.SequenceInputStream来欺骗xml解析器:

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilderFactory;
import java.io.ByteArrayInputStream;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.SequenceInputStream;
import java.util.Arrays;
import java.util.Collections;
import java.util.List;

public class MultiRootXML{
    public static void main(String[] args) throws Exception{
        List<InputStream> streams = Arrays.asList(
                new ByteArrayInputStream("<root>".getBytes()),
                new FileInputStream("persons.xml"),
                new ByteArrayInputStream("</root>".getBytes())
        );
        InputStream is = new SequenceInputStream(Collections.enumeration(streams));
        Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(is);
        NodeList children = doc.getDocumentElement().getChildNodes();
        for(int i=0; i<children.getLength(); i++){
            Node child = children.item(i);
            if(child.getNodeType()==Node.ELEMENT_NODE){
                System.out.println("persion: "+child);
            }
        }
    }
}

答案 1 :(得分:3)

您无法使用XML解析器解析文件,因为您的文件不是XML XML不能包含多个根元素。

您必须将其视为文本,将其修复为well-formed,然后 然后 ,您可以使用XML解析器对其进行解析。

答案 2 :(得分:0)

如果您的XML有效,请使用SAX或DOM解析器。有关详细信息,请参阅XML Developer's Kit Programmer's Guide