如何解析可能有或没有命名空间的XML内容?

时间:2017-10-09 01:03:50

标签: java xsd xml-parsing jaxb

我需要解析一些我拥有XSD的XML内容。总的来说,这是直截了当的。但是,在一个特定情况下,XML有时包含XML命名空间,有时则不包含。此外,要求XML命名空间并不实际,因为提供的XML来自多个来源。所以我一直试图找到解决方法。

如上所述,我有XML的XSD,我使用XJC(来自JAXB)从XSD生成相应的XML实体类。

包含命名空间的示例XML:

<?xml version="1.0" encoding="UTF-8"?>
<root xmlns="http://www.w3.org/namespace/">
    <foo id="123>
        <bar>value</bar>
    </foo>
</root>

不包括命名空间的XML示例:

<?xml version="1.0" encoding="UTF-8"?>
<root>
    <foo id="123>
        <bar>value</bar>
    </foo>
</root>

如您所见,XML内容在结构上是相同的 - 唯一的区别是xmlxs实体上的root属性。

我的代码如下:

URI uri = <URI of XML file>
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(true);
Node node = builder.parse(uri.toString()); // Parsing succeeds, ie. the XML is valid.
JAXBContext context = JAXBContext.newInstance("com.example.xml");
Unmarshaller parser = context.createUnmarshaller();
// Next line succeeds or fails, depending on presence of namespace
Object object = parser.unmarshal(node);

XML总是被成功解析为Node。如果XML中存在xmlns属性,则整个过程正常完成,并且我收到com.example.xml.Root类的实例(使用XJC生成)。从那里我可以访问FooBar个对象。

如果缺少xmlns属性,则解组将失败,并出现以下异常:

javax.xml.bind.UnmarshalException: unexpected element (uri:"", local:"root").
    Expected elements are <{http://www.w3.org/namespace/}root>,
    <{http://www.w3.org/namespace/}foo>,
    <{http://www.w3.org/namespace/}bar>

我尝试了unmarmshalling by declared type但收效甚微。具体来说,解组完成没有错误。但是,生成的Root类不包含任何FooBar个对象。

此代码涉及将最后一行更改为:

Object object = parser.unmarshal(node, Root.class);

我尝试将“名称空间感知”标志设置为false进行解组,但是失败并出现错误。

我想过在解组之前,如果没有名称空间,就在node添加一个名称空间。但是,API似乎不允许这样做。

我的另一个想法是拥有两组生成的类,每种情况一个(即命名空间,没有命名空间)。然而,这似乎是一个很大的问题。

所以我被卡住了?有什么建议?或者我正在做什么不可能?

1 个答案:

答案 0 :(得分:2)

您可以使用XML过滤器。以下是我的例子,删除它所在的ns。

package testjaxb;

import java.io.StringReader;
import javax.xml.bind.JAXBContext;
import javax.xml.bind.Unmarshaller;
import javax.xml.transform.sax.SAXSource;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.XMLFilterImpl;
import org.xml.sax.helpers.XMLReaderFactory;

public class MarshalWithFilter {

    public static void main(String[] args) throws Exception {
        String xmlString = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n"
                + "<root xmlns=\"http://www.w3.org/namespace/\">\n"
                + "    <foo id=\"123\">\n"
                + "        <bar>value</bar>\n"
                + "    </foo>\n"
                + "</root>";

        String xmlStringWithoutNs = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n"
                + "<root>\n"
                + "    <foo id=\"123\">\n"
                + "        <bar>value</bar>\n"
                + "    </foo>\n"
                + "</root>";

        Root r = (Root) unmarshal(xmlString);
        System.out.println("root.." + r.getFoo().getId());
        System.out.println("root.." + r.getFoo().getBar());
        r = (Root) unmarshal(xmlStringWithoutNs);
        System.out.println("root.." + r.getFoo().getId());
        System.out.println("root.." + r.getFoo().getBar());
    }

    private static Root unmarshal(String sampleXML) throws Exception {
        JAXBContext jc = JAXBContext.newInstance(Root.class);
        Unmarshaller unmarshaller = jc.createUnmarshaller();
        XMLReader reader = XMLReaderFactory.createXMLReader();
        IngoreNamespaceFilter nsFilter = new IngoreNamespaceFilter();
        nsFilter.setParent(reader);
        StringReader stringReader = new StringReader(sampleXML);
        InputSource is = new InputSource(stringReader);
        SAXSource source = new SAXSource(nsFilter, is);
        System.out.println("" + sampleXML);
        return (Root) unmarshaller.unmarshal(source);
    }
}

class IngoreNamespaceFilter extends XMLFilterImpl {

    public IngoreNamespaceFilter() {
        super();
    }

    @Override
    public void startDocument() throws SAXException {
        super.startDocument();
    }

    @Override
    public void startElement(String arg0, String arg1, String arg2,
            Attributes arg3) throws SAXException {

        super.startElement("", arg1, arg2, arg3); //Null uri
    }

    @Override
    public void endElement(String arg0, String arg1, String arg2)
            throws SAXException {

        super.endElement("", arg1, arg2); //null url
    }

    @Override
    public void startPrefixMapping(String prefix, String url)
            throws SAXException {
        //ignore namessopace

    }

}

以下是Pojos:

  

package testjaxb;

import javax.xml.bind.annotation.XmlAccessType;
import javax.xml.bind.annotation.XmlAccessorType;
import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(name="root")
@XmlAccessorType(XmlAccessType.FIELD)
public class Root
{
    private Foo foo;


    public Foo getFoo ()
    {
        return foo;
    }

    public void setFoo (Foo foo)
    {
        this.foo = foo;
    }


}
  

package testjaxb;

import javax.xml.bind.annotation.XmlAccessType;
import javax.xml.bind.annotation.XmlAccessorType;
import javax.xml.bind.annotation.XmlAttribute;


@XmlAccessorType(XmlAccessType.FIELD)
public class Foo
{
    @XmlAttribute
    private String id;

    private String bar;

    public String getId ()
    {
        return id;
    }

    public void setId (String id)
    {
        this.id = id;
    }

    public String getBar ()
    {
        return bar;
    }

    public void setBar (String bar)
    {
        this.bar = bar;
    }


}