为什么XMLStreamReader / StAXSource会从XML中删除注释?

时间:2013-04-03 15:48:32

标签: java xml stax xml-comments xmlstreamreader

以下代码(基于http://jax-ws.java.net/nonav/jax-ws-20-fcs/arch/com/sun/xml/ws/util/xml/StAXSource.html的示例代码)

String xml = "<a><b>a text</b><!--a comment--><b/></a>";
StringReader sr = new StringReader(xml);
XMLStreamReader reader = XMLInputFactory.newInstance().createXMLStreamReader(sr);
Source source = new StAXSource(reader);     
//Source source = new StreamSource(sr);
Result result = new StreamResult(System.out);      
TransformerFactory.newInstance().newTransformer().transform(source, result);

产生以下结果:

<?xml version="1.0" encoding="UTF-8"?><a><b>a text</b><b/></a>

即。它删除了xml注释。如果我用StreamSource替换StAXSource / XMLStreamReader,则保留注释。

有没有人知道为什么XMLStreamReader / StAXSource组合将它们剥离出来以及是否有任何方法可以阻止它?测试是在没有第三方jar的1.6和1.7环境中完成的,因此XMLStreamReader变为

com.sun.org.apache.xerces.internal.impl.XMLStreamReaderImpl 

谢谢

1 个答案:

答案 0 :(得分:0)

编辑: 刚尝试here

case XMLStreamConstants.COMMENT:
  System.out.print("<!--");
  if (xmlr.hasText())
     System.out.print(xmlr.getText());
...

它会阅读评论。尽管如此,这还没有回答原来的问题......