Word文档问题中的XML

时间:2013-03-12 21:53:15

标签: html xml xml-parsing ms-word

我有一个从Word插入的XML文档。用户的详细信息有点粗略,但我相信通过从Word复制插入XML。所需的功能是将复制的MS Word格式的文本插入到xml文档中,将其存储在数据库中以便稍后导出。除了一个奇怪的标记外,初始XML看起来还不错。

 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

此标记的作用是不允许在Visual Studio 2010和IE 8中解析XML。删除此标记后会出现另一个错误。

End tag 'FONT' does not match the start tag 'P'. Error processing resource 

似乎Microsoft在XML标记内生成的HTML存在问题。我不是XML专家.... MS生成HTML的问题是什么?为什么删除标签有帮助?

1 个答案:

答案 0 :(得分:0)

MS Word产生可怕的标记 - 以XML格式存储是最糟糕的方式。如果必须保留错误的格式化数据,关系数据库将是更好的解决方案,否则将需要删除格式或手动更正它。

相关问题