AngleSharp和XHTML往返

时间:2016-03-22 07:02:42

标签: c# parsing anglesharp

我尝试使用AngleSharp解析XHTML文件,进行更改,然后输出。但是,我在输出与输入匹配时遇到了一些问题。

  • 如果我使用XML解析器,XMLMarkupFormatterHtmlMarkupFormatter我没有自动关闭标签(都是<img></img>)而没有XML声明。

  • 如果我使用HTML解析器和HTMLMarkupFormatter我得到XML无效的自我关闭标签(所有都只是<img>)并且没有XML声明。

  • 如果我使用HTML解析器和XMLMarkupFormatter我得到了很好的自闭标签(<img />)和XML声明 - 但是,XML声明会被选为注释和输出为<!-- <?xml version="1.0" encoding="UTF-8"?> -->

有没有解决方法或我是否需要编写自己的MarkupFormatter

1 个答案:

答案 0 :(得分:0)

简单回答:听起来您需要提供自己的MarkupFormatter

我们已经做了一些努力来提出XhtmlMarkupFormatter,但遗憾的是这个组件到目前为止尚未实现。我想这样的组件可以结合来自现有HTML和可用的XML格式化器的序列化。

也许this issue on the AngleSharp repo会帮助你。