使用差异补丁匹配读取文本格式

时间:2018-11-06 06:47:48

标签: c# wpf google-diff-match-patch

我正在使用差异匹配补丁https://github.com/google/diff-match-patch来比较html文件的文本及其预期的工作。但是用户希望添加一项功能来比较格式(粗体,斜体,下划线)

但是差异匹配补丁只接受字符串。

我创建了一个类,其中包含html文件的文本及其字体属性

class TextProperty
{
    public string Text { get; set; }
    public bool isBold { get; set; }
    public bool isItalic { get; set; }
    public bool isUnderline { get; set; }
}

但是现在我遇到的问题是当我阅读html内容时。我通过文字阅读。并且我附加了具有相同格式的文本

示例我有此示例文本

enter image description here

所以我的输出是

This is a normal text with : isBold = false : isItalic = false : isUnderline = false
bold : isBold = true: isItalic = false : isUnderline = false
and : isBold = false : isItalic = false : isUnderline = false
italic : isBold = false : isItalic = true : isUnderline = false
and : isBold = false : isItalic = false : isUnderline = false
underline : isBold = false : isItalic = false : isUnderline = true
text : isBold = false : isItalic = false : isUnderline = false

但是有了这个输出,我该如何在我的差异匹配过程中传递它。

如果我修改差异匹配补丁。它将接受TextProperty

的列表

这是个好方法吗?或其他更好的选择?

但是在阅读diff-match-patch的代码后,我需要修改很多代码

0 个答案:

没有答案