DiffMatchPatch将数字视为单词

时间:2018-09-21 17:56:26

标签: google-diff-match-patch

使用google的diff_match_patch在这两个句子中产生差异时,我得到的结果并不正确,这表明我的观点有所不同。

句子1:

“那里有785公斤水。”

句子2:

“有800公斤水。”

当我使用任何一种清除方法运行此命令时,它们都会将每个单独的数字视为更改。伪输出为:

 "There are <old>7</old>8<old>5</old><new>00</new>kg of water."

我想输出的内容是将“ 785kg”视为一个单词,将“ 800kg”视为一个单词。或更糟的情况是将“ 785”视为一个单词,将“ 800”视为一个单词。在我的情况下,输出如下所示:

 "There are <old>785kg</old><new>800kg</new> of water."

或更糟糕的是:

 "There are <old>785</old><new>800</new>kg of water."

0 个答案:

没有答案