如何压缩几乎2个相同的文件

时间:2019-06-24 15:58:44

标签: python integer compression

我有两个文件,每个文件包含大量值。这两个文件具有相同的值,但在两个文件中这些值的顺序不同。

例如,以下是两个字段A和B中的数据:

File A: [23, 45, 66, 105, …]
File B: [105, 45, 23, 66, …]

我需要压缩这两个文件。我可以将这两个文件另存为二进制或文本。

我已通过以下链接与您共享文件。您可以下载并查看它们。如您所见,两个文件具有相同的值,在两个文件中分布不均。每个文件约为15.3 KB。压缩每个文件时,可以得到30.3 KB RAR文件。关于这两个文件具有相同的值,我希望压缩率更高。有什么办法可以压缩这些文件?

PS:两个文件中的所有值都保存为二进制文件中的12位。而且,这些值形成某种上升趋势。这意味着值随着文件的前进而变大(在一个文件中)。但是您仍然可以在文件的不同部分之间找到一些较小的值。如:

 [23, 45, 79, 125, 5, 155, 20, 220, 335, 379, …] 

如您所见,随着文件的前进,这些值将越来越大,但是您会在其中找到一些较小的值。

文件链接: https://drive.google.com/drive/folders/1QO9RVOdjat26utP20yDwfdvJN3aQTUHk

0 个答案:

没有答案