使用7zip压缩后,两个相同大小的文件具有完全不同的大小

时间:2017-05-05 11:27:58

标签: 7zip compression

使用7zip压缩两个3 GB的csv文件。压缩后,一个文件的大小为242 MB,另一个文件的大小为141 MB。这怎么可能?

两个文件都包含相同的数据格式。但是,数据可能不同。

请让我知道压缩文件大小较高的原因,即242 MB。

2 个答案:

答案 0 :(得分:1)

文件内容在压缩中很重要。基本上,文件中的冗余数据越多,压缩后该文件可以越小。这是一个很好的解释,说明压缩如何工作:https://computer.howstuffworks.com/file-compression.htm

答案 1 :(得分:0)

尝试并考虑一种基本的压缩算法。你的文件在和中只有0和1。因此,一个建议可能是保存接下来的数量,比如4个字节,然后是0和1.对于8字节文件,这里有两个选项:

  1. 11111111变为10001(二进制为81。

  2. 10101010变成00110010 ....

  3. 这当然是一个糟糕的算法 - 它根本无法减少第二个8位。这可以通过添加重复的长度来轻松处理(这里2个字节更好)。通用算法要复杂得多。

    一般来说,这个想法是相同的 - 重复文件通常会更少(大大替换)

相关问题