使用7zip压缩两个3 GB的csv文件。压缩后,一个文件的大小为242 MB,另一个文件的大小为141 MB。这怎么可能?
两个文件都包含相同的数据格式。但是,数据可能不同。
请让我知道压缩文件大小较高的原因,即242 MB。
答案 0 :(得分:1)
文件内容在压缩中很重要。基本上,文件中的冗余数据越多,压缩后该文件可以越小。这是一个很好的解释,说明压缩如何工作:https://computer.howstuffworks.com/file-compression.htm
答案 1 :(得分:0)
尝试并考虑一种基本的压缩算法。你的文件在和中只有0和1。因此,一个建议可能是保存接下来的数量,比如4个字节,然后是0和1.对于8字节文件,这里有两个选项:
11111111变为10001(二进制为81。
10101010变成00110010 ....
这当然是一个糟糕的算法 - 它根本无法减少第二个8位。这可以通过添加重复的长度来轻松处理(这里2个字节更好)。通用算法要复杂得多。
一般来说,这个想法是相同的 - 重复文件通常会更少(大大替换)