为常见数据构建最佳deflate字典

时间:2014-06-11 09:42:23

标签: python zlib deflate

我在这个领域经历过SO问题,但无法找到我想要的东西 我在窄带网络上发送小二进制文件(~5MB),这应该非常相似,我想用zlib(python)压缩它们。
我想建立一个预定义的字典,但标准的常用字典不相关,因为它是非文本信息。
此外,手动查找公共序列也不是一件容易的事,只能在这种特定类型的文件上工作。

我正在寻找一种test-n-inspect方法,我可以只压缩文件,并查看用于该输出的字典(压缩数据)。
然后,通过收集这些词典,我可以运行一些测试来找到最佳词典 问题是(在zlib规范中搜索之后):如何从压缩二进制数据中提取字典?

我看到每个压缩数据都以二进制数据开始,然后是2 \ x00字节,然后是数据 所以我相信它在那里,但我怎样才能提取和使用它呢? (或者我甚至没有关闭......)

(使用python 2.7测试zlib)

0 个答案:

没有答案
相关问题