python - 为常见数据构建最佳deflate字典

我在这个领域经历过SO问题，但无法找到我想要的东西我在窄带网络上发送小二进制文件（~5MB），这应该非常相似，我想用zlib（python）压缩它们。
我想建立一个预定义的字典，但标准的常用字典不相关，因为它是非文本信息。
此外，手动查找公共序列也不是一件容易的事，只能在这种特定类型的文件上工作。

我正在寻找一种test-n-inspect方法，我可以只压缩文件，并查看用于该输出的字典（压缩数据）。
然后，通过收集这些词典，我可以运行一些测试来找到最佳词典问题是（在zlib规范中搜索之后）：如何从压缩二进制数据中提取字典？

我看到每个压缩数据都以二进制数据开始，然后是2 \ x00字节，然后是数据所以我相信它在那里，但我怎样才能提取和使用它呢？（或者我甚至没有关闭......）

（使用python 2.7测试zlib）