windows - 从未知文件中提取序列化数据

关于如何处理这个问题的一些一般性建议：

解决此问题的一种方法是使用类似http://filext.com/的网站来尝试找出文件的来源。这可能很难，因为它不像任何地方的文件扩展标准 - 任何人都可以使用任何扩展，所以你将有很多冲突/消歧问题需要解决。
有时你会很幸运，如果你在纯文本编辑器中打开文件，你偶尔会看到可读的纯字符串数据，这有助于识别文件中包含的一般数据类型，因此有助于减少减少文件可能的源数量。例如，我经常帮助收到文件的人作为带有没有扩展名的电子邮件附件，找出使用此技术的文件类型，添加文件扩展名，然后在适当的位置打开它程序
还有像http://www.oldversion.com/这样的网站可以保留您（通常情况下）可以免费下载的旧版程序。如果您使用的数据是在5年多以前的专有程序中创建的，并且该程序不再可供创建它的供应商购买，那么这将特别有用。
一旦您对哪些文件属于哪些程序有了一个很好的了解，那么您可能会花费大量时间尝试查找文件结构的在线资源。如果没有，您可以获得原始程序的副本，但程序不会打开您感兴趣的文件，或者您仍然希望对数据进行原始访问，然后尝试生成一些示例输出文件您输入的数据，并在其上转Rosetta Stone，将您的已知文件与原始文件进行比较。
从那里，您可能想要的其他知识是尝试找出软件编写的语言/编译器，这可以让您领导在第一个数据库中使用哪些代码库来序列化数据地点。一旦你了解了所有这些，那么阅读序列化过程中的任何可用文档，然后编写反序列化器就可以了。

这项技术无法解决的一件事是，如果您正在处理损坏/截断的数据文件，可能很难区分它与您是否正确的文件结构。在这种情况下，“Rosetta Stone”技术可能会有所帮助。

根据您所谈论的源软件的数量，听起来像一个非常大的项目。祝你好运！

从未知文件中提取序列化数据

1 个答案: