protocol-buffers - 搜索协议缓冲区文件

您应该将protobuf库视为一个序列化协议，而不是支持复杂操作（例如查询，索引，拾取特定数据）的一体化库。谷歌在protobuf的开源部分上有各种各样的库，但是它们不是作为开源发布的，因为它们与它们独特的基础设施相关联。话虽这么说，你想要的肯定是可能的，但你需要编写一些代码。

无论如何，你的一些要求是：

有几种方法可以实现它们。

最常用的串行读/写方式是该文件包含一系列[大小，类型，序列化输出]。也就是说，一个序列化输出总是以大小和类型（4/8字节或可变长度）为前缀，以帮助读取和解析。所以你只需重复这个过程：1）读取大小和类型，2）读取给定大小的二进制文件，3）解析给定类型4）转到1）。如果使用联合类型或一个文件共享相同类型，则可以跳过类型。你不能放大，因为无法知道输出的结束。如果您想随机读/写，则需要其他类型的数据结构。
＆＃39;搜索字段＆＃39;在二进制文件中更棘手。一种方法是逐个读取/解析输出，并通过HasField（）检查字段的存在。这是最明显，最缓慢而直接的方式。如果你想按编号搜索字段（例如，你想搜索＆＃39;可选字符串email = 3;＆＃39;），那么搜索二进制blob（如0x1A，字段编号3，线类型2），它不可能。在序列化二进制流中，字段信息仅保存为数字。没有确切的上下文（.proto方案或二进制文件的结构），单独的数字并不意味着什么。不能保证0x1A来自字段信息，或来自其他消息类型的字段信息，或实际数字26，或其他数字的一部分等。也就是说，您需要自己维护信息。您可以使用必要的信息创建另一个文件或数据库以获取特定消息（例如，给定字段的序列化输出的位置）。

长话短说，你问的问题超出了开源的protobuf库本身的作用，但你可以根据自己的要求编写它们。

我希望，这就是你要找的东西： http://temk.github.io/protobuf-utils/

这是一个用于在protobuf文件中搜索的命令行实用程序。