读取Apache Beam中的协议缓冲区文件

时间:2018-10-15 21:28:37

标签: protocol-buffers google-cloud-dataflow apache-beam apache-beam-io

我在GCS中有一堆prob的文件,我想通过数据流(java sdk)处理它们,我不确定该怎么做。

Apache Beam提供AvroIO来读取avro文件

 Schema schema = new Schema.Parser().parse(new File("schema.avsc"));
 PCollection<GenericRecord> records =
     p.apply(AvroIO.readGenericRecords(schema)
                .from("gs://my_bucket/path/to/records-*.avro"));

读取probbuff文件是否有类似的东西?

预先感谢

0 个答案:

没有答案