谷歌的数据流和谷歌的数据流有什么区别?

时间:2017-08-15 16:12:22

标签: google-cloud-dataflow google-cloud-dataproc

DataFlow本身有ETL,计算和流媒体处理为什么我们需要去谷歌的Dataproc?

1 个答案:

答案 0 :(得分:5)

Google Dataflow是一种完全托管和自我优化的云服务,可让您使用Apache Beam编程模型编写批处理和流数据处理管道。它与许多开源和Google云数据源和接收器集成在一起。

Google Dataproc是一个完全托管的云服务,用于以简单经济的方式运行Apache Hadoop和Apache Spark集群。如果您有使用Spark,Hive或Pig的现有数据处理管道,这是一种快速简便的移动管道的方法。您可以随时安装自定义程序包,启动/停止和缩放这些群集。最重要的是,Google Dataproc与许多Google云端数据服务集成在一起。