为什么Cloud Dataflow在与我的数据所在的不同区域运行其工作人员?

时间:2016-03-29 20:36:59

标签: google-cloud-dataflow

在评估GCP作为我们业务的潜在分析平台时,我已经建立了一个位于欧盟的云存储桶。我已将BigQuery数据集配置为也位于EU中。但是,当我在Cloud Dataflow服务中运行ETL作业,将数据从前者移动到后者时,我在日志中看到以下消息:

  

工作人员配置:us-central1-f中的n1-standard-1

除了在性能和延迟方面出现的技术问题之外,我还担心将数据需要保留在欧盟往返美国数据中心进行处理的法律方面。

我无法在DataflowPipelineRunner选项中指定工作人员的位置,我在Data Processing and Security Terms中无论是否可以假设我的数据不会移动,我都没有任何意义。

云数据流是否可以在任何方便的地方处理我的数据,无论其存储位置或目标位置如何?

1 个答案:

答案 0 :(得分:1)

根据documentation

  

默认情况下,Dataflow服务在区域us-central1-f中部署计算引擎资源。您可以在创建管道时指定--zone选项来覆盖此设置。

此选项在DataflowPipelineWorkerPoolOptions中声明。

相关问题