定期安排从GCS向BigQuery加载数据

时间:2019-03-04 11:24:41

标签: google-cloud-platform google-bigquery google-cloud-storage airflow airflow-scheduler

我已经对其进行了研究,目前提出了使用Apache Airflow的策略。我仍然不确定如何执行此操作。我得到的大多数博客和答案都是直接代码,而不是为了更好地理解它的一些材料。另外,请提出是否有一个好的方法。

我也得到了答案,例如将Background Cloud FunctionCloud Storage trigger一起使用。

2 个答案:

答案 0 :(得分:1)

您可以使用BigQuery的Cloud Storage transfers,但请注意,它仍处于测试版中。

它使您可以选择在有一定限制的情况下安排从Cloud Storage到BigQuery的传输。

enter image description here

答案 1 :(得分:1)

  

我得到的大多数博客和答案都是直接代码

Apache Airflow带有丰富的UI,可以执行许多任务,但这并不意味着您不应该编写代码来完成任务。

对于您的情况,您需要对Apache Airflow使用BigQuery command line operator

enter image description here

如何进行此操作的好方法可以在此link

中找到
相关问题