如何从带有DATE列的BigQuery表中导出AVRO文件并将其再次加载到BigQuery

时间:2018-07-06 08:05:11

标签: google-bigquery avro

要从驻留在美国的BigQuery(BQ)表中移动数据,我想将该表导出到美国的Cloud Storage(GCS)存储桶,将其复制到EU存储桶,然后从那里再次导入

问题在于AVRO不支持DATE类型,但对我们来说至关重要,因为我们正在使用的新partitioning feature并不依赖于摄取时间,而是表本身中的一列

AVRO文件将DATE列包含为STRING,因此 尝试通过Field date has changed type from DATE to STRING加载文件时,抛出bq load错误。

有一个similar question,但它是关于时间戳的-在我的情况下,它绝对必须是DATE,因为日期不包含时区信息,并且BQ总是在UTC中解释时间戳

在使用NEWLINE_DELIMITED_JSON时可以使用,但是可以对AVRO文件使用此功能吗?

1 个答案:

答案 0 :(得分:1)

正如@ElliottBrossard在评论中指出的那样,有一个与此相关的公共功能请求,可以在其中注册白名单。