使用Google表格作为重复字段的BigQuery数据源

时间:2017-07-31 10:36:48

标签: google-bigquery

我正在尝试将Google表格用作BigQuery表格的数据源。 我的一个数据集包括重复的字段。如何在GoogleSheets中构建数据以便作为重复字段正常工作?

到目前为止,我尝试用逗号分隔重复的值。 我没有在表创建时出错,但是当我尝试查询数据时,返回的错误是“内部错误”。

1 个答案:

答案 0 :(得分:0)

您无法在Google表格中保存重复字段,因为您可以看到in the docs(只有支持类似对象方案的文件才能支持重复字段)。

如果您必须使用Google电子表格,我认为您仍然可以通过一些额外的处理解决此问题。

我刚在Google云端硬盘中创建了此文件作为示例:

enter image description here

将其加载到名为“test4”的表中,其类型为STRING:

enter image description here

现在可以使用此STRING并拥有您想要的重复字段。一种可能性是此查询使用JSON_EXTRACT函数:

SELECT
  SPLIT(REGEXP_REPLACE(JSON_EXTRACT(user, '$.a'), r'\[|\]', ''), ',') a
FROM `your_table`

这会再次导致重复的字段:

enter image description here