导出Google Analytics数据(事件日志)

时间:2015-07-08 16:27:38

标签: database google-analytics google-analytics-api etl data-warehouse

我有一些应用程序和一个触发Google Analytics事件的网站。我想将谷歌分析事件导出到我的数据仓库,以获得更好的洞察力和分析。

对于这个问题,你可以使用你想要的语言(python,ruby,java等)。

我不是谷歌分析方面的专家,我不知道它是否可行,但是我可以记录所有被触发的事件吗?它看起来像那样:

   event_id    |   user_id    |   date     |      foo
   ----------------------------------------------------
        210    |    1245076   | 07-08-2015 |   bla
        211    |      124     | 07-08-2015 |   bla2
        214    |    1245081   | 07-08-2015 |   bla3
        215    |     48789    | 07-09-2015 |   last line

如果没有,我至少可以通过会话获得它吗?像这样:

   session_id  |   user_id    |   date     |      foo
   ----------------------------------------------------
        210    |    1245076   | 07-08-2015 |   bla
        211    |      124     | 07-08-2015 |   bla2
        214    |    1245081   | 07-08-2015 |   bla3
        215    |     48789    | 07-09-2015 |   last line

如果不可能,那么我能得到的事件日志最接近的是什么? (我知道“接近”是模糊的...)我的意思是,谷歌分析倾向于聚合事物,我宁愿没有聚合......

这是第一部分,然后第二部分是从查询结果插入到数据仓库中,但它不是问题部分。

注意(编辑):在此问题中,可以在第一时间省略“配额”方面(Google AnalyticsAPI限制每日请求的数量)。我的意思是,是否有可能以我想要的格式获取数据,如果是,那么我们可以问自己如何有效地实现这一限制

提前致谢!

1 个答案:

答案 0 :(得分:1)

Google Analytics不会向您提供包含id

的任何数据

它是Google Analytics Premium的一部分,您可以获得有关fullVisitorIdvisitId(sessionId)所需信息的完整表格

Big Query Export Schema有关于您可以拥有的数据的详细信息

有一种方法可以在不使用Google Analytics优质服务的情况下执行此操作

解决方案:如果您不希望数据汇总,请添加您选择的维度以对数据进行细分。在这种情况下user_idevent_id

接近一个

在Google Analytics中事件报告是您可以使用的,

Event Category:发送由JS代码生成的user_id

Event Action:发送由JS代码再次生成的event_id

Event Label:foo

Date这是Google Analytics中提供的默认维度

接近两个

Custom Dimesnion:发送由JS代码生成的user_id

Event Category:发送由JS代码生成的event_id

Event Action:foo

Date这是Google Analytics中提供的默认维度

使用第二种方法的好处是,一旦您使用user_id设置自定义维度,您就可以使用除事件报告之外的大多数报告。

可以使用Core Reporting API

从Google Analytics中提取数据