GA4和lookker Studio的数据差异

你猜怎么着?再过几个月我们就失去通用分析．如果你正在读这篇文章，我想这对你来说不是新闻。

我将跳过历史课，不讲为什么这种转变对任何和所有组织都是如此重要依赖谷歌分析的组织-也就是我们都知道，热爱和信任了十多年的数据平台。

在这篇文章中，我将阐述在使用原生GA4报告时应该期望什么，以及如何将这些数据与从lookker Studio(以前称为“谷歌data Studio”)获得的数据进行比较。

为了准备更改，我开始使用Looker Studio查看Universal Analytics和谷歌Analytics 4中的报告之间的预期结果，并注意到平台之间的数据有一些特殊之处。

提示:UA匹配，但GA4不匹配。

UA和Looker Studio

我说过我会跳过历史课，但在我们深入研究之前，我们需要一点背景知识。一段时间以来，lookstudio提供了与UA的良好本地连接，允许您将数据输送到漂亮的自定义仪表板和报告中。

你在UA界面上看到的和在look图表中显示的大多数指标是1:1的匹配——正如你可能预料的那样。

例1，属性A

举个简单的例子，这里有一个计分卡的截图，它将15天内的浏览量、会话数和用户数与Universal Analytics的同期数据进行了对比。如您所见，这些指标直接匹配。

你现在可能会问自己——为什么要费心展示这个呢?因为许多组织使用Looker Studio进行kpi和一般性能报告，然后跳转到Universal Analytics进行更详细的分析和探索。

由于要在不同的工具之间切换，因此了解数据是否1:1匹配非常重要，以便可以将其中任何一种工具用于临时报告和请求。

报告id

在我们直接进入GA4和Looker之前，我们需要了解GA4中不同的报告模型。目前有三种不同的报告标识可用-属性默认使用Blended。

混合
- #1 -用户ID
- #2 -谷歌信号
- #3 -设备ID
- #4 -建模
观察到的
- #1 -用户ID
- #2 -谷歌信号
- #3 -设备ID
基于
- #1 -设备ID(即网站的客户端ID和应用程序的应用实例ID)

混合模式使用GA4的所有可用资源，将会话与之前访问过该网站的用户进行匹配。用户匹配按照列出的方法的顺序进行。例如，如果User ID不能将会话与用户匹配，GA4将使用谷歌Signals来查找匹配的访问者，等等。当然，你需要收集用户id而且enable谷歌信号以充分享受混合模式的好处。

虽然这些模型在某些时候都依赖于Device ID，但它们在报告和探索中可能会有很大的差异，这取决于所选择的是哪个。虽然我希望看到不同的用户数据，但会话也会发生巨大变化。一旦我们有了更好的了解，我们会告诉你的。

现在，这些不同的报告模型如何改变API和Looker Studio中请求的数据还有待观察。编辑这些报告模型会改变GA4接口中显示的数据，但似乎不会改变发送到lookstudio的数据。

采样和数据阈值

谷歌Analytics 4的另一个功能，您可以期望在界面中影响您的数据是数据阈值而且抽样．

将阈值添加到以用户为中心的低容量报告中，以维护隐私。在Universal Analytics中，可以通过隔离会话来跟踪个人，并利用额外的人口统计数据、兴趣数据和其他信号来识别用户。为了防止这种情况在GA4中发生，谷歌现在在没有满足特定报告的最低用户数时对数据应用阈值。

同样，在相反的方向上，大容量报告也以抽样为特色。虽然这在GA4中并不新鲜，但在探索数据时要记住这一点。为了降低请求和总体负载，谷歌将对免费帐户中的1000万事件和360个帐户中的10亿事件的报告应用抽样。

从估计选举结果到测试特定地区的土壤成分，采样都被用于任何事情，所以这不是GA4独有的。

在报告数百万个事件的情况下，您可能会看到几千个差异，但总体的比例和比例应该是一致的。

本机GA4和lookker Studio报告的差异

现在，让我开始这个项目的第一个原因是lookstudio和GA4之间的数据差异。

首先，谷歌可能不会像GA4本身那样对请求的数据应用相同类型的模型——数据聚合根据请求的时间框架而不同。一个明显的例子是时间序列图与记分卡的比较。在下面的图表中，您可以看到导出到Excel中的每日总数与同一数据源在同一时间段内的记分卡的比较。

例2，属性A

对于测试的属性，视图总是匹配的，但是会话和活动用户总是不同的。记分卡上的会话数比图表上的要高，而用户在记分卡上的会话数却偏低。

这让我们相信，谷歌衡量的是特定时间段的总量，而不是每天。然而，这些差异都没有达到使报告无法使用的程度。但是，这并不是差异最令人担忧的地方。

真正引起我注意的是这两种工具之间的数据差距有多大。

对于下面的示例，所有报告都使用与上面相同的设置-从Looker data Studio导出15天内的时间序列数据和记分卡，与谷歌Analytics 4探索中按天分组的同期相比。此外，这些例子都没有受到阈值或抽样的影响。

例3，属性A

例4，属性B

例5，属性C

最后一个是真正让我猝不及防的。考虑到它有多远，我想知道基于设备的报告能有多接近，因为与其他模型相比，它应该会产生最高的会话数和用户数。

例6，属性C

即使将Reporting ID更改为容量方面最慷慨的设置，数字仍然有很大的不同。

我们该怎么做报告?

谷歌承认他们没有工具之间的基准测试数据，但当比较谷歌广告和谷歌分析这样不同的系统时，这是意料之中的。

但我个人认为，当从同一数据源提取数据时，数据至少应该接近。然而，与您从lookdata Studio中获取的数据相比，GA4中的指标似乎除了抽样和报告ID计算之外，还接受了其他处理。

我们建议与您提取数据的位置保持一致。如果您开始从GA4界面导出报告和探索，请将其作为真实来源。如果您在LDS中构建详细的报告以供每月检查，请坚持这样做。

不期望Data Studio中的数据与GA4中的相同-这样做会给你和你的组织造成相当大的混乱。

GA4和lookker Studio的数据差异

UA和Looker Studio

报告id

采样和数据阈值

本机GA4和lookker Studio报告的差异

我们该怎么做报告?

相关的帖子

GA4自动属性创建的风险

谷歌的伟大分析驱逐从UA到GA4

我们乐于帮助像您这样的营销人员。