分析

如何找到修复这些3.红色的旗帜你的谷歌分析数据

通过谷歌Analytics跟踪,你可以获得有价值的见解,谁来到你的网站,他们如何使用它,你的网站是否在做它的工作。

虽然实施谷歌Analytics跟踪是基于数据做出明智商业决策的第一步,但它真的只是第一个的一步。

如果没有定期的关注和维护,你的业务要么盲目依赖谷歌Analytics数据(可怕),要么根本不使用它(可悲)。

但是不要害怕!以下是三个常见问题以及如何修复它们以恢复数据完整性。

1.自我推荐

这是一个大问题。谷歌对a的定义self-referral引荐流量是来自您自己的域名内的页面吗

的影响

自我引用意味着单个用户的会话中断并重新启动,而实际上没有离开站点。谷歌Analytics读取您的域作为引用,有效地覆盖了实际的获取信息。

为什么会发生这种情况?

自引用是由跟踪实现中的错误引起的,例如缺少跟踪代码、缺少或不准确的跨域设置、带有utm参数的内部链接标记等等。

我如何查看我的数据?

在谷歌分析,导航到推荐报告(收购>推荐)。在报告中寻找你自己的网络属性。自我推荐可能包括你的主域名(例如yoursite.com)和其他跟踪的网站属性(例如blog.yoursite.com)。

我该怎么解决呢?

与管理跟踪实现的人员联系。自我推荐可以通过在一个未被跟踪的公司网站上配置跟踪来解决(如果人们可以从你的网站点击到它,它就应该被跟踪)。还需要调整您的跨域实现(错过一个网站?),甚至删除内部网站链接上的utm参数实例(点击utm参数注册一个新的会话,失去以前的参考信息)。

不要被万能分析公司的承诺所迷惑推荐排除列表.同时向列表中添加一个内部主机名五月防止会话中断为那个主机名,它也将有效地掩盖你的网站上需要注意的跟踪中断。

你也可以退房谷歌的资源它更详细地解释了常见的原因,并提出了帮助您检测数据中的自我推荐的方法。

2.个人识别信息(PII)

PII是关于用户的任何可以用来识别个人的东西。它可能包括(但不限于)姓名、地址、电子邮件地址、个人电话号码、信用卡信息和社会安全号码。

您谷歌Analytics数据中的PII是严重的,因为谷歌的政策禁止它,可能会永久关闭包含PII的账户(意味着丢失所有数据)。

为什么会发生这种情况?

PII通常通过url字符串到达谷歌Analytics数据。考虑你网站上的一些特性,比如表单字段和搜索栏,在这些特性中,个人用户信息条目无需加密就可以通过url传递。

我如何查看我的数据?

导航到页面报告(行为>网站内容>所有页面),开始一个高级搜索,将下列正则表达式之一粘贴到搜索字段。

搜寻电话号码:

\?.*([=:,!]|% 2 (1 c)) (\ (| % 28) ? \ d {3} ([\ s +,) -] | % 2 [0 b1c9]) * \ d {3} ((\ s +, -) | % 2 [0 b1c]) * \ d {4} ([\ s +] | % 2 [0 b ])*($|[&#:,!%])


搜寻电邮地址:

*(@ | % 40) \ ?。

搜索物理地址:

\ ?。* \ b(圣(reet) ? |大街(自虐)? | b (ou) ?勒? v (ar) ? d |(高)?路| Ln Lane | | | Rd) \ b

搜索邮政编码:

\?.*([=:,!]|% 2 c [1]) \ d {5} (\ s + | | \ % 2 b [0]) * ((\ s + | | \ % 2 b [0]) * \ d {4 }($|[&#:,!%])

搜索信用卡信息(Visa/MasterCard/Discover):

\?.*([=:,!]|% 2 (1 c))(4[0 - 9][1 - 5] | 2 | 5 | 6[05])(2 - 7日)(((\ s +, -) | % 2 [0 b1c]) * \ d) {12 }($|[&#:,!%])

搜寻社会保障号码:

\?.*([=:,!]|% 2 c [1]) d {3} - ? \ d {2} - ? \ d {4 }($|[&#:,!%])

我该怎么解决呢?

如果确定了PII,请与开发人员联系。共享您已经识别的参数,将信息发送到谷歌Analytics,并对当前通过PII传递的请求值进行加密。

如果在源地址不是一个选项,你可以通过谷歌标签管理器实现一个解决方案,在它使它到谷歌分析之前,通过以下步骤从url剥离参数:

  1. 在谷歌标签管理器中创建一个自定义javascript变量,名为“Pageview URL - custom”这个javascript由Seer团队成员分享斯蒂芬•哈里斯
  2. 创建一个测试谷歌Analytics属性,这将允许您在推出到您的活跃谷歌Analytics属性之前验证解决方案。
  3. 创建一个测试页面视图标签指向一个测试UA属性。在这个标签中,用你的新变量设置“page”字段。
  4. 测试并发布标记
  5. 检查谷歌Analytics中的url在你的测试属性中,以确认你的解决方案是否如预期的那样运行。
  6. 如果功能正常,完成实时页面视图标记和发布的配置。

除了URL之外,PII还可能通过事件和自定义维度值无意中发送到谷歌Analytics。如果您不熟悉跟踪实现和数据,那么检查这些也是很重要的。

3.推荐的垃圾邮件

推荐垃圾邮件是非真正的流量来源污染您的谷歌Analytics数据。

的影响

推荐垃圾邮件会向你的谷歌Analytics账户发送虚假数据,不管是否访问你的网站,结果都是非真实的会话和用户数据或夸大的会话,影响任何使用会话计算的指标,如跳出率,每次会话的页面,平均会话时间等。

为什么会发生这种情况?

推荐垃圾邮件可能是通过测量协议发送到谷歌Analytics服务器的“幽灵”或虚假数据(可能随机针对GA跟踪id)的结果。这也可能是“爬虫”的结果,或人们使用机器人抓取网站,而没有努力阻止他们的活动从分析。

我如何查看我的数据?

要检查自己的数据,请导航到Hostname报告(受众> Technology > Network > Select Hostname)。如果你看到一个主机名你不认识或'(未设置)'列出,这可能是' Ghost '推荐垃圾邮件。

“Ghost”垃圾邮件通常使用一个虚构的主机名发送,或者根本不发送。因为这些流量从未真正进入你的网站,你会注意到流量有100%的跳出率,平均每次会话1页,平均会话持续时间0.00秒。

也可以在推荐报告中检测到推荐垃圾邮件。导航到收购>所有流量>推荐,寻找你不认识的来源。关于推荐垃圾邮件,我了解到来源很少是新的。因此,如果您不能识别特定的引用流量源,谷歌it: ' example_source referencespam '。在结果和你对网站预期流量来源的了解之间,你应该能够辨别网站的非真实流量来源。

我该怎么解决呢?

如果您通过未识别的主机名或推荐源识别了推荐垃圾邮件源,则可以配置谷歌Analytics,通过过滤器将其排除。

对于“幽灵”推荐垃圾主机名

  1. 导航到过滤器(Admin >所有帐户级别的过滤器)。
  2. 创建一个新的过滤器,选择“添加过滤器”
  3. 选择自定义
  4. 选择“包括”
  5. 从下拉列表中选择“Hostname”
  6. 指定应该将数据发送到GA的所有主机名(那些承载您的跟踪器的主机名)。

重要的是:如果您有多个主机名,正则表达式必须用于在一个包含筛选器中指定所有主机名。正则表达式是一种强大的语言,您应该仔细阅读,为了这个过滤器的目的,您将使用转义(' \ ')和或(' | ')字符。

例如:

(www |博客|新闻)\ .mysite \ com

7.将其应用于数据的相关视图

对于“爬虫”推荐垃圾邮件

8.使用自定义过滤器

9.选择“排除”

10.从下拉菜单中选择“活动来源”

11.输入您想要排除的源

12.将其应用于数据的相关视图

定期监控您的数据是确保快速修复谷歌Analytics账户中不可避免的数据准确性威胁的关键。

你如何监控你的数据?我们很高兴收到你的来信!如果你对谷歌分析有兴趣,写封信给我们