当遇到异常流量变化时,分析师或产品经理通常需要放下工作,立即调查原因。

但是,在此过程中,通常需要三步骤:

1,发现异常流量特性

2。净化异常流量

3。分析异常流量的原因

第一步是发现异常流量。为了提高这项工作的效率,我总结了一套清单,希望能作为你的工作手册。我将首先列出列表中的项目,然后详细解释它们:

一、异常流量尺寸快速检查表

1.两天一小时比较异常和正常,分别比较紫外/会话/光伏和其他指标

2.如果有其他交通统计系统,请相互验证数据的准确性。

如果单个小时流量发生显著变化:

3.确定异常时间段,并找到技术部的同事调查问题(如有可能,先关注域名报告中问题页面的某一部分,所有页面和内容分组报告,方法见下文)

4.查找运行维护部门的同事,找出异常期间的http请求数量是否异常(如果是,则表示流量实际发生了变化;如果不是,统计代码本身可能有问题,实际流量没有改变)

5.请联系产品/运营同事,询问是否有任何产品修订或组织了哪些在线活动。

6.如果异常在每小时内均匀分布,则有必要检查每个维度中是否有任何显著异常的项目,这可能是问题点:

流动来源

新/旧用户

登录页面

所有页面(组)

事件

省/市

浏览器/操作系统

手机品牌/型号(手机访客)

互联网运营商

二,常见三异常

1。悬崖类型:衰退时期如此明显。接下来,我们可以直接转到域名或所有页面报告,轻松找到下落的页面,然后转到技术和运营同事那里检查问题。

2,个别小时的小振幅异常

与明显的悬崖下降相比,如果只怀疑下降了几个小时,就不容易找到下降的域名/页面,因为丢失的流量被一整天的数据“稀释”。但幸运的是,遗传算法有强大的高级分割功能,我们可以单独查看下降时间的数据。这个过程就是本文开头提到的“异常流量的净化”:

在进行了高级别细分并查看域名报告后,我们可以清楚地找到下降部分:

找到异常域名后,将在二级维度中调用登录页面,以便更准确地找到有问题的页面:

其他交通统计系统也可以具有类似的细分功能。简而言之,思路是一样的,即找到异常维数,然后将其作为细分条件提取问题最集中的部分流量。

3,全天候均匀下降

有时问题维度不是小时,例如,以下示例:

我们发现来自so.com源的流量明显减少,但在小时维度数据上分布相对均匀:

所以这次我们不按小时细分,而是建立一个“so.com源”的细分,完成异常流量的“净化”,然后我们将分析异常的原因。这一过程实际上很简单,只要你对“净化”进行高级细分,并在各种报告中寻找其他维度的异常。

结果,我们在“浏览器”报告中发现,只有Vivo系统的浏览器数据发生了很大变化,然后我们继续用二次维度细分浏览器带来的流量源。结果发现,随着so.com来源的减少,百度的流量基本上在同一水平上增加,原因是显而易见的。很有可能浏览器切断了原本通往百度搜索框中so.com的流量。

三,分析系统之外还有什么

前一篇文章中的方法可以处理大多数流量异常,但是如果异常数据在任何维度上均匀分布,如果找不到异常点怎么办?此时,您可以首先打开网站/应用程序并查看。有时问题很容易在那里找到。

此外,我们还可以考虑外部因素,如因学生开学而导致游戏相关流量下降,因周末赶上各种严重雾霾天气而导致娱乐流量上升(用户都在家),甚至我们的品牌出现在“聚焦”镜头中,导致游客流量激增。没有找到这些外部因素的明确规则,找到它们要靠一点运气。

关于作者:卡车家庭数据资产中心主任孙伟在互联网上工作了15年,在数据分析方面工作了6年。谷歌分析高级用户,博客“数据分析日报”公开号码。

相关阅读:

[在广告中,我会教你如何发现交通作弊]点击查看