在前面的文章提到,仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。
市面上有很多流量购买源,可以导入降低 Bounce Rate 的流量。搜索“流量购买”即可查到。
如果你运营的网站是商业性质的,会购买广告媒介来进行市场和销售的推广与促进,那么你就不得不关注这些看似高质量的流量,并能进行有效的甄别。否则,营销效果是好是坏?如何评估?将无法解答。像句俗话:“被人骗了还帮别人数钱”。
如何甄别虚假互动呢?网站分析师或者网站管理人员,需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量——深度互动时间(Time Spend on Deep Content)。
下面将按照以下逻辑进行叙述:1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究,看看模型的效果。
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
1、发现问题:
在前面的文章提到:网站的Bounce Rate很正常,或者很好,可网站的互动行为却非常的不正常。
这样的后果是:如果使用不全面、不科学的的分析方法,分析研究结论会被误导为“获得良好的效果”。
2、研究问题:
研究发现,停留时间是甄别虚假互动的突破口。因为虚假互动可以伪造点击,但是深度的停留时间很难伪装,仔细研究现象就会露马脚。
以Google Analytics为例,在时间上有很多度量(之前有一篇文章《Google Analytics时间观》)。下面我们以一个图说明“时间上”的问题:
图中有四种情况,黄色的为Time on Page,蓝色的Time on Site。如果页面的访问深度是1,那么就会有Bounce。访问深度是大于等于2,就不会Bounce。如图中第二种情况,当深度 = 2 时,Landing Page Time on Page = Landing Page Time on Site。注意到第三和四种情况,深度大于 2 后,Landing Page 的 Time on Site 的时间比 Time on Page 更多。原因是访问者通过Landing Page到达后,会进行一系列的互动,在其它页面的互动时间会算在该页面的 Time on Site 这个度量上。
Landing Page Time on Site =
Landing Page Time on Page + Deep Content A Time on Page + Deep Content B Time on Page + …
互动的更深(访问页面多)更久(各页面停留更久),反映了访问者对内容感兴趣,推广效果、网站运营效果良好。
现阶段虚假互动能够操作影响到的都是在第一个页面上, 即来到“Landing Page–>停留->点击链接”,我们只需要通过一个度量将这些元素所造成的影响剔除,才可以研究真正的互动程度。
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
3、建立解决模型:
Average Time Spend on Deep Content =
( Landing Page Time on Site – Landing Page Time on Page ) / Landing Page Pageview
公式简单说明:登陆页的全站停留时间,除去登陆页的页面停留的时间。余下的时间就是访问者在页面其它深度页面的停留时间。然后除以这个登陆页的浏览量,则可以求得一个平均的深度互动时间。这个值反映了平均每个访问者,点击登陆页内容后,除掉在登陆页的时间外,在网站上其它页面花的时间长短。有效的剔除了容易被“虚假流量”影响的登陆页停留时间这个度量。
4、实证模型:
举例:建立自定义报告(可以自行定义,但保证Entrance是第一个度量,这样可以保证主要的 Landing Page 显示在前面,也要保证 Time on Page、Time on Site 和 Pageview 这三个度量选中,以便新度量的计算。
下面是我建立的自定义报告共享连接:
套用了新度量进行不同的媒体的评估就显得很清晰了。原来左边第一个 Bounce Rate 特别的好,可是在 Average Time Spend on Deep Content 这个度量上,显得特别的低,开始矛盾了。这说明,最左边的流量中含有大量的虚假互动。
那么这个度量值在多少属于差?多少属于好呢?
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
下面是我们的经验值:对于一些有广告推广的网站而言,低于 1 秒就是很差了,说明推广的效果非常差。5 秒以上就是很不错了。
你知道宋星的这个博客:Chinawebanalytics.cn的深度互动时间么?123秒。也欢迎大家把你的博客的深度互动时间与大家分享。
没错,这个度量很好的扩大了真流量与虚假流量的差距,这种杠杆方法常用在统计学研究中当中。
俗话说:偏之毫厘,差之千里。那么一点点的具有虚假互动性质的流量,都会对这个度量有明显的影响。
像老虎的猫,终究是猫。所以流量的质量是客观的,好与不好,换个方法照样能把它甄别出来。
由于时间仓促,文章只将概要的思路与大家分享,欢迎大家拍砖或提问,我一一为你解答。或者不足的地方还请大家留言帮助我完善。实在留言解答不了的问题,可以 Gtalk 联系我。谢谢!
谢谢Tenly在我休假的时候的努力分享。完全是工作中的实践创造所得,具有极高的原创性和实用性。赞一个!
类似的方法还有热图,访问路径分析(Pathing Analysis)。但这个方法是最好用的,尤其是结合GA的自定义报告功能。
晚一些跟大家分享我休假的照片!:)
好文,转载到alibuybuy.com
文中的实证模型是直接可以用GA的自定义报告来实现吗?如果是的话具体怎么设置?我自己尝试时都不知道要把哪个指标拖放到哪个地方,不知是否有稍微详细点的设置操作文档。谢谢您的分享。
点击分享的自定义报告链接.我已经把度量与维度设置好了.
你只需要保存使用.然后就能应用报告.再接着把报告导出来.进行计算.
如果用户从landing page进入下一页,然后没有进入第三页就关闭浏览器了,google analytics可以统计到第二个页面的浏览时间吗?
不能.文章的图中第二个例子.
改版帅气~可喜可贺
哈哈,是的,谢谢!感谢Tenly同学帮我选了一个好的主题。:)
额。。今天碰到一个网站 把google分析代码放在<head>里,开始我以为是新的功能 异步。但他是standard 的分析代码。SEOMOZ.ORG 这个站,这个是什么原因啊?
GA本来的标准代码就是可以放到里面的,这是合法的,因为GA的电子商务监测方式就需要加到里面。
有的GA甚至加在之后,虽然不标准,但也会有数据。
有收获 多学习下
谢谢您的分享。……….
我自己算了一下自己博客的深度访问时间,1.3秒!
博主的博客就是厉害,需要学习的地方太多了。
关于第三点建立模型。如果“然后除以这个登陆页的浏览量”,由于浏览量的本身含有虚假的流量,那么实际上你没有剔除虚假流量的影响,你只是剔除了分子(时间)的影响,没有剔除对于分母(流量)的影响。我这样理解对么?请指教。
对的。因为流量无法区分真正假,所以才有这样的方法。作弊流量越多,分母越大,时间越短。真正有价值流量越多,看的内容越多,记录的时间就越多,分子越大,时间越长。
那么如果判断呢?是说这个值越小说明虚假流量越大么?但由于我们无法知道虚假流量的比例,从而我们虽然可以得到一个值,但仍然无法判断。除非你有一个经验的BENCHMARK值?
文章中给了一些参考。最关键的是自己与自己趋势上比较,或者不同流量来源上进行比较。这个值与bounce rate一样,其实没有所谓的benchmark。
了解了。谢谢。
郁闷,有不少landingpage的Time on Site<Time on Page,和Landing Page Time on Site的算法不太符合,不知道如何解读。
为什么我用这个跑出来的报告出现了 Page Time on Site < Page Time on Page, 这样的话出来的结果就是负的了,感觉这个报告是有问题的。难道是GA的算法出了问题吗?求解答。
如果以page作为dim的话,应该来说这种情况不会发生的吧?
宋老师,请教一下,为什么我按照你的方法做,到了第三步算出来的值才0.005,那么到第四步就没意义了。(PS:我用的是百度统计工具)
宋老师,你好啊,我是一个新手,我对监测网络广告虚假流量这块很感兴趣,但是这篇文章中的共享自定义报告访问不了,请问能再一次生成吗?谢谢
请问下,“3、建立解决模型”中的“登陆页的全站停留时间 跟 登陆页的页面停留的时间 有什么区别? 我不能理解。比如,登陆页A的全站停留时间,跟登陆页A的页面停留时间,这两个概念 读起来 是一个意思啊。 而且,我看到这篇文章是在 2009年的时候发表的,现在是2016年了,在Google Analytics中,我找不到 Time on Site 这个指标。请问我该怎么做才能弄出文章中的 实证模型。
希望得到回复,非常感谢!