五、访问者特征指标及度量
浏览器(Browser)
定义:一个用于定位和阅览HTML文档的程序(例如:Netscape Communicator、Mosaic、Microsoft Internet Explorer)。度量方法:
可以从日志文件中获得浏览器类型的信息,以此获得统计的数据。
评论:通常可以获得软件厂商的名字、浏览器的版本等信息。但是浏览器字符串(BrowserString)没有标准的格式,这是分析它的一个困难之处。
平台(Platform)
定义:访问网站的访问者使用的操作平台。
度量方法:同分析浏览器一样可以分析浏览器字符串(Browser String)来获得关于操作平台的信息。
评论:考虑到特殊的浏览器如WebTV和SEGA,称为操作平台比称为操作系统更恰当一些。它们可以通过伴随URL请求而来信息加以识别。
浏览器语言(Browser Language)
定义:浏览器所用的语言。
度量方法:可以通过浏览器字符串(Browser String)来得到浏览器的语言,HTTP_ACCEPT_LANGUAGE环境变量也可以反映浏览器所希望接收的HTML文档的语言。
评论:并不是所有浏览器都可以获得它所用的语言。使用分析日志文件的方式无法获得浏览器语言的数据。
域名(Domain Name)
定义:互联网络上对应于计算机的IP地址的文本地址,它是连接在互联网络上的计算机的正式的名字。
度量方法:度量域名实际上是考察远程计算机所在的一级或二级域(Domain),如:.com、.edu、.cn、.com.cn、.net.cn等等。REMOTE_HOST环境变量和日志文件都会记录远程计算机的主机名和域名,但并不是所有情况下都可以获得远程计算机的主机名和域名。
评论:并不是所有连入互联网络的计算机都可记录其主机名和域名,大部分计算机被记录的仍然是IP地址而不是它们的主机名和域名,对于没有主机名和域名的计算机,统计其所在域时应标明”未知”。不同的服务器及其配置,会影响到是否可以获得远程计算机的主机名和域名。可被反向解析IP地址的远程计算机往往会被记录下其主机名和域名,但是在记录日志文件时进行IP地址的反向解析将增大服务器的负荷,尤其对访问量很大的网站。可以在分析日志文件时再进行IP地址的反向解析,当然这也将减慢分析的速度。
指引链接(Referrer、Referral Link)
定义:访问者点击一个页面中的链接而被引导至当前HTML页面,则该链接是当前页面的指引链接。
度量方法:从HTTP_REFERER环境变量和对服务器日志文件的分析中可获得指引链接的信息。
评论:有时候也会遇到指引页面(Referring Page)一词,它们的意义相近,在浏览器中总是由指引的URL到达目标的URL。
六、访问者行为指标及度量
每页面请求的平均时间(Average Time Per Page Request)
定义:访问者每次多个页面请求的平均时间。
度量方法:用户会话的第一次请求至最后一次请求间的时间 ÷ (用户会话期间的页面请求数-1)。
评论:每页面请求的平均时间应该在一个比较大的范围内求得,计算用户会话时长之前应该已计算出这个值。
用户会话时长(User Session Length)
定义:一次用户会话的时间长度。
度量方法:用户会话的第一次请求至最后一次请求间的时间 + 每页面请求的平均时间。
评论:用户访问时长和用户会话时长是同一术语。
平均用户会话时长(Average User Session Length)
定义:网站访问者用户会话的平均时间长度。
度量方法:总计的用户会话时长 ÷ 用户会话数。
评论:平均用户访问时长和平均用户会话时长是同一术语。
返回访问(Return Visits)
定义:在一特定时间内,访问者在不同用户会话中再次访问网站的次数。
度量方法:度量在一特定时间内,访问者在不同用户会话中再次访问网站的次数。
评论:这一特定时间可以由进行统计的机构决定。建议的时间可以是一天或者不设置这一特定时间,后者可以表明访问者总共访问该网站的次数。返回访问的次数表明了网站的受欢迎的程度。
未完,待续……
你好. 我一直有个问题
就是如果我是一个Firefox用户, 我看网页喜欢新开一个标签页.
于是就有情况我会同时开着四五个标签页.
那么如果我有个标签页一直开着, 那么也算进去请求时间吗?
请参见:http://www.chinawebanalytics.cn/?p=159
hi, Sidney,
用户会话时长=用户会话的第一次请求至最后一次请求间的时间 + 每页面请求的平均时间为什么计算过程中最后要+每页面请求的平均时间 呢?
如果是把每页请求的平均时间当作最后一页的停留时间的话好像也没有必要呢,因为 每页面请求的平均时间=用户会话的第一次请求至最后一次请求间的时间 ÷ (用户会话期间的页面请求数-1),在计算的时候已经把最后一页排除在外了,也就是没有考虑最后一页的停留时间