网站运营数据统计-网站统计中的数据收集原理及实现

发布时间：2018-03-14 所属栏目：赵和靖为什么叫康康

一 : 网站统计中的数据收集原理及实现

网站数据统计分析工具是网站站长和运营人员经常使用的一种工具，比较常用的有谷歌分析、百度统计和腾讯分析等等。所有这些统计分析工具的第一步都是网站访问数据的收集。目前主流的数据收集方式基本都是基于javascript的。本文将简要分析这种数据收集的原理，并一步一步实际搭建一个实际的数据收集系统。

数据收集原理分析

简单来说，网站统计分析工具需要收集到用户浏览目标网站的行为（如打开某网页、点击某按钮、将商品加入购物车等）及行为附加数据（如某下单行为产生的订单金额等）。早期的网站统计往往只收集一种用户行为：页面的打开。而后用户在页面中的行为均无法收集。这种收集策略能满足基本的流量分析、来源分析、内容分析及访客属性等常用分析视角，但是，随着ajax技术的广泛使用及电子商务网站对于电子商务目标的统计分析的需求越来越强烈，这种传统的收集策略已经显得力不能及。

后来，Google在其产品谷歌分析中创新性的引入了可定制的数据收集脚本，用户通过谷歌分析定义好的可扩展接口，只需编写少量的javascript代码就可以实现自定义事件和自定义指标的跟踪和分析。目前百度统计、搜狗分析等产品均照搬了谷歌分析的模式。

其实说起来两种数据收集模式的基本原理和流程是一致的，只是后一种通过javascript收集到了更多的信息。下面看一下现在各种网站统计工具的数据收集基本原理。

首先通过一幅图总体看一下数据收集的基本流程。

图1. 网站统计数据收集基本流程

首先，用户的行为会触发浏览器对被统计页面的一个http请求，这里姑且先认为行为就是打开网页。当网页被打开，页面中的埋点javascript片段会被执行，用过相关工具的朋友应该知道，一般网站统计工具都会要求用户在网页中加入一小段javascript代码，这个代码片段一般会动态创建一个script标签，并将src指向一个单独的js文件，此时这个单独的js文件（图1中绿色节点）会被浏览器请求到并执行，这个js往往就是真正的数据收集脚本。数据收集完成后，js会请求一个后端的数据收集脚本（图1中的backend），这个脚本一般是一个伪装成图片的动态脚本程序，可能由php、python或其它服务端语言编写，js会将收集到的数据通过http参数的方式传递给后端脚本，后端脚本解析参数并按固定格式记录到访问日志，同时可能会在http响应中给客户端种植一些用于追踪的cookie。

上面是一个数据收集的大概流程，下面以谷歌分析为例，对每一个阶段进行一个相对详细的分析。

若要使用谷歌分析（以下简称GA），需要在页面中插入一段它提供的javascript片段，这个片段往往被称为埋点代码。下面是我的博客中所放置的谷歌分析埋点代码截图：

图2. 谷歌分析埋点代码

其中_gaq是GA的的全局数组，用于放置各种配置，其中每一条配置的格式为：

1_gaq.push（［‘Action’， ‘param1’， ‘param2’，..］）;

Action指定配置动作，后面是相关的参数列表。GA给的默认埋点代码会给出两条预置配置，_setAccount用于设置网站标识ID，这个标识ID是在注册GA时分配的。_trackPageview告诉GA跟踪一次页面访问。更多配置请参考：https://developers.google.com/analytics/devguides/collection/gajs/。实际上，这个_gaq是被当做一个FIFO队列来用的，配置代码不必出现在埋点代码之前，具体请参考上述链接的说明。

就本文来说，_gaq的机制不是重点，重点是后面匿名函数的代码，这才是埋点代码真正要做的。这段代码的主要目的就是引入一个外部的js文件（ga.js），方式是通过document.createElement方法创建一个script并根据协议（http或https）将src指向对应的ga.js，最后将这个element插入页面的dom树上。

注意ga.async = true的意思是异步调用外部js文件，即不阻塞浏览器的解析，待外部js下载完成后异步执行。这个属性是HTML5新引入的。

数据收集脚本（ga.js）被请求后会被执行，这个脚本一般要做如下几件事：

1、通过浏览器内置javascript对象收集信息，如页面title（通过document.title）、referrer（上一跳url，通过document.referrer）、用户显示器分辨率（通过windows.screen）、cookie信息（通过document.cookie）等等一些信息。

2、解析_gaq收集配置信息。这里面可能会包括用户自定义的事件跟踪、业务数据（如电子商务网站的商品编号等）等。

3、将上面两步收集的数据按预定义格式解析并拼接。

4、请求一个后端脚本，将信息放在http request参数中携带给后端脚本。

这里唯一的问题是步骤4，javascript请求后端脚本常用的方法是ajax，但是ajax是不能跨域请求的。这里ga.js在被统计网站的域内执行，而后端脚本在另外的域（GA的后端统计脚本是http://upload.61k.com/2012/1102/1351822048937.gif），ajax行不通。一种通用的方法是js脚本创建一个Image对象，将Image对象的src属性指向后端脚本并携带参数，此时即实现了跨域请求后端。这也是后端脚本为什么通常伪装成gif文件的原因。通过http抓包可以看到ga.js对__utm.gif的请求：

图3. 后端脚本请求的http包

可以看到ga.js在请求__utm.gif时带了很多信息，例如utmsr=1280×1024是屏幕分辨率，utmac=UA-35712773-1是_gaq中解析出的我的GA标识ID等等。

值得注意的是，__utm.gif未必只会在埋点代码执行时被请求，如果用_trackEvent配置了事件跟踪，则在事件发生时也会请求这个脚本。

由于ga.js经过了压缩和混淆，可读性很差，我们就不分析了，具体后面实现阶段我会实现一个功能类似的脚本。

GA的__utm.gif是一个伪装成gif的脚本。这种后端脚本一般要完成以下几件事情：

1、解析http请求参数的到信息。

2、从服务器（WebServer）中获取一些客户端无法获取的信息，如访客ip等。

3、将信息按格式写入log。

5、生成一副1×1的空gif图片作为响应内容并将响应头的Content-type设为image/gif。

5、在响应头中通过Set-cookie设置一些需要的cookie信息。

之所以要设置cookie是因为如果要跟踪唯一访客，通常做法是如果在请求时发现客户端没有指定的跟踪cookie，则根据规则生成一个全局唯一的cookie并种植给用户，否则Set-cookie中放置获取到的跟踪cookie以保持同一用户cookie不变（见图4）。

图4. 通过cookie跟踪唯一用户的原理

这种做法虽然不是完美的（例如用户清掉cookie或更换浏览器会被认为是两个用户），但是是目前被广泛使用的手段。注意，如果没有跨站跟踪同一用户的需求，可以通过js将cookie种植在被统计站点的域下（GA是这么做的），如果要全网统一定位，则通过后端脚本种植在服务端域下（我们待会的实现会这么做）。

注：相关网站建设技巧阅读请移步到建站教程频道。

系统的设计实现

根据上述原理，我自己搭建了一个访问日志收集系统。总体来说，搭建这个系统要做如下的事：

图5. 访问数据收集系统工作分解

下面详述每一步的实现。我将这个系统叫做MyAnalytics。

为了简单起见，我不打算实现GA的完整数据收集模型，而是收集以下信息。

埋点代码我将借鉴GA的模式，但是目前不会将配置对象作为一个FIFO队列用。一个埋点代码的模板如下：

这里我启用了二级域名analytics.codinglabs.org，统计脚本的名称为ma.js。当然这里有一点小问题，因为我并没有https的服务器，所以如果一个https站点部署了代码会有问题，不过这里我们先忽略吧。

我写了一个不是很完善但能完成基本工作的统计脚本ma.js：

（function （） {

var params = {};

//Document对象数据

if（document） {

params.domain = document.domain || ‘’;

params.url = document.URL || ‘’;

params.title = document.title || ‘’;

params.referrer = document.referrer || ‘’;

}

//Window对象数据

if（window && window.screen） {

params.sh = window.screen.height || 0;

params.sw = window.screen.width || 0;

params.cd = window.screen.colorDepth || 0;

}

//navigator对象数据

if（navigator） {

params.lang = navigator.language || ‘’;

}

//解析_maq配置

if（_maq） {

for（var i in _maq） {

switch（_maq［i］［0］） {

case ‘_setAccount’：

params.account = _maq［i］［1］;

break;

default：

break;

}

}

}

//拼接参数串

var args = ‘’;

for（var i in params） {

if（args ！= ‘’） {

args += ‘&’;

}

args += i + ‘=’ + encodeURIComponent（params［i］）;

}

//通过Image对象请求后端脚本

var img = new Image（1， 1）;

img.src = ‘http://upload.61k.com//？’ + args;

}）（）;

整个脚本放在匿名函数里，确保不会污染全局环境。功能在原理一节已经说明，不再赘述。其中1.gif是后端脚本。

日志采用每行一条记录的方式，采用不可见字符^A（ascii码0×01，Linux下可通过ctrl + v ctrl + a输入，下文均用“^A”表示不可见字符0×01），具体格式如下：

时间^AIP^A域名^AURL^A页面标题^AReferrer^A分辨率高^A分辨率宽^A颜色深度^A语言^A客户端信息^A用户标识^A网站标识

为了简单和效率考虑，我打算直接使用nginx的access_log做日志收集，不过有个问题就是nginx配置本身的逻辑表达能力有限，所以我选用了OpenResty做这个事情。OpenResty是一个基于Nginx扩展出的高性能应用开发平台，内部集成了诸多有用的模块，其中的核心是通过ngx_lua模块集成了Lua，从而在nginx配置文件中可以通过Lua来表述业务。关于这个平台我这里不做过多介绍，感兴趣的同学可以参考其官方网站http://openresty.org/，或者这里有其作者章亦春（agentzh）做的一个非常有爱的介绍OpenResty的slide：http://agentzh.org/misc/slides/ngx-openresty-ecosystem/，关于ngx_lua可以参考：https://github.com/chaoslawful/lua-nginx-module。

注：相关网站建设技巧阅读请移步到建站教程频道。

首先，需要在nginx的配置文件中定义日志格式：

log_format tick “$msec^A$remote_addr^A$u_domain^A$u_url^A$u_title^A$u_referrer^A$u_sh^A$u_sw^A$u_cd

^A$u_lang^A$http_user_agent^A$u_utrace^A$u_account”;

注意这里以u_开头的是我们待会会自己定义的变量，其它的是nginx内置变量。

然后是核心的两个location：

location /1.gif {

#伪装成gif文件

default_type image/gif;

#本身关闭access_log，通过subrequest记录log

access_log off;

access_by_lua “

-- 用户跟踪cookie名为__utrace

local uid = ngx.var.cookie___utrace

if not uid then

-- 如果没有则生成一个跟踪cookie，算法为md5（时间戳+IP+客户端信息）

uid = ngx.md5（ngx.now（）。. ngx.var.remote_addr 。. ngx.var.http_user_agent）

end

ngx.header［‘Set-Cookie’］ = {‘__utrace=’ 。. uid 。. ‘; path=/’}

if ngx.var.arg_domain then

-- 通过subrequest到/i-log记录日志，将参数和用户跟踪cookie带过去

ngx.location.capture（‘/i-log？’ 。. ngx.var.args 。. ‘&utrace=’ 。. uid）

end

”;

#此请求不缓存

add_header Expires “Fri， 01 Jan 1980 00:00:00 GMT”;

add_header Pragma “no-cache”;

add_header Cache-Control “no-cache， max-age=0， must-revalidate”;

#返回一个1×1的空gif图片

empty_gif;

}

location /i-log {

#内部location，不允许外部直接访问

internal;

#设置变量，注意需要unescape

set_unescape_uri $u_domain $arg_domain;

set_unescape_uri $u_url $arg_url;

set_unescape_uri $u_title $arg_title;

set_unescape_uri $u_referrer $arg_referrer;

set_unescape_uri $u_sh $arg_sh;

set_unescape_uri $u_sw $arg_sw;

set_unescape_uri $u_cd $arg_cd;

set_unescape_uri $u_lang $arg_lang;

set_unescape_uri $u_utrace $arg_utrace;

set_unescape_uri $u_account $arg_account;

#打开日志

log_subrequest on;

#记录日志到ma.log，实际应用中最好加buffer，格式为tick

access_log /path/to/logs/directory/ma.log tick;

#输出空字符串

echo ‘’;

}

要完全解释这段脚本的每一个细节有点超出本文的范围，而且用到了诸多第三方ngxin模块（全都包含在OpenResty中了），重点的地方我都用注释标出来了，可以不用完全理解每一行的意义，只要大约知道这个配置完成了我们在原理一节提到的后端逻辑就可以了。

真正的日志收集系统访问日志会非常多，时间一长文件变得很大，而且日志放在一个文件不便于管理。所以通常要按时间段将日志切分，例如每天或每小时切分一个日志。我这里为了效果明显，每一小时切分一个日志。我是通过crontab定时调用一个shell脚本实现的，shell脚本如下：

_prefix=“/path/to/nginx”

time=`date +%Y%m%d%H`

mv ${_prefix}/logs/ma.log ${_prefix}/logs/ma/ma-${time}.log

kill -USR1 `cat ${_prefix}/logs/nginx.pid`

这个脚本将ma.log移动到指定文件夹并重命名为ma-{yyyymmddhh}.log，然后向nginx发送USR1信号令其重新打开日志文件。

然后再/etc/crontab里加入一行：

59 * * * * root /path/to/directory/rotatelog.sh

在每个小时的59分启动这个脚本进行日志轮转操作。

下面可以测试这个系统是否能正常运行了。我昨天就在我的博客中埋了相关的点，通过http抓包可以看到ma.js和1.gif已经被正确请求：

图6. http包分析ma.js和1.gif的请求

同时可以看一下1.gif的请求参数：

图7. 1.gif的请求参数

相关信息确实也放在了请求参数中。

然后我tail打开日志文件，然后刷新一下页面，因为没有设access log buffer，我立即得到了一条新日志：

1351060731.360^A0.0.0.0^Awww.codinglabs.org^Ahttp://www.codinglabs.org/^ACodingLabs^A^A1024^A1280^A24^Azh-CN^AMozilla/5.0 （Macintosh; Intel Mac OS X 10_8_2） AppleWebKit/537.4 （KHTML， like Gecko） Chrome/22.0.1229.94 Safari/537.4^A4d612be64366768d32e623d594e82678^AU-1-1

注意实际上原日志中的^A是不可见的，这里我用可见的^A替换为方便阅读，另外IP由于涉及隐私我替换为了0.0.0.0。

看一眼日志轮转目录，由于我之前已经埋了点，所以已经生成了很多轮转文件：

图8. 轮转日志

关于分析

通过上面的分析和开发可以大致理解一个网站统计的日志收集系统是如何工作的。有了这些日志，就可以进行后续的分析了。本文只注重日志收集，所以不会写太多关于分析的东西。

注意，原始日志最好尽量多的保留信息而不要做过多过滤和处理。例如上面的MyAnalytics保留了毫秒级时间戳而不是格式化后的时间，时间的格式化是后面的系统做的事而不是日志收集系统的责任。后面的系统根据原始日志可以分析出很多东西，例如通过IP库可以定位访问者的地域、user agent中可以得到访问者的操作系统、浏览器等信息，再结合复杂的分析模型，就可以做流量、来源、访客、地域、路径等分析了。当然，一般不会直接对原始日志分析，而是会将其清洗格式化后转存到其它地方，如MySQL或HBase中再做分析。

分析部分的工作有很多开源的基础设施可以使用，例如实时分析可以使用Storm，而离线分析可以使用Hadoop。当然，在日志比较小的情况下，也可以通过shell命令做一些简单的分析，例如，下面三条命令可以分别得出我的博客在今天上午8点到9点的访问量（PV），访客数（UV）和独立IP数（IP）：

awk -F^A ‘{print $1}’ ma-2012102409.log | wc -l

awk -F^A ‘{print $12}’ ma-2012102409.log | uniq | wc -l

awk -F^A ‘{print $2}’ ma-2012102409.log | uniq | wc -l

其它好玩的东西朋友们可以慢慢挖掘。

文章来源：ucdchina.com，转载请注明出处。

注：相关网站建设技巧阅读请移步到建站教程频道。

二 : 赵和靖：赵和靖-运动生涯，赵和靖-数据统计

赵和靖（1985年5月19日－），出生于重庆，足球运动员。现效力北京国安，司职右后卫，是一个一个具备成为优秀中后卫潜质的重庆男孩，有可能成为重庆足球未来的代表人物。赵和靖是马林担任主教练时，于2005年把他从二队调到一队，2006年，赵和靖成为球队主力。

赵和靖_赵和靖 -运动生涯

(www.61k.com]重庆力帆时期

重庆力帆时期赵和靖是马林担任重庆力帆主教练时，于2005年把他从力帆二队调到一队，2006年，赵和靖成为球队主力。

2005年7月3日，冠城的比赛是他的中超的“处子秀”，眼看要获得成功，却被突如其来的裁判“黑手”所扼杀，尤其是禁区内无意手球被吹罚点球的赵和靖，更是难过之极。不过没有任何人责怪他们，相反，包括力帆老板尹明善、力帆主帅马林等都向他俩伸出了大拇指，给予了高分。

在2007年4月7日进行的中甲联赛第二轮比赛中，现场球迷大为不解：重庆力帆的场上队长是年轻的赵和靖。而此前的所有消息都说，力帆队2007的场上队长是老将王锴。力帆队主教练魏新在比赛结束后解释说：“力帆队队长还是王锴，今天的队长之所以是赵和靖，是因为他特别想当一次队长，所以就让他当一次队长。”遗憾的是，在当天进行的比赛中，力帆以1：3负于广州医药队。不过，魏新没有抱怨这个“临时队长”，他说：“赵和靖和王锴一样，表现非常不错。”

大连阿尔滨时期

赵和靖2010年底，重庆力帆再度降入中甲，赵和靖与队中11名球员被挂牌。原本有消息称重庆力帆为他定下的身价为300万元，天津泰达就价格问题与重庆力帆进行了协商，最终赵和靖却和同在重庆力帆的吴庆、金尼（重庆力帆自长春亚泰租借）共同去了中甲升班马大连阿尔滨。据称他和吴庆两人的总转会费为200万人民币左右。

加盟大连阿尔滨后，赵和靖成为球队后卫线上的绝对主力，截至大连阿尔滨提前夺冠时（前23轮）他为球队出场1980分钟，除了第9轮因为累计黄牌停赛，他打满了其余22轮比赛，是全队出场最多的球员。

2010年10月15日，赵和靖随球队在家乡重庆面对老东家重庆力帆，球队最后以4-1取胜，提前夺冠升入中超。加盟大连阿尔滨后，赵和靖亦获得了很高的工资待遇。工资奖金非常优厚，报道称其工资比他2010年征战中超时翻了一番。

在转投阿尔滨第一年，赵和靖在中甲尚能打上主力中后卫，可到了中超，他的身材就迫使他不得不转型成为边后卫。这让赵和靖度过了一段异常艰难的岁月。可最终，他还是凭借自己出色的折返能力和奔跑速度坐稳了阿尔滨的主力边后卫位置。赵和靖自己也感叹到：“以前是过得太安逸了。在外面才知道竞争是如此激烈，如果不逼迫自己去进步，就只能被淘汰。”

2013赛季赵和靖以右后卫身份为阿尔滨出场27次，均是首发，堪称队内的绝对主力。在联赛后期，他甚至还两度用进球帮助阿尔滨分别绝杀申花和舜天。2013年是他3+1合同的第三年末，据报道阿尔滨老板赵明阳甚至亲自出面和他谈续约。但或许是心有所属，赵和靖没有选择和阿尔滨续约。据《足球》报报道，他的目标是投奔当年执教阿尔滨时极为看重他的斯塔诺。

赵和靖的合同在2013年年底到期，但是他一直不肯跟阿尔滨续约，最后是老板赵明阳亲自出马跟他谈续约的事情，也被他婉言谢绝了。他表示，“自己在阿尔滨也踢了很久了，想要换个环境出去闯闯，感受一下不同的球队氛围。”赵和靖在当时没有着明确表示将转会去哪里，不过足球圈很小，基本上藏不住什么秘密。据悉，赵和靖离开阿尔滨后，最有可能的就是投奔早就对他有意的北京国安。

赵和靖本身不是大连人，所以能否留在大连效力并不是他考虑的首要因素，他最关心的应该是待遇以及发展前景。北京国安毕竟能够打亚冠，俱乐部一直非常稳定，关键是有1个非常熟悉自己懂得如何使用自己的主教练，所以赵和靖的选择也是很理性的。另外，跟他关系最好的刘宇也要离开阿尔滨了，这俩人一向是形影不离，如果刘宇走了，赵和靖1个人在阿尔滨也会很孤单，所以他索性也离开了。

其实促使赵和靖不续约的还有1个重要原因，那就是赵宏略的回归，以及未来这个位置上其他球员的进1步引进和补充。赵和靖或许担心，一旦赵宏略回来的话，他的主力位置就会受到比较大的威胁，那么好不容易打上主力的他如果再次回到板凳上肯定是于心不甘。加上国安在右后卫位置上确实需要人手，这样才彼此成全了。

北京国安时期

赵和靖是以自由身的身份离开阿尔滨的。2014年1月3日北京国安俱乐部与赵和靖签订了为期三年的工作合同。
2014赛季北京国安对阵广州富力的比赛中，国安左后卫赵和靖对富力球员犯规，富力球员倒地不起，主裁判石祯禄吹停了比赛，然后就跑向犯规的赵和靖并作出套牌动作。不过石祯禄很快就发现自己没有带黄牌，口袋里只有红牌，他只能赶紧跑向场边的第四官员拿一张黄牌，然后向赵和靖出示。

赵和靖_赵和靖 -数据统计

赛事时间主队比分客队进球点球乌龙黄牌红牌中超2012-03-十八大连阿尔滨3 - 三大连实德00100中甲2011-08-0七大连阿尔滨3 - 1延边长白虎10000中超2010-08-18广州富力2 - 2重庆力帆00100中超2010-05-16上海申鑫2 - 5重庆力帆00001中超2010-04-24上海申花1 - 2重庆力帆10000合计20201

赵和靖_赵和靖 -个人荣誉

职业履历赛季俱乐部号码出场进球国家联赛等级排名20十二大连阿尔滨3270中国1520十一大连阿尔滨3中国212010重庆力帆3271中国172009重庆力帆3250中国1362008重庆力帆3231中国222007重庆力帆3211中国242006重庆力帆15190中国1152005重庆力帆2670中国114
2011年中国足球联赛甲组冠军

赵和靖_赵和靖 -人物评价

加入国安
赵和靖曾经是阿尔滨俱乐部唯一的右后卫，也是绝对主力，在他的位置上一直没有什么合适的人选能够和他竞争，他也是阿尔滨的主力阵容中出场率最高的球员之一。赵和靖是阿尔滨俱乐部的“老人”了，是随着球队从中甲一路踢上来后，唯一1个从中甲到中超还一直占据主力位置的球员了。其余的一些阿尔滨旧臣都是走的走，卖的卖，替补的替补，只有赵和靖历经了几任主教练更迭后，却依然能够稳稳占据绝对主力的位置，并且深得各位主教练欣赏。

三 : 企业网站和个人网站需要注重的一组网站运营数据

分辨率：1280PX

接近九成以上的用户使用的是1280以上
分辨率的宽屏显示器

访问量：100IP

鲜有未做付费广告的企业级官网
平均日独立访问量能超过100次

搜索排名：3/5SITE

3/5的企业级官网由于缺少有效的搜索引擎
优化而无法获得较好的自然排名

等待时间：5Sec.

大多数浏览者等待网站打开的时间
耐心不超过5秒左右

浏览兴趣：10Sec.

任何网站10秒钟内未能使浏览者建立浏览兴趣
网站很快就会被关闭掉

阅读文字：90Sec.

除非特别必要，很少有浏览者在单一页面花费
90秒以上的时间阅读文字

更新维护：70%

70%以上的企业官网由于缺乏有力的更新维护
而丧失了网站的生命力

在线沟通方式：80%

超过80%的浏览者倾向选择用在线沟通方式
进行联系沟通

移动互联：90%

90%的企业用户至今仍不知道如何应用
移动互联网来助力企业发展

四 : 《数据中国》网站计划书

一、网站核心内容：

A、中国最真实的个人资料数据中心

B、中国最庞大的

C、和现实社会并行的网络社会

二、超越web2.0网络形式

A、网络上面真实存在的人（博客红人），绝大部分和现实生活中的面目绝然不同

B、因此，网络上面的无形资产，没有办法在现实生活中得到使用---换取现实生活中的名与利。

C、由于虚拟社会并不真实的基础资料，造成信息交换的便利，远远没有得到开发。《世纪佳缘》仅仅因为有一定真实性，已经取得了巨大的成绩。但对于它的会员来说，这个资源仅对精神交流具备一定的安全性，还不能用来参与物质交换交易。

三、《数据中国》的实现步骤

1、使用世界最好的数据库（老孙）

2、设计必要模版

3、确认吸引网民注册的入手点

A、中国同学录---（详细资料见附件）

B、百家姓----（详细资料见附件）

C、中国最大的效果最好的网络广告网（点击广告换彩票）---（详细资料见附件）

D、中国网络个人信息确认中心，为所有网站提供配套服务---（详细资料见附件）

四、资金需求状况

1、初始阶段-------50—100万（天使投资）

主要用于网站建设、基础数据充实、团队搭建、办公环境等

2、升级阶段-------50万

整合资源的费用----寻求福彩、体彩、广告招商（易维九通）等机构的合作，建设配套队伍。

必要的地面渠道建设推广

完善公司形象。

3、发展阶段------千万美元以上（风险投资）

迅速拓展网站功能，为百姓提供更多的综合的服务，打败淘宝，超越腾讯，让游戏供应商为我们打工，搜索引擎是我们最大的客户。

附件一：

《中国同学录》

一、进得来：

网民都有搜索自己姓名、母校、班级的喜好。

我们网站关键词中，把每个学校校名、年级、班级名（可多写）、本校名人（校长、知名校友）等个人喜好搜索的关键字作重点优化推广。让网民一搜即得。

二、看得懂

点击进来马上看到一个好的界面，浓重的友情，并通过简短的文字明确同学的义务、友情的价值（关系网）。目前正在火热的各种圈子能说明这类的需求非常强烈，

重点突出网站的功能：网电的功能--—分分钟回到校园，找到属于你的童年、少年，

重要功能如需密码进入，密码可以设置选择班主任、班长的名字、某人的绰号等。

三、粘得住

网电良好的在线语音、视频、文字留言功能，同学通讯录功能。

点击广告后，可以免费接通成员的普通电话、移动电话，短消息留言等。

四、回得来

中国网址域名 www.09cn.com

便于记忆的二级域名：www.09cn.com/jsxzyz1987-64 (江苏徐州一中1987届6年级4班)

口碑宣传的理由：可以替亲人（家长）申请。

每个会员都有自己的个人网页。

五、重点：

A、多属性填写个人资料，方便数据库多种形式（家族祖籍、现居地、职业、行业、专长、兴趣、婚姻状况、身份证号码……可分级补充填写）调用，扩展交友功能。

B、联系百家以上的企业，投放点击付费的广告。多属性分类（希望哪个年龄段的人查看广告、性别、职业特点、所在城市、兴趣方向、收入范围、身高、胖瘦……），便于定向推荐广告。

C、支持会员多属性查询、学习。

D、seo

附件二：

《百家姓》

一、进得来

网民都有搜索自己姓名、母校、班级的喜好。

把百家姓的相关的发源、谱系、本族名人、历史掌故等SEO

附件三：

《点广告，得彩票》

凭身份证在所属城市领取彩票、奖项等，同步确认个人诚信指数参考。

附件四：

《数据中国》

为电子商务、婚恋交友等网站，提供认证参考服务（会员分10等级）。

本文标题：网站运营数据统计-网站统计中的数据收集原理及实现
本文地址： http://www.61k.com/1120866.html

上一篇： 360诉腾讯垄断案-腾讯不断注资金山网络能否抵挡奇虎360
下一篇：城市让生活更美好作文-城市更新应尊重文化和生活

61阅读

网站运营数据统计-网站统计中的数据收集原理及实现

网站统计数据分析报表

网站运营数据分析

企业网站运营