sina.com.cn
新浪首页 | 免费邮件 | 用户注册 | 网站地图

   
新闻中心

新浪首页 > 新闻中心 > 国内新闻 > 来稿 > 正文
您还可以通过
新浪点点通软件
摩托罗拉6188手机
爱立信R320sc手机
西门子3518i手机
浏览新浪网新闻


CNNIC对《中国互联网络网站影响力调查报告》作出说明

http://www.sina.com.cn 2000年07月28日14:23 来稿

  1、网站影响力调查的来龙去脉

  1997年11月,在进行第一次《中国互联网络发展状况统计报告》的调查中,有大量的网民反映当时的中文信息太少,许多网民向我们建议,在以后的调查中,增加“最常访问的网站”这一问题,以便使广大网民能够了解到优秀的中文网站。

  从第二次《中国互联网络发展状况统计报告》调查至今,互联网络网站影响力调查已进行了五次。一个由网民建议的调查问题能够引起社会各界的普遍关注,是我们当时没有预料到的。网站影响力调查随着中国互联网络事业的蓬勃发展,显示出越来越重要的意义。

  首先,通过调查,可以使我国的政府、企业、每个人通过了解网站在网民中的影响力来较好的把握目前我国各网站的发展状况;

  其次,通过调查,可以使我国的各网站了解自己在整个大环境中所处的位置,及时发现自身的不足,学习优秀网站的长处,使自己做得更好,从而使得整个环境能良性的发展;

  再次,通过调查,可以把我国的优秀网站推荐给我国广大网民,同时也将把它们推荐给世界,以促进我国的网站走向世界。

  1998年7月、1999年1月第一、第二次网站影响力调查结果排名第一的为“网易”,1999年7月、2000年1月和7月第三到第五次排名第一的为“新浪”。社会各界普遍认为网站影响力调查为中文网站的发展和优秀网站的推出起到了一定的推动作用。

  2、网站影响力调查的基本方法

  在《中国互联网络发展状况统计报告》问卷中,设立“最常访问的网站”一栏进行网民问卷调查。网站影响力调查采用的是国际通行的联机调查方式。在问卷中“最常访问的网站”一栏,网民可填写一到五个最常访问的网站名称,重复填写同一网站只作一个计算,而且排名不分先后。

  问卷的统计,采用经专家论证的统计程序计算。统计程序的执行,通过相应的技术保证使任何人都不可能修改统计结果。

  3、非正常问卷的演变情况及统计中的排除技术发展

  在所有5次调查中,我们将所有个人资料及问卷答案作为特征值处理。

  在第一次、第二次网站影响力调查统计中,非正常问卷主要有两类:一类是许多网民以为问卷提交不成功,多次重复发送;第二类是问卷还未填写完成,错误操作提交。我们通过对同一IP地址、同样特征值问卷及未完成问卷进行了排除。

  在第三次调查中,我们发现有同样IP地址填写“最常访问网站”的情况出现,其特征值有明显的人为痕迹,如大部分特征值相同,只有小部分特征值有变化。我们对同一IP地址选择同一网站的问卷,通过程序进行排除。

  在第四次调查中,随着网站影响力调查知名度的提高,以及上次出现的人为问卷情况,我们预先在问卷中增加了身份证号码这一特征值,并采取问卷加密等排除技术。用身份证号码检查可以很容易地排除掉重复问卷。问卷加密技术是指通过对网民访问问卷的时间等环境参数进行加密,以保证最后提交的问卷与访问时的问卷是同一问卷。实践证明,这种方法有效地排除了机器自动复制问卷以及复制问卷人工填写的情况。

  在第五次即这次调查之前,一方面网站越来越看重网站影响力调查,另一方面我们也通过不同渠道得知,一些网站将采取更为先进的技术手段来炮制有利于自身排名的问卷。为此,我们专门在调查前,成立了技术攻关小组,同时多方面咨询统计专家的意见和建议,制定了较为完备的应对方案。

  首先,我们按照统计专家的意见,对这次统计方式进行了重大改革,将整个调查分成两个阶段:在第一阶段,我们进行中国互联网络发展状况调查,没有涉及到“最常访问网站”这个问题,而是询问用户是否愿意参加最常访问网站调查。

  在第一阶段返回的问卷中,我们在采用以往的技术基础上,又采用了用户个人特征值比较、局部抽样验证、身份验证等10多种技术。

  其中,用户个人特征值比较技术是指对用户的某一特征值(如地址)进行比较,如同一用户地址(一个宿舍)有几百人填写了我们的问卷,就将此类问卷排除。前一段时间,新闻报道中某些人有组织地雇用大学生填写问卷的情况就出现在第一阶段;

  局部抽样验证技术是指对同一个大地址下(如某一单位不同的门牌号)问卷的样本进行抽样,对抽样问卷用户通过电话联系等形式进行身份验证,询问其是否填写了问卷,如抽样用户中有相当比例的用户没有填写问卷,我们将把这一大地址下的所有问卷全部排除。

  身份验证技术是指通过给愿意参加调查活动的网民以信件、电话、EMAIL、或相结合的方式,告知其用于参加调查所需的用户名和口令,从而间接验证了用户的地址、姓名、EMAIL地址等个人资料的正确。

  通过对第一阶段回收问卷的多种排除技术处理,我们在第二阶段共发出367457份网站影响力调查问卷,每份问卷均有用户名和密码。第二阶段,我们通过上述技术及现在不便公开的技术,在收到的245680份问卷中又排除39956份问卷。

  在第二阶段中,我们采用了抽样调查的方法,对联机调查的统计结果进行了比较、验证。第二阶段进行抽样调查也是此次调查的一大特色。它采用经过专家论证的科学抽样办法,完全在另一独立的用户样本来源中进行调查统计,也就是说,抽样调查的样本与联机调查的样本互不相干,两个完全不同样本来源的统计数据能够更好地相互验证。从最终的调查统计结果看,抽样调查的结果与采用多种排除技术后的联机调查统计结果有很好的吻合度,证明我们的排除技术与抽样调查有很高的可信度。

  综上所述,分阶段调查是我们的第一道“防火墙”;多种排除技术是我们的第二道“防火墙”;抽样调查验证是我们的第三道“防火墙”。三道坚固的“防火墙”保证了统计结果的高可靠度。

  随着互联网技术的高速发展,网站影响力调查中的造假与打假的斗争还将继续下去。在以后的网站影响力调查中,我们将继续开发使用新的排除技术,同时还将加大抽样调查的力度,保证网站影响力调查的科学性、可靠性、客观性。

  4、关于涉及非正常问卷网站的应对措施

  互联网络经济本身是一个高速发展的新经济,要形成一种规范的、正常的市场游戏规则,需要一段时间。此次联机调查中出现的不正常问卷,涉及到部分网站。我们已向出现此类情况比较突出的网站发出了非公开通知,提醒这些网站关注此类情况。

  对于此次联机调查过程中所出现的一些不正常情况,目前还没有相应的适用法规来进行处理。同时,网站也需要有一个规范操作的过程,在非公开通知中,我们只是讲了一些客观的情况,没有进行定性。

  作为中国互联网事业发展的见证者,我们不情愿看到有一天由CNNIC来公布这些不正常问卷涉及的网站。因为这不仅会使这些网站,而且会使我国整个互联网事业蒙受羞辱。

  我们呼吁广大的新闻媒体积极发挥舆论监督职能,防止此类现象再次出现。

  5、网站影响力调查以后的发展

  我们将继续开发使用新的排除技术,并且随着互联网事业的发展,改进和完善我们的调查统计方法。根据互联网的发展状况和社会各界给予我们的支持,我们将继续网站影响力调查,并且做得更好、更广泛、更深入。这次新推出的中国互联网络影响力分类网站排名,就是一种新的尝试。

  6、CNNIC对整个事件的看法

  我国互联网事业在近几年一直持续迅猛发展,网民规模日益壮大。参加CNNIC统计调查的网民人数在不到3年的时间里,从1802人增加到573902人,包括这次事件,都说明互联网越来越受到人们的关注,这是一个非常可喜的现象。

  我国互联网经济市场规则的完善还需要一个渐进的过程,有关法规的出台与实施需要一个正常的周期。在这种状况下,新闻舆论监督可以有力地促进互联网事业的健康发展。

  互联网的发展迫使我们通过不断的学习来提高自己。新闻舆论的关注和鞭策是我们不断学习、进步的强劲动力。我们感谢广大新闻媒体对CNNIC及其网站调查工作的关注,并愿意和更多的朋友携起手来,共同为我国互联网事业发展作出新的贡献。

  中国互联网络信息中心(CNNIC)

  2000年7月27日

发表评论】【关闭窗口

 相关链接
CNNIC中国互联网络网站影响力调查排名 (2000/07/27 14:37)
CNNIC公布最新《中国互联网络网站影响力调查报告》 (2000/07/27 11:13)
CNNIC最新报告:中国上网用户已达1690万 (2000/07/27 12:16)
CNNIC评选结果揭晓 新浪第三次名列第一 (2000/07/27 11:11)
 新浪推荐
特别报道:协和式客机在巴黎上空坠毁
新浪奥运专题网站
趣味心理测试
2000高考专栏
中韩足球对抗赛
沪深股市2000年中报
网上学电脑学上网
新浪网勤工俭学信息留言版






新闻查询帮助及往日新闻

网站简介 | 用户注册 | 广告服务 | 招聘信息 | 中文阅读 | RichWin | 联系方式 | 帮助信息

Copyright (C) 2000 SINA.com,Stone Rich Sight. All Rights Reserved

版权所有 四通利方 新浪网
本网站由北京信息港提供网络支持