第一章 調查介紹
一、調查背景
中國網民人數與結構特征、互聯網基礎資源、上網條件和網絡應用等方面情況的信息,對國家和企業掌握互聯網絡發展動態和決策有著十分重要的意義。1997年,經國家主管部門研究,決定由中國互聯網絡信息中心(CNNIC)聯合互聯網絡單位共同實施這項統計工作。為了使這項工作正規化、制度化,從1998年起,中國互聯網絡信息中心于每年1月和7月發布《中國互聯網絡發展狀況統計報告》。統計報告發表后,受到各個方面的重視,被國內外廣泛引用。本次為第21次調查。
該項工作得到了信息產業部等國家主管部門的大力支持,各互聯網單位、調查支持網站以及媒體等也對中國互聯網絡信息中心的調查工作給予了支持與配合,保證了中國互聯網調查工作的順利進行。在此,謹對他們的支持與努力表示衷心的感謝。
二、報告術語界定
◇ 網民
中國互聯網絡信息中心(CNNIC)對網民的定義為:半年內使用過互聯網的6周歲及以上中國公民。澳門報告中仍舊沿用 “平均每周上網一小時及以上”的網民定義。
◇ 手機網民
指半年內曾經通過手機接入互聯網的網民,但不限于僅通過手機接入互聯網的網民。
◇ 農村網民
指目前居住在農村的網民。
◇ 家庭上網計算機
指在居民家庭中連入互聯網的計算機,包括臺式機和筆記本電腦。
◇ IP地址
IP地址的作用是標識上網計算機、服務器或者網絡中的其他設備,是互聯網中的基礎資源,只有獲得IP地址(無論以何種形式存在),才能和互聯網相連。
◇ 域名
本報告中僅指英文域名,是指由點(.)分割、僅由數字、英文字母和連字符(-)組成的字串,是與IP地址相對應的層次結構式互聯網地址標識。常見的域名分為兩類:一類是國家或地區頂級域名(ccTLD),如以.CN結尾的域名代表中國;一類是類別頂級域名(gTLD),如以.COM,.NET,.ORG結尾的域名等。
◇ 網站
是指以域名本身或者“WWW.+域名”為網址的web站點,其中包括中國的國家頂級域名.CN和類別頂級域名(gTLD)下的web站點。如:對域名cnnic.cn來說,它的網站只有一個,其對應的網址為cnnic.cn或www.cnnic.cn,除此以外,whois.cnnic.cn,mail.cnnic.cn……等以該域名為后綴的網址只被視為該網站的不同頻道。
◇ 靜態網頁
指URL中不含“?”和輸入參數的網頁,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。
◇ 動態網頁
指URL中含“?”或輸入參數的網頁,包括ASP、PHP、PERL、CGI等在Server方進行處理的網頁。
◇ 網頁的更新周期
指網頁的最后更新日期與搜索網頁時的時間差。
◇ 調查范圍
除非明確指出,本報告中的數據均不包括香港、澳門和臺灣地區在內。
◇ 調查數據截止日期
本次調查統計數據截止日期為2007年12月31日。
三、調查方法
依據統計學理論和國際慣例,在前20次調查工作基礎之上,本次調查采用了網下抽樣、網上聯機、網上自動搜索和統計數據上報的調查方法。
(一)電話抽樣調查
電話抽樣調查側重于了解中國網民數量與結構特征、上網條件、網絡應用、網民觀點和非網民狀況。目標總體細分如下:
? 子總體A:有住宅固定電話的居民
? 子總體B:住校的高等院校學生
? 子總體C:沒有住宅電話的居民,再細分為:
? 子總體C1:有小靈通(無線市話) 的居民
? 子總體C2:有手機(移動、聯通)的居民
? 子總體C3:無任何移動電話的居民
小靈通屬于無線市話,接聽免費,從訪問實施的角度看,住宅固話與小靈通在局號上無法區分,合并兩者。即子總體A和子總體C1可以合為一個子總體訪問。從訪問實施的角度看,可以劃分如下:
? 子總體A+C1:有住宅固定電話(含小靈通)的居民
? 子總體B: 住校的高等院校學生
? 子總體C2: 無住宅固定電話,有手機的居民
? 子總體C3: 無住宅固定電話、無手機的居民
此次只針對子總體A+C1、B、C2進行調研,抽樣樣本總數為46,300個。不對子總體C3調研的原因在于,子總體C3中的網民規模較小,考慮到隨著社會經濟的發展,此部分人群會越來越少,忽略不訪問。
1.子總體A+C1抽樣方法
◇ 抽樣方法
電話調查的抽樣方法是分層二階段抽樣,目的是使所抽取的樣本近似接近自加權樣本。考慮到第21次調查的結果不僅要估計全國的情況,還要估計各省的情況,所以先按省分層,在各個層中獨立抽取樣本,然后再在省內各地市分配樣本。
◇ 抽樣指標
在確定各省樣本量時,考慮的指標是“住宅電話覆蓋6歲及以上的人數”。確定省內地市州樣本量時,省下所有地市州都被抽中,采用地市州的“人口和經濟指標”建立回歸預測模型,估計該地市州的住宅電話數目,并將該地市州的住宅電話數目作為抽樣指標,樣本量按每個地市州住宅電話數占全省住宅電話數比例分配。
◇ 樣本量
各省樣本量根據第19次調查各省網民人數的平方根占各省網民數平方根之和的比例進行分配,不足600個樣本的省份補足到600個。綜合考慮精度與成本,最終樣本確定為31,802個。
◇ 實施方式
根據每一地區的固定電話局號生成電話號碼,隨機排列之后撥打,對其中的家庭電話進行訪問。為提高訪問成功率,采取方便原則,接電話的居民即為被訪者。訪問被訪者的上網基本情況,同時詢問其他家庭成員的性別、年齡、是否上網等基本情況。
◇ 加權方式
利用家庭成員的性別、年齡和學歷等基本情況對樣本總體進行相應加權調整,減少接電話的家庭成員不隨機對樣本造成的偏差。
◇ 抽樣調查成功率
按美國輿論研究協會(AAPOR)成功率公式三計算,本次抽樣調查成功率為36.5%。
2.子總體B抽樣方法
◇ 抽樣方法和樣本量
子總體B指在校高校學生。綜合考慮成本與精度,有效樣本量設定為4000個,即全國范圍內抽取200所高校,每校抽取20 間宿舍,每宿舍訪問1 人。抽樣方法是分層三階段抽樣,使最終樣本為近似自加權樣本。分層指標為省份(31個省份)和學校層次(本科、專科),共分為62層(31×2=62)。每層應抽取的學校數目=該層學生數占全國學生總數的比例×200。
◇ 抽樣指標
理想的抽樣指標應該是住校的學生人數,由于抽樣框的限制,實際采用的抽樣指標是在校學生人數。
◇ 實施方式
根據抽中學校的固定電話局號生成電話號碼,隨機排列之后進行撥打,對其中的宿舍電話進行訪問。考慮到同宿舍的人同質性較高,采取方便原則,接電話的學生即為被訪者。
3.子總體C2抽樣方法
◇ 抽樣方法和樣本量
子總體C2指無住宅市話,有手機的6歲及以上居民。為保證調查的實施,同時綜合考慮成本與精度,樣本量在各省的分配按照各省移動電話的卡數占全國的比例分配,樣本量不足150個的省份補足到150個。總體C2樣本量為10,498個。
◇ 抽樣指標
理想的抽樣指標應該是“無住宅市話的實際手機用戶數”,但是沒有這個指標的詳細數據。實際抽樣指標是信息產業部公布的各省手機用戶卡數。
◇ 實施方式
根據手機號段隨機生成手機號碼,撥打甄別出屬于子總體C2的被訪者,直到完成所要求的子總體C2樣本量。
(二)網上調查
網上調查重在了解典型互聯網應用的使用情況。中國互聯網絡信息中心(CNNIC)在2007年12月8日~12月31日進行了網上調查。將問卷放置在中國互聯網絡信息中心(CNNIC)的網站上,同時在政府媒體網站、全國較大ICP/ISP網站與各省的信息港上設置問卷鏈接,由網民主動參與填寫問卷。回收問卷后,通過技術手段進行答卷有效性檢驗,篩除無效答卷。網上問卷調查得到各大網站的大力支持和廣大網民的熱情參與。本次網上調查共收到調查問卷73,332份,經過有效性檢查處理得到有效答卷69,556份。
(三)網上自動搜索與統計數據上報
網上自動搜索主要是對域名、網站數量及其地域分布等指標進行技術統計,而統計上報數據主要包括IP地址數和網絡國際出口帶寬數。
1.IP地址總數
IP地址分省統計的數據來自亞太互聯網信息中心(APNIC)和中國互聯網絡信息中心IP地址數據庫。將兩個數據庫中已經注冊且可以判明地址所屬省份的數據,按省分別相加得到分省數據。由于地址分配使用是動態過程,所統計數據僅供參考。同時,IP地址的國家主管部門信息產業部也會要求中國IP地址分配單位(如中國電信、中國網通等)每半年上報一次其擁有的IP地址數。為確保IP數據準確,中國互聯網絡信息中心(CNNIC)會將來自APNIC的統計數據與這些上報數據進行比較、核實,確定最終的IP地址數。
2.中國域名總數和網站總數
以下兩部分數據相加,即可得到中國的網站和域名總數、分類數與地域分布等數據。
第一部分是.CN下的域名數和網站數,由中國互聯網絡信息中心(CNNIC)采用計算機網上自動搜索得到;第二部分是中國類別頂級域名與網站數,由國內各類別頂級域名注冊單位協助提供。這些數據包括:所有類別頂級域名(gTLD)和域名下已開通的網站數;按.COM、.NET、.ORG分類的類別頂級域名(gTLD)和網站數;按注冊單位所在省份分類的類別頂級域名(gTLD)和網站數。
3.網頁數
采用計算機網上自動搜索,對抽取的網站從其首頁(WWW+域名)開始搜索,通過網頁上的層層鏈接,抓取所有屬于該網站的網頁特征及其文本內容。將由網頁搜索所獲得的所有中國網站的網頁數和網頁字節數分別相加,得到中國網頁總數及網頁字節數。該總數不含內容相同的重復網頁。
4.網絡國際出口帶寬數
信息產業部通過電信企業的報表制度,定期得到中國各運營商與其他國家和地區相連的網絡出口帶寬總數。《中國互聯網絡發展狀況統計報告》中納入了這些上報數據。
|