您好,欢迎来到皮书数据库!
您现在所在的位置:首页
更多>> 课题组动态
更多>> 皮书作者
王伟光
  男,汉族,1950年2月出生,山东海阳人。1967年11月参加工作,1972年11月加入中国共产党,博士研究生学... 详情>>
李 扬
  1951年9月出生,籍贯安徽,1981年、1984年、1989年分别于安徽大学、复旦大学、中国人民大学获经济学学... 详情>>
李培林
  男,山东济南人。博士,研究员,中国社会科学院副院长,中国社会学会副会长,中国社会科学院社会学研究所副所长。《社会... 详情>>

    应用Kish表入户抽样被访者年龄结构扭曲问题研究

    作者:张丽萍 出版时间:2013年09月

    一 问题的提出

    抽样是科学研究的重要方法。样本能否具有很好的代表性且能推断总体,取决于抽样是否科学。概率样本是保证抽样科学和样本具有较好代表性的必要条件。获得概率样本的重要前提是有完整、准确的抽样框。在一般的社会科学调查中,往往很难获得全部被访查者完整、准确的抽样名单,这一方面是由于建立被访者抽样框需要高额的成本,另一方面是及时维护、更新被访者的个人信息非常困难。在具体抽样实施过程中,往往采取多阶段、分层、整群等抽样方法来确保在抽样科学的基础上降低抽样成本。在多阶段入户调查抽样设计中,最常用的抽取最终被访者的方法是:首先根据家庭户抽样框抽取家庭户,然后再对户内适合的调查对象进行抽样。由于家庭户规模大小不同,因此在不同规模家庭中适合的调查对象被访者被抽中的概率不同,这样就造成了入户抽样被访者特征指标分布与总体分布不一致的问题。这种问题的解决方法只能是通过对样本进行概率加权,但由于多阶段、分层、整群等抽样设计的复杂性和被访者缺失、无应答等问题,使得对每个抽样样本的加权变得非常复杂。因此,在入户抽样阶段应尽量减少偏差或避免复杂抽样的样本加权。为了确保被访者抽样偏差的最小或样本加权的简单易行,这就需要研究一套科学可行的方法来解决上述问题。

    Kish表是L.Kish针对入户抽样的上述问题在20世纪40年代末根据美国的人口和家庭情况设计的。目前Kish表已经广泛地应用在世界各国入户抽样调查的选样调查中。但是20世纪中期设计的Kish表能否适合目前中国国情或其他人口和家庭特征,需要仔细检验和深入研究。本文就是从Kish表在中国的具体应用问题出发,对中国目前应用Kish表入户抽样被访者年龄结构扭曲问题进行研究并提出解决的办法,目的是尽量减少入户调查的抽样偏差。

    二 研究数据来源与方法

    1.研究数据来源

    为了研究应用Kish表在入户抽样数据的代表性和可能的系统偏差以及在当前中国的调查实地操作时所面临的问题,本文以“2008年中国社会状况综合调查”入户登记表数据为例,分析被访者抽样分布偏差的来源。

    “2008年中国社会状况综合调查”是中国社会科学院社会学研究所于2008年5~9月,采用多阶段、分层、系统抽样方式,成功入户访问了7139位年龄在18~69岁的城乡居民(其中7046位被访者是应用Kish表在家庭户中抽样获得的),样本覆盖全国28个省自治区、直辖市的135个县(县级市/区/旗)、257个乡(镇/街道)和520个村(居)委会,这次调查的具体抽样过程是:以2000年人口普查的区市县统计资料为基础进行抽样框设计。第一步,采用城镇人口比例、居民年龄、教育程度、产业比例4大类指标7个变量,对东中西部的2797个区市县进行聚类分层,在划分好的37个层中,采用PPS方法抽取134个区市县;第二步,在抽中的每一个区市县中,采用PPS方法抽取2个乡(镇/街道);第三步,在抽中的每一个乡(镇/街道)中采用PPS方法抽中2个村(居)委会;第四步,收集抽中的村(居)委会中所有居民个人或家庭的名单资料;第五步,在此抽样框中,采取PPS方法抽中被访住户,对于一户中有多个家庭居住的,按随机数表抽取其中一个家庭访问;如果抽中的住户是集体户,则按集体户抽样,适用随机数表抽取被访者;第六步,对于抽中家庭,将该家庭中所有人的情况填在《家庭人口登记表》中,包括与答话人的关系、性别、年龄;第七步,把《家庭人口登记表》中18~69岁并且可接受访问的人口按“先排男性,后排女性;在同一性别中,按年龄由大到小排列”的规则进行排序,并按此顺序将成员的性别和年龄填在《Kish选样表》中;第八步,用Kish表进行入户抽样。

    根据上述抽样步骤和方法,抽取被访者,入户登记的基本情况见附表1-1。

    附表1-1 调查登记(家庭户抽样部分)基本结果

    本项研究之所以采用上述数据,一方面是由于本次调查的抽样设计完全按照概率样本的抽样调查进行科学设计,另一方面是本次调查的数据除了包括对被访者的调查信息外,还包括家庭登记人口的信息、可接受访问者与不可接受访问者信息、《Kish选样表》登记人口信息等。这些数据为Kish选样过程的研究提供了非常丰富和翔实的原始个案数据资料,使该项研究成为可能。

    2.《Kish选样表》的基本原理与发展

    由于直接获得个人名单在绝大多数调查中不