出版时间:2015年04月 |
一 研究方法及指标选取
1.研究方法
因子分析方法是一种多元统计分析法。基本原理是通过原始变量数据矩阵进行降维处理,得到一组新变量,这组新变量彼此互不相关且在各自的特征方向上有最大方差。当几个变量的累计方差较高时,说明这几个变量集中反映了研究问题的大部分信息,而且彼此之间又不相关,信息不重叠,可以提取这几个变量作为公共因子。通过计算各个公共因子的权重,然后对综合评价结果进行加权合成,就可以得到因变量的综合评价值并进行大小排序。
因为因子分析法对变量和观测值有一定要求,要求观测值是变量数量的3倍以上,而中部省份仅6个,所以本文利用全国31个省辖市的开放型经济横截面数据,通过因子分析法得出各地区因子得分,从中提取中部六省山西、安徽、江西、河南、湖北和湖南的因子得分,再对六省综合评价值的大小进行排序比较。
2.变量选取及数据来源
基于开放型经济发展指标的分析,本文选取年度人均GDP(元/人)、人均可支配收入(元/人)、技术市场成交额占GDP比重(%)、每十万人口各级学校平均在校生数(人)、高新技术产品出口金额(亿美元)、货物进出口总额(万美元)、外商投资企业投资总额(亿美元)、对外承包工程和劳务合作完成营业额(万美元)、旅游外汇收入(万美元)和对外直接投资(万美元)十个变量来对我国各地区开放型经济发展水平进行因子分析。
受全国31个地区数据可获得性的制约,本文采用2013年的年度数据,数据来自《中国统计年鉴2014》、各省2013年国民经济和社会发展统计公报、商务部对外投资和经济合作司。
二 实证分析
1.原始指标变量相关性分析及标准化
由于各指标均为正向指标,可直接利用SPSS16.0统计软件进行标准化,得到标准化后的数据。Zscore(X1)、Zscore(X2)等分别为原始变量的标准化变量。
因子分析从十个指标变量中提取出少数几个具有代表意义的公共因子变量,它要求指标变量之间要具有较强的相关性,否则就无法从中综合出能反映某些变量共同特性的少数公共因子来,指标变量就不适于进行因子分析。因此,在进行因子分析之前需要对标准化后的指标变量进行相关性分析,判断变量之间是否高度相关,判断方法主要有相关系数法和KMO检验法。相关系数法一般认为,变量相关系数矩阵中的各相关系数如果大部分都大于0.3,则适合做因子分析。KMO检验法是通过比较指标间简单相关系数和偏相关系数来判断其是否适合做因子分析,一般来说,KMO值越接近1,就表明对这些变量进行因子分析的效果越好,就越适合做因子分析。Kaiser提出了常用的度量标准,一般认为KMO值大于0.7即可适用因子分析法。
表1 Correlation Matrix相关系数矩阵表
由表1可以看出,大多数相关系数都大于0.3,说明变量间的相关性普遍较高,他们存在潜在公因子的可能性较大,适合做因子分析。同时再采用KMO检验和BARTLETT球度检验判断是否适合做因子分析。由表2相关系数的KMO and BARTLETT’S检验结果可以看出,KMO的值为0.722,大于0.5,较为接近于1。根据Kaiser标准,选取的十个变量指标之间存在较强线性相关,进行因子分析效果较好。变量BARTLETT球度检验值为416.657,相伴概率为0.000,小于显著水平0.5,表明相关矩阵不是一个单位矩阵,可以考虑进行因子分析。
表2 相关系数的KMO and Bartlett’s Test
2.因子提取
运用SPSS16.0统计分析软件,对标准化后的数据进行因子分析,得出特征根与方差贡献率表(见表3)、变量共同度量表(见表4)、因子载荷矩阵表(见表5)和旋转后的因子载荷矩阵表(见表6)。
表3 Total Variance Explained特征根与方差贡献率表
由表3可知,按特征值大于1的原则应提取2个公共因子。同时,也可以看到,这2个公共因子的方差贡献率分别为51.252%和33.493%,累计方差贡献率达到84.745%,大于80%的选择标准,说明所提取的这2个公因子能够解释原始10个变量指标的大部分信息,总体解释力度较强。同时,由表4可以发现,除变量Zscore(X3)、Zscore(X7)的共同度量在72%、79.5%以外,其他变量的共同度量都在82.5%以上,故提取出的2个公因子对原始变量的解释能力是很强的。
表4 Communalities变量共同度量表
表5 Component Matrixa因子载荷矩阵表
由表5发现,2个公因子与10个变量的结构关系不十分明确,很难对提取的2个公因子进行满意的解释,所以采用方差最大法对因子进行旋