出版时间:2011年12月 |
一 主要宏观经济指标的选取和处理
为了充分利用我国宏观经济中大量的月度指标萃取代表宏观经济走势的因子,并将其结合到混频数据模型中实现对我国实际GDP增长率的实时预报和短期预测,本文将选取10个先行指标,6个一致指标和4个滞后指标作为我国实际GDP增长率短期预测和实时预报的大量月度数据集。
(一)指标的选取
根据中国经济景气监测中心(以下简称CEMAC,http://www.cemac.org.cn)和高盛(亚洲)联合开发的监测系统中选取的先行指标和一致指标为基础(郭国峰、郑召锋,2010),参照国内主要研究机构(如国家信息中心、国家统计局和中国人民银行等)对指标的景气属性分类,并兼顾我国宏观经济月度指标的可获得性,本文选取了20个月度指标,无特殊说明,数据均来源于中经网统计数据库(http://db.cei.gov.cn/)以及《中国经济景气月报》,并经过整理计算。
首先,参考CEMAC和国内主要研究机构选取的先行指标,兼顾数据的可获得性,及其重要程度,选取工业企业产品销售率(RSO)、消费者预期指数(CEI)、社会货运量(TFT)、沿海主要港口货物吞吐量(VFH)、固定资产投资本年新开工项目个数(NNP)、外商直接投资中实际利用外资(FDI)、货币供应量(M2)、银行间7天内同业拆借加权平均利率(IWLR7)、房地产开发投资指数(REDII)和粗钢产量(CSP)共十个变量作为预测实际GDP增长率的先行指标序列。先行指标的峰谷的走势先于经济周期波动走势,对判断经济走势、预测经济周期转折点具有非常重要的意义。
其次,本文选取六个一致指标作为预报和预测实际GDP增长率的一致指标,即工业企业增加值增速(VAI)、固定资产投资完成额(CIFA)、社会消费品零售总额(TRSCG)、进出口总额(TVIE)、国家财政收入中各项税收(TRGR)、工业企业利润总额(TPIE)、发电量产量(ETPE)作为预测实际GDP增长率的一致指标序列。一致指标是代表国民经济周期波动特征,其转折点大致与国民经济周期的转变同时发生,该类指标有利于判断当前经济的基本走势,可以用于确定预测对象的发展状况。
最后,本文选取如下四个指标,即财政支出(TGE)、居民消费价格指数(CPI)、工业品出厂价格指数(PPI)、工业企业产成品(OIE)作为预报和预测实际GDP增长率的滞后指标组。滞后指标在时间上落后于国民经济周期波动,可以用来判断经济周期运行发展的位置,确认前一个经济循环是否已经结束,可以对先行指标和一致指标的判断进行验证和补充。
(二)指标的处理
考虑Stock和Watson(2006)使用主成分分析方法估计单频静态月度因子模型时要求月度数据集合中不能含有缺失值,因此下文需要将样本区间的所有数据统一到样本中最短的样本变量(消费者预期指数从1999年1月开始公布),因此本文所有的月度数据指标均从1999年1月到2011年8月(本文写作时获取数据的时点为2011年9月28日),相应的季度实际GDP增长率的样本区间为1999年第一季度到2011年第二季度,共50个观测值。根据国家统计制度,某一时点获取的月度数据是边缘不齐的,不仅表现在数据开始期和结束期不同,还表现在个别或多个月份数据的缺失(常见的情况是1月份和12月份数据的缺失)。为了能应用主成分方法估计单频因子模型,本文将月度指标中的缺失数据进行处理,具体如附表所示。在缺失数据的处理上,本文采取以下步骤。
首先,推算并填充。如果变量的12月份数据缺失,且能获取到该变量的年度加总值,利用年度值减去前面11个月的总和,即可得到缺失数据的值,如国家财政收入中各项税收、财政支出等。若变量个别年份的1月(12月)数据缺失但无法获得年度数据,我们采用上年1月(12月)和当年2月(11月)的平均值作为该值的替代,这一方面兼顾了变量强季节性的特点,另一方面也考虑到变量当年的实际情况,如工业企业产品销售率、工业企业增加值等。
其次,最小插值离差平方和。如果该序列所有年份的1月或12月份数据均缺失,此时无法获得填充和推断该序列的有效信息,本文将采用最小样条插值离差平方和的方法,即当变量A某个月份数据缺失,也无法获取其增长率和加总数据等直接信息时,选取一个与该变量走势和波动最接近的变量B作为参考变量,分别采用线性插值、三次样条插值和三次B样条插值的方法,根据变量B的走势和波动范围来获取变量A插值后的新变量