您好,欢迎来到皮书数据库!
您现在所在的位置:首页
更多>> 课题组动态
更多>> 皮书作者
王伟光
  男,汉族,1950年2月出生,山东海阳人。1967年11月参加工作,1972年11月加入中国共产党,博士研究生学... 详情>>
李 扬
  1951年9月出生,籍贯安徽,1981年、1984年、1989年分别于安徽大学、复旦大学、中国人民大学获经济学学... 详情>>
李培林
  男,山东济南人。博士,研究员,中国社会科学院副院长,中国社会学会副会长,中国社会科学院社会学研究所副所长。《社会... 详情>>

    地域舆情分布与经济、教育、互联网发展的关系研究——基于2010~2014年6000起舆情事件的实证研究
    ——基于2010~2014年6000起舆情事件的实证研究

    作者:上海交通大学舆情研究实验室 出版时间:2015年10月
    摘要:不同地域的舆情发展,作为一种典型的地域现象,与各地域的发展水平常常关系密切。上海交通大学舆情研究实验室基于大数据分析,用洛伦兹曲线和基尼系数描绘了中国大陆各地域舆情事件分布现状,并进一步以经济、教育、互联网三个代表地域发展的典型因素,考察了地域发展与地域舆情事件数量分布的相互关系:地域的经济(人均GDP、老年社会保障水平、失业率)、教育(高等教育普及程度)、互联网(互联网普及率和政府互联网应用水平)发展水平越高,正、负面舆情事件越高发。
    Abstract:In order to test the relationship between Regional public opinion and regional development level,the Public Opinion Research laboratory conducted big data analysis to draw a map of Chinese public opinion based on Lorenz C curve and Gini Coefficient,and examined the relationship between the regional public opinion distribution and regional economy,education,Internet development. Results showed that higher level of regional economy (GDP per capita,level of social security of the elderly,unemployment rate),education (higher education penetration),and Internet technology (Internet penetration and governmental Internet application) relates to more positive and negative public opinion.
    随着科学技术的不断发展,世界的传播生态环境发生了翻天覆地的变化。社会的一切事务都镶嵌于现实社会与虚拟网络的交织空间中,其并非存在于孤立、单一的社会生活体系,而是与政治、经济、文化、技术、宗教、心理、国家等诸多因素相互作用的结果,这些复杂的隐形“他物”最终支撑并影响着社会事务的发展方向。网络舆情作为当前一种突出的社会现象,不仅透视着人们的价值观念、行为习惯、公共意志和社会需求,也透视着地域的政治、经济、教育、技术、宗教状况,同时也与当前社会关系、社会结构、社会制度相互制约并相互影响。地域的经济、教育和技术水平,通常能较大程度上影响地域的发展模式,对地域的社会生活与公共事务具有较强的现实影响,因此本文拟借用大数据验证这三者与地域舆情分布的关系。上海交通大学舆情研究实验室与信息安全计算机科学技术研究团队合作研发了舆情数据实时抓取集成系统,建立了中国海量公共事件数据库,按热度挑选数据库中2010~2014年各年度排行前1200起的舆情事件,共计6000起,再利用大数据挖掘和人工筛选统计相结合的方法,对舆情事件的舆情性质进行正负性分类,测量不同性质舆情事件与地域经济发展、教育发展、互联网发展的关系。

    一 我国大陆各地域的网络舆情分布概况

    1.我国大陆各地域舆情事件数量分布不均衡

    我国不同地域的舆情事件发生数量不同,并呈现较大差异。从舆情性质划分,舆情可分为正面性质的舆情、中性舆情和负面性质的舆情,不同性质的舆情事件发生数量在不同地域的分布也呈现不同趋势。本研究按照正、负面舆情事件省际分布数量,将2014年我国各省、自治区、直辖市的正、负面舆情事件数量各划分为四个等级,分别定义为正、负面舆情高发区,较高发区,较低发区,低发区,并绘制成模拟地图(如图1、图2所示)。

    图1 2014年正面舆情事件数量四分位地图

    图2 2014年负面舆情事件数量四分位地图

    四分位地图[1]中颜色越深的地区表明其中发生的舆情事件数量越多。由图1四分位图的图例可知,2014年正面舆情事件数量级可分为四档,第一档是0~1起(4个地区),第二档为2~6起(10个地区),第三档为7~11起(9个地区),第四档为12~35起(8个地区)。参考中国省(区、市)地图,2014年正面舆情事件高发区包括北京、广东、湖南、上海、湖北、河南、江苏、陕西,正面舆情事件低发区包括内蒙古、西藏、贵州、青海等地区。同理,观察图2可知,第一档是0~3起(7个地区),第二档为4~6起(5个地区),第三档为7~18起(11个地区),第四档为20~62起(8个地区)。结合图例,负面舆情事件高发区包括北京、广东、河南、四川、上海、湖南、云南、湖北,负面舆情事件低发区主要是贵州、西藏、青海、山西、内蒙古、吉林、宁夏。各省(区、市)的正、负面舆情事件数量分布都呈现不均衡状态。

    2.正面舆情事件数量的地域分布差异大于负面舆情事件数量的地域分布差异

    为了进一步比较舆情事件数量的分布均衡程度,本研究拟将借用洛伦兹曲线[2]、基尼系数的概念,计算正面舆情和负面舆情事件数量的省际分布差异。根据正、负面舆情事件数量与省(区、市)数量散点绘制洛伦兹曲线,同时拟合洛伦兹曲线时力求大于0.99。洛伦兹曲线的弯曲程度越高,即基尼系数越大,代表省际舆情事件数量差异越大,分布越不均衡(如图3所示)。

    图3 洛伦兹曲线示例

    计算结果如表1、表2所示,省际正面舆情事件数量的基尼系数数值范围为0.490~0.663,省际负面舆情事件数量的基尼系数数值范围为0.428~0.494,可见,整体上,正面舆情事件数量的省际差异比负面舆情事件数量的省际差异更大。进一步比较2010~2014年不同年份之间的舆情事件数量省际基尼系数变化,2010年的正面舆情事件数量的省际基尼系数相对较大,证明2010年不同地域的正面舆情事件数量差异明显,但2011~2014年整体减小,且变化幅度较小。负面舆情事件数量的省际基尼系数则基本处于稳定状态(见图4)。

    表1 正面舆情事件洛伦兹曲线拟合结果及基尼系数

    表2 负面舆情事件洛伦兹曲线拟合结果及基尼系数

    图4 2010~2014年正、负面舆情事件数量省际基尼系数

    二 地域经济与舆情事件的关系

    1.地域人均GDP与地域热点舆情事件数量呈正相关关系

    舆情事件是某一地域在某一时期社会经济