出版时间:2015年08月 |
态势是行为的动因,它反映了个人的社会存在,同时主导个人的社会行为。当前社会态势的感知手段多通过大范围的问卷测评,能够准确获知被试者的心理要素。但是受时效性、社会赞许性等因素影响,以及测评周期长、成本高,无法及时大规模采集。近些年,我国信息科技事业得到了迅猛发展,为社会态势感知研究的发展提供了新的契机,能够很好地弥补传统研究方法的局限,使通过网络数据实现对用户社会态势要素的计算预测成为可能。本报告在新浪“微博”平台,通过大规模获取北京用户社交网络的网上数据,提取了用户网上行为、文本内容等特征。针对北京地区,开展了马航事件、昆明事件和公交地铁调价听证会期间的公众社会态势研究。结果表明,本系统可对事件前后的公众社会态势进行及时感知,为公共政策的制定提供数据支持。
In recent years,the information technology industry in our country has been developing rapidly. The development of information science technology and the Internet platform provides a new opportunity for the development of social situation perception. It can be helpful to make up for the limitations of traditional research methods through the network data used to compute user psychological factors. In view of this,the network data is the ideal way of social situation perception research,and is a rapid trend to establish subjective social situation analysis system. This report focuses on Sina “micro-blog” platform. Through the online data acquisition of large-scale social network user,the features of user online behavior,the content of online text are extracted. Facing to Beijing area,this report carries out the computation of public attitudes during different events. Results show that,the system can figure out the public social situation timely before and after the event,and provides data support for the formulation of public policies.
一 北京“微博”用户人口统计信息
我们的调查于2014年10月底正式开展。通过调用新浪微博的开放API,⑥我们针对北京地区的活跃“微博”用户开展调查。“活跃用户”的概念⑩是我们科研团队在多年的研究中选用的被试筛选准则:第一,该用户在实验时间点最近的三个月内有微博状态发表记录;第二,该用户的微博总数大于532条。“活跃用户”标准的评定,遵循了统计的基本规则,在很多先前工作中得到了验证。
在本次北京“微博”用户调查中,经过“活跃用户”条件筛选后,截至2014年10月31日,共计76779名合格的北京“微博”用户成为调查对象。其中,女性用户为45592人,占59.38%;男性用户为31187人,占40.62%。平均微博年龄(注册“微博”账号视为该“微博”出生,从其出生至今即为微博年龄)为3.54岁。
(一)样本的各区分布情况
北京市包含了18个区县单位(16个区、2个县),按照名称发音字母排序分别为:昌平区、朝阳区、崇文区、大兴区、东城区、房山区、丰台区、海淀区、怀柔区、门头沟区、密云县、平谷区、石景山区、顺义区、通州区、西城区、宣武区和延庆县。统计结果显示,在用户性别属性上,无论是哪个区,微博群体整体女性用户明显多于男性用户。各区县女性用户比例保持在55%~71%,除怀柔区女性用户比例明显高于平均性别比例外,其他各区县用户性别比例与平均值基本持平。
由于北京地域广阔,城区和郊区的社会状况有很大不同,接下来进一步探讨城区和郊区微博用户分布的不同。如表1所示,城区(朝阳区、崇文区、东城区、丰台区、海淀区、石景山区、西城区和宣武区)人口数多于郊区人口数,面积却远小于郊区。在“微博”群体中,城区微博用户数、女性微博用户数都远远多于郊区用户数(10倍左右),而城区和郊区的女性用户比例则近似相等。
表1 城区与郊区的对比情况
各区县微博用户数与其人口数呈现显著正相关。即人口基数大的地区微博用户也相对更多。同时,城区平均微博用户数远多于郊区平均微博用户数,地区微博用户数与经济发达程度呈现正相关。
(二)小结
在抽取的样本中,可判断得出北京“微博”用户众多,尤其是女性用户的比重更是高于男性用户近20个百分点。
各区人口稠密程度不同,城区地域面积有限但人口众多,郊区土地虽广却人口稀少。反映到社交平台上,“微博”人口的分布也有较大的偏差。其中城区微博用户数量远大于郊区微博用户数量,但其性别比与均值保持一致,差别不大。
二 北京“微博”使用情况分析
新浪把微博理解为“微型博客”或者“一句话博客”①。用户可以将看到的、听到的、想到的事情写成一句话,或发一张图片,通过电脑或者手机随时随地分享给朋友,一起分享、讨论;还可以关注朋友,即时看到朋友们发布的信息。
(一)新浪“微博”使用指标
新浪“微博”提供了多种社交功能。③就发表“微博”的角度而言,用户可以发表微博、转载微博、评论微博;就用户间关系而言,用户可以单向关注他人、被他人关注以及互相关注成为互粉。根据以上的“微博”基本功能,本研究定义如下若干“微博”使用指标。
(1)微博数:“微博”用户自注册之日起所发“微博”条数之和。
(2)粉丝数:“微博”用户粉丝总数。
(3)关注数:“微博”用户关注其他“微博”总数。
(4)互粉数:既是某用户的粉丝又是其关注者的微博用户数。
(5)个性域名设置:用户是否设置了个性域名。
(6)认证及其类型:用户是否进行了微博认证。
(7)地理位置共享:用户是否共享了地理位置信息。
(8)交互隐私设置:用户是否接受他人评论和发私信。
这些客观指标描述了“微博”用户使用新浪微博的统计量,④对研究用户“微博”使用倾向、目的、偏好有着重要的意义。
(二)北京用户“微博”使用特点
微博状态(status)就是指用户所发表可包含多媒体信息的“微型博客”。北京“微博”用户每人平均总微博数为3832.30条,每个用户日均发微博数为2.97条。其中城区用户平均总微博数3833.39条,略高于郊区用户平均总微博数的3819.71条。
“微博”用户无须他人接受即可任意关注其他“微博”用户,反过来也可被其他“微博”用户任意关注。关注他人,即成为他人的粉丝(follower)。当某两个“微博”用户互相关注时,此二者即互相成为粉丝,也就是人们通常说的“互