【大数据】你的输入法透露了你的性格

 

【大数据】你的输入法透露了你的性格...

  每天,你会在手机或电脑上输入多少字?何时最爱打字?最高频的网络称谓是什么?近日出炉的《中国网民的信息生产及情感价值结构演变报告(2012—2016)》也许能回答你的疑问。
抽样调查体验计划 展现网民观念变迁 


  《中国网民的信息生产及情感价值结构演变报告(2012—2016)》由中国人民大学新闻与社会发展中心与搜狗输入法大数据团队联合发布。该报告的数据来源于搜狗输入法用户体验计划的抽样调查,按照不同输入场景分为社交、购物、娱乐和工作等,其中以社交平台数据作为核心进行选取;选取时段为2012年6月到2016年6月

基于搜狗输入法的输入热度,报告通过对近年来一系列输入数据的统计,展现出中国网民在公私领域及特殊群体、社会关系中的社会观念变迁。

有效处理海量数据主要分为两步:第一步是对数据进行分类与编码。按照社会问题、私人问题等方面,对数据来源中的前5000个高频词进行人工分类,由三位编码员进行编码。第二步是机器学习阶段。根据聚类算法,对人工编码学习后,对高频词进行有效学习和分类。
报告带你读懂中国亿万网民表达文化


1行为层面

根据报告中的统计数据显示,在行为层面,我国网民日均打字总数达350亿之多。2006-2016年十年内,年均打字总数达到127750亿字,同时,报告还对输入法的活跃时间进行了统计,一天中,晚间22点睡前阶段,是网民全天打字最活跃的时段。社交类网站(App)以超过九成的比例,占据网民经常登陆的网站或App中的最大份额。



2内容层面

在内容层面,女性比较热衷于使用表情符号,关注八卦,而男性更倾向于政治,五年间网民提及度最高的三大网络行为依次是直播、发红包和刷屏“亲爱的”是最常用的网络称谓。根据社交、工作、游戏以及购物等不同话语场景,网民的输入表现也各不相同,比如社交场景就体现为微信和QQ平台活跃度最高,微博平台则呈现围观的特质。



3反映出的社会问题热度及趋势

报告中总结出的行为与内容层面的偏好,也反映出社会问题的热度和趋势,给社会学研究带来重要的参考价值。据统计,近五年中国网民提及度最高的三个“社会问题”依次是:教育问题(41.64%)、劳动就业问题(15.81%)、食品安全问题(12.28%),其次是人口、物价、诚信、房价、家庭暴力、生态环境以及青少年犯罪等问题,基本涵盖了社会问题具体表现形式的主要方面。而在“私人话题”方面,爱情仍是其中的核心话题,工作是其次,并且随着电子商务的普及,购物成为民众除了维持社会关系网以外的第一核心领域。



4特殊人群的行为变化

对于特殊人群的行为变化,报告也指出,相比于男性喜欢购买IT产品,女性热衷于服装和化妆品,其购物频度远高于男性。在不同世代群体的网络行为比较中,00后最为热衷休闲娱乐和社交功能,90后的主要行为是社交和娱乐,而80后以查找资料、看新闻等为主,70后则重点通过电脑浏览新闻和进行电子联系,实用目的性更强。
消除文化“茧房化” 输入法可成“连接器”
有专家认为,此次《报告》的结论显示,社群传播崛起使得社会关系呈现出“茧房化”,而且代际、群际之间存在刻板印象和不通约的现象,虚拟社会关系矛盾化趋势明显。

具体来看,就是网络的广泛使用以及新闻推送方式的崛起,造成民众获取的信息只是自己所喜爱的,导致用户视野狭隘、个人判断力与认知能力的丧失,尤其是不同社会族群间彼此没有共同的话语体系,带来各种误会与偏见,以致相互戒备甚至有时相互敌视。

如何消除这种社会关系以及文化的“茧房化”,有赖于在全社会范围内构建出一个公共话语平台。在“输入”成为当前所有网民一致行为的背景下,具有生动风趣、形象幽默、人情味更浓等特点的网络语言,很好地满足和承载着不同代际、群际之间表达与交流的需求。

随着时代的发展,每年都有涌现出成百上千个网络新词,而输入法正是这些新增词语得以表达和流行的重要渠道。借助输入法这种“连接器”的作用,网络语言也将具有更多的文化意义、现实意义及社会意义。(来源:网络传播杂志)


    关注 微文阅读推荐


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册