子报子刊军事记者2015年第09期全媒体

本刊编委会

主 任 李秀宝

副主任 孙继炼

编 委

雷 雨 张海平 陈广照

林乘东 李 鑫 夏洪青

张 锋 郑蜀炎 朱金平

本刊顾问

程曼丽 陈昌凤 蔡 雯

李良荣 唐水福 曹 智

李 真 濮端华 钟志刚

张长春 刘金来 杨庆春

杨 敏 唐秀颖

总 编 辑 张 锋

副 总 编 郑蜀炎

主  编 朱金平

副 主 编 吕俊平

美  编 苏 鹏

本期值班 朱金平

编辑 《军事记者》编辑部

出版 长征出版社

印刷 解放军报社印刷厂

总发行处 北京报刊发行局

国内统一刊号 CN11-4467/G2

国际标准连续出版物号ISSN1002-4468

国外发行代号 M6261

本刊代号 82-204

订购处 全国各邮局

出版日期 每月15日

每期定价 12.00元

本刊地址 北京市阜外大街34号

本刊电话 010-66720796

邮政编码 100832

电子邮箱 jfjbjsjz@163.com

大数据时代网络受众研究的优化与安全

作者:■胡建兵

大数据(Big data),指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理,并整理成为人类所能解读的信息。由于大数据是人们获得新的认知、创造新的价值的源泉,已经成为世界各国争夺的战略制高点之一。庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。这种量化进程,也使网络受众的研究具有了全新的突破。

一、大数据对于网络受众研究的意义

受众研究在传播学领域占有突出位置。它不仅连接着媒介功能和效果研究,还是媒介产业运营中不可或缺的一个环节。传统受众研究,是在抽样调查和定性调查的基础上进行的。在抽样调查中,会假设一个全样本,然后进行抽样设计,但在实际操作过程中,这种抽样方法往往会受限于数据的易得性和真实性,而使得研究样本的可信度和代表性受到质疑,效果研究的准确度和可执行度也大大降低。

2008年,美国《连线》杂志主编克里斯·安德森就提出,用一系列的因果关系来验证各种猜想的传统研究范式已经不实用了,它已经被无需理论指导的纯粹的相关关系研究所取代。因为,大量的数据从某种程度上意味着“理论的终结”。虽然他的观点过于偏颇,但在大数据时代,如此海量数据凭传统的随机抽样方式进行受众研究已经难以为继。而利用大数据的大量、高速、多样、价值的“4V”特点,则可以精准分析网络受众群体特征、受众媒介接触、受众内容认同等行为的全过程。

由于大数据最根本的变革是数据生产方式的改变,所以人们“无意间”的网络行为就成为了数据来源。这里的“无意”并不是说人们完全不知晓,而是这个行为的目的并不是为了给平台公司或研究机构留下记录,而是日常自己的工作和行为记录的再次运用。对应到传播学研究中,也就是说针对大数据的研究不再需要运用电话访问、填写问卷等方式,让受访者知道自己的答案会被用于研究分析中。而且以往的这些方式的样本量总是有限的,样本的抽样结果也是有局限的。新的研究方式是运用一个开放的平台,让人们主动自发地自己往上“填写”记录。就像自媒体时代的新闻生产方式,很大一部分新闻来源都是每个个体在生产,并发送到微博和博客上,而微博和博客就是这样的平台,上面的内容是由用户源源不断地主动地往上填充。

显然,大数据对传播学受众研究的意义在于,通过分析全体数据,发现和理解信息内容及信息与信息之间的关系,用数据“说话”。尽管随机采样也能通过量化方法让“数据说话”,但“大数据”更加注重通过分析全体数据而不是依靠少量的数据样本分析。因此,它不再追求精确性,同时也不再探求“为什么”,而只论是什么——即不究因果关系,而只关注事物的相关关系,且以此来预测事物可能的发展趋势。

二、大数据在网络传播受众研究上的优化

全程精炼细分受众群体。网络传播研究离不开对受众群体特征的分析,而对受众的调查是群体分析的基础。与传统的抽样调查相比,运用大数据可以系统地分析网络受众的群体特征,改变传统网络受众研究样本难以获取或样本精度要求过高的不足。由于依据对于用户的访问都会通过log日志的形式进行记录,而且是以一种旁观者的身份、不必惊动受众的方式进行观察记录,这些电子访问记录成为受众研究测量数据的主要来源。因此,它可以全程精确地透视受众群体的构成、分布、文化程度及其特定阶段的具体需求,系统分析受众的群体特征,为研究成果应用于实践提高可信度,并以此阶段性地调整信息生产中各类信息的权重,针对性地提供信息服务,增加客户黏度。例如,知名的网络效果营销公司爱点击(iClick)自主研发的XMO 受众解决方案可以接触到最细分的受众。爱点击与上百营销者合作推出上千个在线营销活动,并在这个过程中累积了上亿的受众数据,并结合第三方数据,强强联合推出22种精选细分受众群体。这些受众群体按行业、生活方式和兴趣划分,以切合广告主的不同需要。媒体业的未来属于那些“既懂得公众不断变化的行为,也能准确投放内容,并将广告按每个用户偏好投放的人”,有利于促进网络受众研究的精确化和可执行度。

全程掌握受众媒介接触行为。受众接触网络媒介时,其在某个界面上的停留时间、浏览内容、点击次数都能反映出受众认知、情感、态度、行为发生的变化。因此,掌握网络受众的点击率、点击时间、浏览时长、浏览内容等数据,对分析研究网络受众媒介接触特征意义重大。传统的问卷调查采用受众的自我报告难以获得精确的信息,控制实验往往又是在小群体中进行,难以真正地推进到总体。从网络受众的研究效果上看,人们通过社交媒体进行沟通交流的是信息,这些信息包括文字、图片以及各类上传、点击、使用时间等等,这些信息被“数据化”后,通过分析就可以准确掌握人们交往沟通的意图、情绪、目的、爱好等相关行为。也就是说,通过分析“信息的信息”——“元信据”来预测人们的行为。这方面的典型案例是美国社交媒体脸谱网的用户分析。脸谱网在全球的用户量已经突破10亿大关,每秒都会产生数以十亿计的数据。脸谱网高度重视搜集整理分析这些数据,不仅包括文本内容这类的结构化数据,还包含图片、音频、视频等非结构化数据。因此,当用户使用脸谱网时,只会看到自己最想看的广告,从而实现传播效果的最优化。

全程分析受众内容认同。大数据研究最大的贡献,就在于把一切都归入了一个可量化的时代,而其中最根本的就是人的行为。人的喜好会通过浏览、链接和记录展现出来,人的情绪会通过文字的表达而展露出来,人的选择和决策过程也能通过不同的浏览路径和沟通路径获得。而一旦把人们的想法、态度和行为都能综合分析起来的时候,就能进行对现有社会更完善的认知,预测人们的消费行为、生活日常行为、对新事物的评价等。这就能将人与真实的物品、地点以及虚拟的产品和构想的关系进行较为清晰的勾勒,形成人、物融合,从而得到受众对网络内容的关注倾向、认同程度等认同特征,准确把握受众对网络内容的关注倾向、认同程度、互动效果等,进一步拓展网络受众内容认同分析的广度与深度。这样,不仅关注了媒介行为习惯本身,还关注了用户的整体行为,并从中寻找影响他们消费行为的相关因素,将网络传播研究上升到了一个新的高度。美国的《纸牌屋》是第一部在创作阶段使用了“大数据”算法的电视剧。据媒体报道,美国在线影片租赁提供商奈飞公司(Netflix)对受众群体进行了精准定位的分析,在创作之前,奈飞公司分析了3000万次用户体验,包括观众何时暂停、后退和快进,分析了400万条用户评价,300万次用户搜索操作,有媒体评论,这就是通过从海量数据中找出受众的偏好来为其量身定做的产品。