子報子刊軍事記者2015年第09期全媒體

本刊編委會

主 任 李秀寶

副主任 孫繼煉

編 委

雷 雨 張海平 陳廣照

林乘東 李 鑫 夏洪青

張 鋒 鄭蜀炎 朱金平

本刊顧問

程曼麗 陳昌鳳 蔡 雯

李良榮 唐水福 曹 智

李 真 濮端華 鐘志剛

張長春 劉金來 楊慶春

楊 敏 唐秀穎

總 編 輯 張 鋒

副 總 編 鄭蜀炎

主  編 朱金平

副 主 編 呂俊平

美  編 蘇 鵬

本期值班 朱金平

編輯 《軍事記者》編輯部

出版 長征出版社

印刷 解放軍報社印刷廠

總發行處 北京報刊發行局

國內統一刊號 CN11-4467╱G2

國際標準連續出版物號ISSN1002-4468

國外發行代號 M6261

本刊代號 82-204

訂購處 全國各郵局

出版日期 每月15日

每期定價 12.00元

本刊地址 北京市阜外大街34號

本刊電話 010-66720796

郵政編碼 100832

電子郵箱 jfjbjsjz@163.com

大數據時代網絡受眾研究的優化與安全

作者︰■胡建兵

大數據(Big data),指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、處理,並整理成為人類所能解讀的信息。由于大數據是人們獲得新的認知、創造新的價值的源泉,已經成為世界各國爭奪的戰略制高點之一。龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。這種量化進程,也使網絡受眾的研究具有了全新的突破。

一、大數據對于網絡受眾研究的意義

受眾研究在傳播學領域佔有突出位置。它不僅連接著媒介功能和效果研究,還是媒介產業運營中不可或缺的一個環節。傳統受眾研究,是在抽樣調查和定性調查的基礎上進行的。在抽樣調查中,會假設一個全樣本,然後進行抽樣設計,但在實際操作過程中,這種抽樣方法往往會受限于數據的易得性和真實性,而使得研究樣本的可信度和代表性受到質疑,效果研究的準確度和可執行度也大大降低。

2008年,美國《連線》雜志主編克里斯•安德森就提出,用一系列的因果關系來驗證各種猜想的傳統研究範式已經不實用了,它已經被無需理論指導的純粹的相關關系研究所取代。因為,大量的數據從某種程度上意味著“理論的終結”。雖然他的觀點過于偏頗,但在大數據時代,如此海量數據憑傳統的隨機抽樣方式進行受眾研究已經難以為繼。而利用大數據的大量、高速、多樣、價值的“4V”特點,則可以精準分析網絡受眾群體特征、受眾媒介接觸、受眾內容認同等行為的全過程。

由于大數據最根本的變革是數據生產方式的改變,所以人們“無意間”的網絡行為就成為了數據來源。這里的“無意”並不是說人們完全不知曉,而是這個行為的目的並不是為了給平台公司或研究機構留下記錄,而是日常自己的工作和行為記錄的再次運用。對應到傳播學研究中,也就是說針對大數據的研究不再需要運用電話訪問、填寫問卷等方式,讓受訪者知道自己的答案會被用于研究分析中。而且以往的這些方式的樣本量總是有限的,樣本的抽樣結果也是有局限的。新的研究方式是運用一個開放的平台,讓人們主動自發地自己往上“填寫”記錄。就像自媒體時代的新聞生產方式,很大一部分新聞來源都是每個個體在生產,並發送到微博和博客上,而微博和博客就是這樣的平台,上面的內容是由用戶源源不斷地主動地往上填充。

顯然,大數據對傳播學受眾研究的意義在于,通過分析全體數據,發現和理解信息內容及信息與信息之間的關系,用數據“說話”。盡管隨機采樣也能通過量化方法讓“數據說話”,但“大數據”更加注重通過分析全體數據而不是依靠少量的數據樣本分析。因此,它不再追求精確性,同時也不再探求“為什麼”,而只論是什麼——即不究因果關系,而只關注事物的相關關系,且以此來預測事物可能的發展趨勢。

二、大數據在網絡傳播受眾研究上的優化

全程精煉細分受眾群體。網絡傳播研究離不開對受眾群體特征的分析,而對受眾的調查是群體分析的基礎。與傳統的抽樣調查相比,運用大數據可以系統地分析網絡受眾的群體特征,改變傳統網絡受眾研究樣本難以獲取或樣本精度要求過高的不足。由于依據對于用戶的訪問都會通過log日志的形式進行記錄,而且是以一種旁觀者的身份、不必驚動受眾的方式進行觀察記錄,這些電子訪問記錄成為受眾研究測量數據的主要來源。因此,它可以全程精確地透視受眾群體的構成、分布、文化程度及其特定階段的具體需求,系統分析受眾的群體特征,為研究成果應用于實踐提高可信度,並以此階段性地調整信息生產中各類信息的權重,針對性地提供信息服務,增加客戶黏度。例如,知名的網絡效果營銷公司愛點擊(iClick)自主研發的XMO 受眾解決方案可以接觸到最細分的受眾。愛點擊與上百營銷者合作推出上千個在線營銷活動,並在這個過程中累積了上億的受眾數據,並結合第三方數據,強強聯合推出22種精選細分受眾群體。這些受眾群體按行業、生活方式和興趣劃分,以切合廣告主的不同需要。媒體業的未來屬于那些“既懂得公眾不斷變化的行為,也能準確投放內容,並將廣告按每個用戶偏好投放的人”,有利于促進網絡受眾研究的精確化和可執行度。

全程掌握受眾媒介接觸行為。受眾接觸網絡媒介時,其在某個界面上的停留時間、瀏覽內容、點擊次數都能反映出受眾認知、情感、態度、行為發生的變化。因此,掌握網絡受眾的點擊率、點擊時間、瀏覽時長、瀏覽內容等數據,對分析研究網絡受眾媒介接觸特征意義重大。傳統的問卷調查采用受眾的自我報告難以獲得精確的信息,控制實驗往往又是在小群體中進行,難以真正地推進到總體。從網絡受眾的研究效果上看,人們通過社交媒體進行溝通交流的是信息,這些信息包括文字、圖片以及各類上傳、點擊、使用時間等等,這些信息被“數據化”後,通過分析就可以準確掌握人們交往溝通的意圖、情緒、目的、愛好等相關行為。也就是說,通過分析“信息的信息”——“元信據”來預測人們的行為。這方面的典型案例是美國社交媒體臉譜網的用戶分析。臉譜網在全球的用戶量已經突破10億大關,每秒都會產生數以十億計的數據。臉譜網高度重視搜集整理分析這些數據,不僅包括文本內容這類的結構化數據,還包含圖片、音頻、視頻等非結構化數據。因此,當用戶使用臉譜網時,只會看到自己最想看的廣告,從而實現傳播效果的最優化。

全程分析受眾內容認同。大數據研究最大的貢獻,就在于把一切都歸入了一個可量化的時代,而其中最根本的就是人的行為。人的喜好會通過瀏覽、鏈接和記錄展現出來,人的情緒會通過文字的表達而展露出來,人的選擇和決策過程也能通過不同的瀏覽路徑和溝通路徑獲得。而一旦把人們的想法、態度和行為都能綜合分析起來的時候,就能進行對現有社會更完善的認知,預測人們的消費行為、生活日常行為、對新事物的評價等。這就能將人與真實的物品、地點以及虛擬的產品和構想的關系進行較為清晰的勾勒,形成人、物融合,從而得到受眾對網絡內容的關注傾向、認同程度等認同特征,準確把握受眾對網絡內容的關注傾向、認同程度、互動效果等,進一步拓展網絡受眾內容認同分析的廣度與深度。這樣,不僅關注了媒介行為習慣本身,還關注了用戶的整體行為,並從中尋找影響他們消費行為的相關因素,將網絡傳播研究上升到了一個新的高度。美國的《紙牌屋》是第一部在創作階段使用了“大數據”算法的電視劇。據媒體報道,美國在線影片租賃提供商奈飛公司(Netflix)對受眾群體進行了精準定位的分析,在創作之前,奈飛公司分析了3000萬次用戶體驗,包括觀眾何時暫停、後退和快進,分析了400萬條用戶評價,300萬次用戶搜索操作,有媒體評論,這就是通過從海量數據中找出受眾的偏好來為其量身定做的產品。