樂國安賴凱聲(南開大學(xué) 社會心理學(xué)系,天津 300071)
?
基于網(wǎng)絡(luò)大數(shù)據(jù)的社會心理學(xué)研究進展
樂國安*賴凱聲
(南開大學(xué) 社會心理學(xué)系,天津 300071)
摘 要:互聯(lián)網(wǎng)和計算機科學(xué)技術(shù)的快速發(fā)展,使得基于網(wǎng)絡(luò)大數(shù)據(jù)的心理行為研究越來越受到研究者的關(guān)注。這為研究人類的心理與行為規(guī)律提供了新的視角。心理學(xué)作為社會科學(xué)的重要組成部分,在計算社會科學(xué)的大浪潮中也展示出了巨大的發(fā)展?jié)摿Γ谇榫w心理學(xué)、人格心理學(xué)、行為金融學(xué)、健康心理學(xué)、政治心理學(xué)等諸多領(lǐng)域催生了一批具有重要理論和現(xiàn)實意義的研究成果。我國的社會心理學(xué)研究者,已圍繞微博情緒問題,并結(jié)合股市預(yù)測、社會風(fēng)險感知、精英與大眾關(guān)系、地區(qū)民族主義等諸多具有重要社會現(xiàn)實意義的研究問題,開展了一系列探索性研究。關(guān)于網(wǎng)絡(luò)大數(shù)據(jù)的社會心理學(xué)研究,未來的研究者應(yīng)該理性地看待這一新興研究范式,并且充分發(fā)揮該范式的優(yōu)勢,從而更好地為解決社會科學(xué)的理論和現(xiàn)實社會問題服務(wù)。
關(guān)鍵詞:大數(shù)據(jù);心理信息學(xué);微博;情緒
以互聯(lián)網(wǎng)和信息科學(xué)技術(shù)的快速發(fā)展推動的信息技術(shù)革命,使得人類步入了數(shù)據(jù)充裕的數(shù)字化信息時代。在生產(chǎn)、存儲數(shù)據(jù)的能力獲得了巨大發(fā)展的信息化時代,人們生活在一個規(guī)模難以想象的龐大數(shù)字化世界里。人們在論壇、博客、微博、微信、電子商務(wù)交易平臺、搜索引擎等平臺上積累的海量數(shù)據(jù),成為大數(shù)據(jù)時代寶貴的信息資源和財富。目前,大數(shù)據(jù)已經(jīng)被廣泛應(yīng)用于政治選舉、企業(yè)(尤其是電子商務(wù)公司)戰(zhàn)略布局、金融交易、生物研發(fā)、醫(yī)療衛(wèi)生、國防安全、公共管理、社會治安、交通管理、氣象監(jiān)測等諸多實踐領(lǐng)域。
網(wǎng)絡(luò)的廣泛應(yīng)用以及與現(xiàn)實的密切交織,不僅改變了人們的生活方式,也推動了學(xué)術(shù)研究范式的變革。[1]一方面,海量的(移動)互聯(lián)網(wǎng)用戶借助微博、論壇等社交媒體產(chǎn)品和移動互聯(lián)網(wǎng)工具記錄自己的生活,并高密度地進行突破傳統(tǒng)時間、空間限制的人際、人機互動,積累了前所未有的海量在線文本、圖片、視頻信息;另一方面,數(shù)據(jù)挖掘等計算機和信息科學(xué)技術(shù)的發(fā)展,使得高效處理和分析海量人類行為數(shù)據(jù)成為可能,從而奠定了海量數(shù)據(jù)挖掘的技術(shù)基礎(chǔ)。[2]網(wǎng)絡(luò)大數(shù)據(jù)為社會科學(xué)的發(fā)展帶來了前所未有的機遇,Lazer等一批來自政治學(xué)、計算機科學(xué)等諸多跨學(xué)科領(lǐng)域的研究者于2009年在《科學(xué)》雜志上聯(lián)合撰文,正式提出了“計算社會科學(xué)”(Computational Social Science)的研究領(lǐng)域。[3]
心理學(xué)作為社會科學(xué)的重要組成部分,致力于探討人類的心理與行為規(guī)律。(移動)互聯(lián)網(wǎng)平臺和網(wǎng)絡(luò)應(yīng)用積累的海量網(wǎng)絡(luò)大數(shù)據(jù)記載著大規(guī)模人群所思、所想和所感,這為挖掘人類的心理與行為規(guī)律提供了龐大、客觀、真實的數(shù)據(jù)資源。尤其是現(xiàn)代化數(shù)據(jù)分析技術(shù)的發(fā)展,例如,開源統(tǒng)計分析軟件R語言、社會網(wǎng)絡(luò)分析技術(shù),為數(shù)據(jù)挖掘和數(shù)據(jù)分析提供了堅實的技術(shù)支撐。受信息科學(xué)在生物基因、天文學(xué)等領(lǐng)域成功應(yīng)用的啟發(fā),Yarkoni首次提出了“心理信息學(xué)”(Psychoinformatics)這一新穎的交叉學(xué)科概念。他把利用計算機和信息科學(xué)技術(shù)工具來獲取、管理和分析心理學(xué)數(shù)據(jù)的研究領(lǐng)域稱為“心理信息學(xué)”。[4]作為一門立足于心理學(xué)研究問題的新興交叉學(xué)科,心理信息學(xué)的研究重點關(guān)注如何借助計算機和信息科學(xué)技術(shù)的優(yōu)勢,在心理學(xué)研究的各個分支領(lǐng)域和研究環(huán)節(jié)中充分發(fā)揮作用,從而為心理學(xué)問題提供更為科學(xué)、客觀的研究證據(jù)。[1]
正如計算社會科學(xué)可追溯到社會物理學(xué)、社會計算(social computing)等研究領(lǐng)域,心理學(xué)與大數(shù)據(jù)、信息科學(xué)的相遇,并非出于歷史的偶然巧合,而是心理學(xué)與信息科學(xué)為尋求自身發(fā)展而產(chǎn)生的必然結(jié)合。[1]心理學(xué)與大數(shù)據(jù)、信息科學(xué)的結(jié)合最早可追溯到1998年Nowak等提出的計算社會心理學(xué)(computational social psychology)研究領(lǐng)域。[2]該領(lǐng)域最早的內(nèi)涵是指利用計算機模擬的技術(shù)手段對社會心理學(xué)中的群體心理與行為進行建模和仿真模擬,從而揭示社會群體的心理與行為模式和規(guī)律特征。但后來隨著計算機科學(xué)技術(shù)的發(fā)展,尤其是社交媒體的發(fā)展,信息科學(xué)可為心理學(xué)提供的不再局限于仿真模擬這樣一種特定的技術(shù)手段,而是數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)分析等全方位的支持。研究者通過計算機數(shù)據(jù)抓取手段(例如,網(wǎng)絡(luò)爬蟲)或由網(wǎng)絡(luò)服務(wù)商提供獲得的Twitter、新浪微博、Google網(wǎng)絡(luò)搜索等網(wǎng)絡(luò)大數(shù)據(jù),在數(shù)據(jù)的樣本覆蓋量、時間精度等方面都具有突破性優(yōu)勢。此外,研究者可以通過(移動)互聯(lián)網(wǎng)平臺和以更經(jīng)濟、更快捷的方式,招募大批量的被試,從而完成在線問卷調(diào)查或網(wǎng)絡(luò)心理學(xué)實驗。例如,比較流行的在線問卷調(diào)查平臺“調(diào)查猴子”(Survey Monkey),和被試招募平臺“亞馬遜土耳其機器人”(Amazon’s Mechanical Turk,MTurk)。有研究證據(jù)表明,由于網(wǎng)絡(luò)覆蓋面廣、成本低等優(yōu)勢的存在,通過網(wǎng)絡(luò)平臺收集的數(shù)據(jù)在樣本多樣性、數(shù)據(jù)質(zhì)量等方面等同于甚至高于傳統(tǒng)研究方法采用的數(shù)據(jù)收集手段。[5-6]
心理學(xué)與網(wǎng)絡(luò)大數(shù)據(jù)的結(jié)合,既為傳統(tǒng)心理學(xué)通過具有代表性的大樣本深入挖掘個體層面的心理與行為機制提供了更為廣闊的平臺和機會,也同時為深入挖掘大規(guī)模人群在群體層面涌現(xiàn)出來的群體心理行為規(guī)律提供了可能。近些年,在心理學(xué)等社會科學(xué)和信息科學(xué)研究者的合作和共同努力下,在應(yīng)用社會心理學(xué)的諸多領(lǐng)域取得了一批具有代表性意義的研究成果。
(一)大數(shù)據(jù)與情緒心理學(xué)
情緒是心理學(xué)研究的重要研究對象之一,也是目前為止和大數(shù)據(jù)結(jié)合最為緊密、成果最為豐富的研究領(lǐng)域。傳統(tǒng)心理學(xué)關(guān)于個體情緒在日周期水平上的波動節(jié)律研究,尤其是主要圍繞積極情緒和消極情緒開展的研究,一直沒有得到較為一致的結(jié)果。在分析其原因時,研究者普遍承認目前的研究抽樣存在偏差(主要以美國大學(xué)生樣本為主),在實驗室或者通過自我報告的調(diào)查等測量方式對情緒的波動節(jié)律進行精確測量也均存在較大的偏差。但遵循心理學(xué)范式的研究者又暫時無法找到切實可行的,能夠?qū)缥幕髽颖救巳哼M行數(shù)周以上以小時為時間精度上追蹤研究的測量方法??紤]到以上研究現(xiàn)狀,美國康奈爾大學(xué)心理學(xué)家Golder和其合作者Macy認為,社交媒體的興起及其產(chǎn)生的覆蓋跨文化、大樣本、客觀、實時的海量用戶行為數(shù)據(jù),為解決這一困境提供了可能。[7]他們發(fā)表在《科學(xué)》雜志的一項研究分析了2008年2月至2010年1月期間,覆蓋全球84個使用英文的國家,約240多萬用戶產(chǎn)生的5億多條Twitter數(shù)據(jù)的情緒信息。結(jié)果發(fā)現(xiàn),積極情緒和消極情緒在一周七天內(nèi)的波動節(jié)律幾乎一致,積極情緒在周六、周日顯著高于工作日。在日內(nèi)波動上,積極情緒在早上(大約在人們上班的時間)開始下降,而在晚上(大約在人們下班的時間)回升;而消極情緒則在早上(早上7~9點附近)達到最低點,隨后在一天內(nèi)均呈上升趨勢,達到0點左右的峰值。這種模式支持了人們可通過一晚上的睡眠恢復(fù)情緒的假設(shè)。關(guān)于積極情緒和消極情緒的關(guān)系,研究者發(fā)現(xiàn)消極情緒的波動模式并不完全等同于積極情緒的反向波動特征,二者僅呈現(xiàn)出低度相關(guān)(r=-0.08)。該證據(jù)通過跨文化、地域的大樣本數(shù)據(jù)為積極情緒和消極情緒是兩個獨立的維度提供了支持。研究者進一步由情緒的日內(nèi)波動規(guī)律拓展到季節(jié)性波動規(guī)律,并嘗試同樣借助Twitter情緒數(shù)據(jù)探索當前心理學(xué)研究中關(guān)于季節(jié)性情感障礙的成因的兩種觀點,即光照時間不足的解釋和基于生物晝夜節(jié)律的“階段轉(zhuǎn)換假說”(phase-shift hypothesis)。結(jié)果發(fā)現(xiàn),絕對日照時長對積極情緒和消極情緒均沒有顯著作用,但相對日照時長卻與情緒有顯著關(guān)聯(lián)。因此,該結(jié)果支持了有關(guān)情緒與季節(jié)關(guān)聯(lián)的“階段轉(zhuǎn)換假說”,而沒有獲得“情緒隨日照時間變化”的競爭假說證據(jù)。[7]
情緒傳染和情緒傳播也是社會心理學(xué)中關(guān)于社會影響領(lǐng)域的重要議題。Kramer等基于Facebook上近69萬用戶的實驗研究發(fā)現(xiàn),人們的情緒狀態(tài)會無意識地體驗到與他人相同的情緒狀態(tài),即情緒可通過情緒傳染機制傳播給他人。他們通過客觀實驗的方法證實了僅僅暴露在完全缺乏非言語線索的好友情緒表達的網(wǎng)絡(luò)環(huán)境中也可以發(fā)生情緒傳染效應(yīng)。[8]Coviello等也探討了類似的問題,研究者抓取了2009年1月至2012年3月期間美國100個大城市Facebook用戶的“狀態(tài)”數(shù)據(jù),結(jié)果發(fā)現(xiàn),下雨天會直接影響人們的Facebook狀態(tài)中的情緒水平,有趣的是,這種情緒狀態(tài)還能進一步影響到遠在其他城市,沒有直接體驗到下雨天氣的好友的情緒水平。該研究也證實了情緒傳染的傳染機制,并且揭示了在線社交網(wǎng)絡(luò)在放大全球情緒同步中扮演的重要作用。[9]Facebook數(shù)據(jù)已經(jīng)成為心理學(xué)研究者探索大規(guī)模人群社會影響作用機制的重要工具。例如,Aral和Walker通過130萬Facebook用戶的隨機實驗,較為系統(tǒng)地揭示了人們在社交網(wǎng)絡(luò)中影響力和易受影響程度的規(guī)律特征。結(jié)果發(fā)現(xiàn):年輕人相對年長者更容易被影響;男性比女性影響力大,但女性對男性的影響力比她們對其他女性的影響力大;已婚人士在新產(chǎn)品決策中最不容易受影響。[10]
(二)大數(shù)據(jù)與人格心理學(xué)
揭示人們心理行為一般規(guī)律的人格心理學(xué)是心理學(xué)的基礎(chǔ)性研究領(lǐng)域。傳統(tǒng)心理學(xué)研究主要通過自我報告的線下問卷調(diào)查方法對人格結(jié)構(gòu)開展了一系列卓有成效的研究,例如經(jīng)典的“大五人格模型”(Five-factor Model)。對于人格心理學(xué)研究者而言,網(wǎng)絡(luò)大數(shù)據(jù)為刻畫和挖掘人們的心理行為規(guī)律提供了新的視角和數(shù)據(jù)資源。對于計算機科學(xué)領(lǐng)域的研究者而言,挖掘用戶的心理與行為規(guī)律對于提高技術(shù)的準確度、提升產(chǎn)品的用戶體驗具有重要意義。因此,基于大數(shù)據(jù)的人格心理學(xué)研究,也成為了心理學(xué)與信息科學(xué)結(jié)合的重要研究議題。
語言被認為是人們在表達自己內(nèi)在想法和感受時使用最為普遍、穩(wěn)定的方式。因此,研究者致力于挖掘人們在網(wǎng)絡(luò)上的語言表達與人格特征之間的關(guān)聯(lián)。例如,Schwartz等基于7.5萬志愿者提供的人格測驗結(jié)果,以及從用戶Facebook信息中提取得到的7億條單詞、短語和話題數(shù)據(jù),較為系統(tǒng)地探索了用戶在Facebook上的語言表達與其人格、性別、年齡之間的關(guān)系。結(jié)果發(fā)現(xiàn):外向型的用戶更傾向于提及“聚會”“愛你”等詞匯;開放型的用戶更傾向于提及“音樂”“藝術(shù)”“夢想”等詞匯;而神經(jīng)質(zhì)的用戶則更傾向于提及“厭煩”“抑郁”等詞匯。研究者采用了開源詞匯技術(shù)(open-vocabulary technique)來構(gòu)建人格預(yù)測模型,并在樣本外測試中達到了91.9%的預(yù)測準確率。[11]該團隊的Park等進一步通過Facebook用戶的樣本檢驗了該人格預(yù)測模型的穩(wěn)健性,結(jié)果證明了基于社交媒體語言表達數(shù)據(jù)和開源詞匯技術(shù)的自動化人格預(yù)測模型具有較好的信度和外在效度。[12]
還有不少研究發(fā)現(xiàn),人們在社交網(wǎng)絡(luò)上的一些客觀行為,例如Facebook上的點贊行為,也為開發(fā)自動化預(yù)測用戶人格或其他屬性的計算機模型提供了可能。例如,Kosinski等通過5.8萬Facebook用戶的點贊數(shù)據(jù)、人格測試等心理測驗數(shù)據(jù)以及人口統(tǒng)計學(xué)調(diào)查數(shù)據(jù),發(fā)現(xiàn)人們在Facebook的點贊數(shù)據(jù)能自動化地、較為準確地預(yù)測出用戶的人格、性取向、民族、宗教信仰、政治觀點、幸福感、物質(zhì)濫用、年齡、性別等特征和屬性。其中,對開放性人格維度的預(yù)測準確性幾乎與標準化的人格測試精度相近,對性取向的預(yù)測準確率達到88%,對民主主義和自由主義的政治態(tài)度預(yù)測準確率達到85%。[13]Wu等通過8.6 萬Facebook用戶網(wǎng)絡(luò)賬戶信息和人格測試數(shù)據(jù)發(fā)現(xiàn),基于用戶的Facebook點贊等電子化行為信息構(gòu)建的機器學(xué)習(xí)計算機模型對人格具有顯著預(yù)測力。尤為有趣的是,基于Facebook點贊數(shù)據(jù)構(gòu)建的人格預(yù)測模型(與用戶自身的人格測驗相關(guān)r=0.56)準確率要比與用戶關(guān)系親密的好友通過問卷調(diào)查的判斷(r=0.49)準確率還高。[14]
(三)大數(shù)據(jù)與行為金融學(xué)
行為金融學(xué)的研究致力于揭示人們的非理性成分在金融決策中的作用,或者說人們在有限理性情境下的決策規(guī)律。其中,以情緒與決策之間的關(guān)系最具代表性,例如,情緒預(yù)測股市的研究。賴凱聲等對情緒預(yù)測股市的理論機制,圍繞投資者情緒指標、社會情緒指標的實證研究等多方面進行了較為系統(tǒng)的梳理。[15]他們認為,近些年隨著網(wǎng)絡(luò)的普及和信息科學(xué)技術(shù)的發(fā)展,基于網(wǎng)絡(luò)大數(shù)據(jù)的社會情緒研究,為情緒與股市的關(guān)系這一遠未形成定論的研究領(lǐng)域注入了新的活力。尤其是考慮到股市走勢是宏觀群體層面市場投資者共同決策的結(jié)果,傳統(tǒng)行為經(jīng)濟學(xué)常用的實驗范式難以直接回答宏觀群體心理與金融決策之間的關(guān)系。因此,基于人們在網(wǎng)絡(luò)環(huán)境下留下的客觀行為數(shù)據(jù)成為挖掘群體心理與宏觀金融決策關(guān)系研究的重要線索。
例如,Bollen等利用心理學(xué)情緒量表設(shè)定的情緒分類標準,分析了2008年美國微博網(wǎng)站Twitter上的海量數(shù)據(jù),發(fā)現(xiàn)Twitter用戶微博條目中的“鎮(zhèn)定”(calm)類情緒詞匯量變化趨勢可以成功預(yù)測2~6天后美國道瓊斯工業(yè)指數(shù)的升降趨勢,對于指數(shù)升降的預(yù)測準確率可達到87%。[16]Bordino等的研究發(fā)現(xiàn),納斯達克100指數(shù)與其成分股的雅虎搜索量顯著相關(guān),并且在搜索指數(shù)的峰值附近有提前1天的預(yù)測作用。[17]Preis等系統(tǒng)考察了98個金融相關(guān)詞匯的Google搜索數(shù)據(jù)與美國股市走勢之間的關(guān)系。結(jié)果發(fā)現(xiàn)金融詞匯的搜索數(shù)據(jù)能提前預(yù)測股市的走勢,并且也證明了基于以上規(guī)律構(gòu)建的量化策略的確能跑贏隨機策略。[18]
(四)大數(shù)據(jù)與健康心理學(xué)
隨著人們對健康問題的關(guān)注,與健康相關(guān)的心理與行為規(guī)律也逐漸受到公共醫(yī)學(xué)、心理學(xué)等跨學(xué)科領(lǐng)域研究者的關(guān)注。大數(shù)據(jù)應(yīng)用于健康相關(guān)的研究議題,無論是在學(xué)術(shù)界還是產(chǎn)業(yè)界都是關(guān)注度非常高的應(yīng)用領(lǐng)域之一。利用網(wǎng)絡(luò)大數(shù)據(jù)進行健康心理領(lǐng)域研究的基本前提假設(shè)是:人們線下的健康狀況、健康行為等特征與其在線上的社交媒體表達、網(wǎng)絡(luò)搜索關(guān)注等行為之間存在一定的聯(lián)系。因此,基于大數(shù)據(jù)的健康心理學(xué)研究,可通過人們在網(wǎng)絡(luò)上行為特征來盡可能地揭示、解釋甚至預(yù)測人們的健康狀況。
例如,Ginsberg等認為,每年大約有9 000萬成年人會通過網(wǎng)絡(luò)搜索引擎搜索特定疾病相關(guān)的信息,這為通過網(wǎng)絡(luò)搜索引擎數(shù)據(jù)監(jiān)測疾病暴發(fā)狀況提供了可能。[19]他們利用人們在Google上5 000萬條搜索數(shù)據(jù),成功開發(fā)了預(yù)測季節(jié)性流感傳播的模型。相較于傳統(tǒng)的流感預(yù)測工作,由于數(shù)據(jù)收集方法和過程的限制,往往會有1至2周的延遲。因此,他們的預(yù)測研究對于監(jiān)測和預(yù)測流感的暴發(fā)趨勢,從而為政府相關(guān)部門做好流感應(yīng)急準備和部署具有重要的價值。該研究引領(lǐng)了一大批基于網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測各種疾病的探索和嘗試。[20-22]此外,社交媒體數(shù)據(jù)也被證明對于預(yù)測健康問題具有重要作用。例如,Eichstaedt等的研究發(fā)現(xiàn),人們在Twitter上的網(wǎng)絡(luò)表達對于美國郡層面的心臟病死亡率有顯著預(yù)測作用。其中,與負面社會關(guān)系、分離和負面情緒(尤其是憤怒)相關(guān)的網(wǎng)絡(luò)表達與心臟病死亡率正相關(guān);而積極情緒和心理參與相關(guān)的網(wǎng)絡(luò)表達與心臟病死亡率負相關(guān)。[23]
除了疾病預(yù)測外,還有一些研究者也開展了一些借助網(wǎng)絡(luò)大數(shù)據(jù)揭示網(wǎng)絡(luò)線上行為與線下健康行為(例如,自殺行為)之間關(guān)系的研究。例如,McCarthy利用谷歌網(wǎng)站記錄的2004年至2007年間網(wǎng)民對于自殺、自殘類詞匯的搜索量數(shù)據(jù),發(fā)現(xiàn)其與美國疾病控制與預(yù)防中心(the Centers for Disease Control and Prevention,CDC)記載的2004年至2007年期間大眾現(xiàn)實自殺、自殘數(shù)據(jù)呈顯著統(tǒng)計相關(guān)關(guān)系。但在大眾群體中呈顯著負相關(guān),在青少年群體中卻呈顯著正相關(guān)。[24]
(五)大數(shù)據(jù)與政治心理學(xué)
大數(shù)據(jù)也被廣泛應(yīng)用到政治心理學(xué)議題中,包括選舉行為及其相關(guān)心理規(guī)律,與政治意識形態(tài)相關(guān)的心理學(xué)規(guī)律。例如,Caldarelli等的研究發(fā)現(xiàn),意大利網(wǎng)民在Twitter上提及各黨派領(lǐng)導(dǎo)人的微博數(shù)量及其隨時間的變化特征對于預(yù)測全國政治大選具有顯著價值。[25]Markey通過分析2004、2006、2008年美國大選期間,搜索引擎網(wǎng)站Google上美國各州的色情類詞匯搜索量波動趨勢,發(fā)現(xiàn)如果某政黨“票倉州”所支持的參選者最終確實獲勝,選舉之后該州的色情類詞匯搜索量會快速上升,顯著高于其他州。該網(wǎng)絡(luò)行為現(xiàn)象驗證了進化心理學(xué)中著名的“挑戰(zhàn)假說”(Challenge Hypothesis)。[26]
在政治意識形態(tài)方面,Bond和Messing的研究證明了通過Facebook數(shù)據(jù)預(yù)測大眾政治意識形態(tài)的有效性和可行性,并提出了以此進一步開展政治計劃、政治意識形態(tài)結(jié)構(gòu)及其與政治參與率關(guān)系研究的研究方向。[27]Wojcik等最近發(fā)表在《科學(xué)》雜志的一項研究試圖探索到底持保守主義政治意識形態(tài)者和自由主義者誰更幸福。結(jié)果發(fā)現(xiàn),在自我報告的問卷調(diào)查結(jié)果中,持保守主義政治意識形態(tài)者報告了比自由主義者更高的幸福感,而通過Twitter等社交媒體數(shù)據(jù)的客觀幸福感指標(例如積極情緒的表達、微笑)看,保守主義者卻顯著地表達了比自由主義者更低的幸福感。[28]
(六)其他富有前景的應(yīng)用領(lǐng)域
大數(shù)據(jù)已經(jīng)廣泛應(yīng)用于心理學(xué)的各分支領(lǐng)域,并不局限于以上列舉的這些應(yīng)用領(lǐng)域。例如,在文化心理學(xué)研究領(lǐng)域,有研究者通過Google Ngram基于Google掃描全球所有已出版書籍中約4%數(shù)據(jù)集所提供的歷時近200年的大數(shù)據(jù)來研究文化的變遷[29-30],包括個體主義—集體主義文化的歷史變遷[31-33],美國性別平等文化與女性地位的歷史變遷等[34]。還有其他豐富的數(shù)據(jù)來源也被巧妙地應(yīng)用到各研究中。例如,通過15萬歷史名人的出生地、死亡地數(shù)據(jù)來反映歐洲和北美的文化歷史變遷[35];智能手機的數(shù)據(jù)被應(yīng)用于實時刻畫大規(guī)模人群的人口分布[36],研究人們對突發(fā)事件的集群行為規(guī)律。[37]
我國的社會心理學(xué)研究者已經(jīng)主要就中國微博情緒的在線測量和應(yīng)用問題,嘗試與信息科學(xué)領(lǐng)域的研究者一起展開了一系列的研究和探索。
(一)微博情緒測量工具的開發(fā)
微博積累的海量信息為直接測量大規(guī)模人群的態(tài)度、社會情緒提供了可能。對在線文本進行情感分析一直是信息科學(xué)領(lǐng)域的熱點問題,但傳統(tǒng)在線文本分析技術(shù)主要以數(shù)據(jù)驅(qū)動或者經(jīng)驗驅(qū)動,例如包含正向情緒和負向情緒的二分法。情緒、情感是心理學(xué)領(lǐng)域的經(jīng)典研究問題,將心理學(xué)領(lǐng)域關(guān)于情緒相關(guān)的研究成果應(yīng)用于在線文本分析技術(shù),可從理論視角為提升在線文本分析技術(shù)的有效性提供支持和幫助。樂國安等對情感分析技術(shù)、情緒詞庫的構(gòu)建與發(fā)展、在線文本情感分析技術(shù)的實踐應(yīng)用等問題進行了較為系統(tǒng)的總結(jié)和歸納。[38]
詞匯匹配技術(shù)是目前分析海量微博客(例如Twitter、新浪微博)使用最為廣泛,也是效果相對較好的方法。該方法的原理主要是通過統(tǒng)計目標文本中與情緒詞庫中特定類型的情緒詞的詞頻多少來計算該文本的情緒定向。[39]因此,情緒詞庫的建設(shè)是基于詞匯匹配技術(shù)的在線文本情感分析技術(shù)的核心。董穎紅等基于心理學(xué)經(jīng)典的基本情緒結(jié)構(gòu)理論,將微博情緒分為快樂、悲傷、憤怒、恐懼和厭惡五種(其中驚奇情緒由于在測試中發(fā)現(xiàn)使用頻率較低而未納入詞庫中),構(gòu)建了包含818個情緒詞(快樂306個;悲傷205個;厭惡142個;恐懼72個;憤怒93個)的標準化微博客基本情緒詞庫(Weibo Basic Mood Lexicon,Weibo-5BML)。[39]
為了檢驗該情緒詞庫和工具的有效性,研究團隊與華東師范大學(xué)軟件學(xué)院海量計算研究所團隊合作,在160多萬新浪微博用戶2011年7月至2012年11月期間發(fā)布的微博文本上進行測試。首先,對五種微博情緒之間的內(nèi)部相關(guān)性進行測試,結(jié)果發(fā)現(xiàn):快樂和悲傷、厭惡、憤怒、恐懼情緒均為顯著負相關(guān);而悲傷、厭惡、憤怒和恐懼情緒之間呈現(xiàn)顯著正相關(guān)。該檢驗結(jié)果與心理學(xué)經(jīng)典的情緒理論,例如效價—喚醒理論,有較好的一致性。其次,通過整理五種微博情緒在一周內(nèi)(周一至周日)的周變化趨勢,結(jié)果發(fā)現(xiàn):快樂情緒在周末顯著高于工作日,而周三的快樂情緒達到最低點。這為探索大規(guī)模人群的整體情緒的節(jié)律變化提供了新的證據(jù)。最后,為了檢驗微博情緒測量工具的生態(tài)效度,研究團隊還分析了五種微博情緒對現(xiàn)實社會中重大節(jié)日、重大社會熱點事件的反應(yīng)。結(jié)果發(fā)現(xiàn),微博情緒對2011年“7?23甬溫線旅客列車特別重大事故”、2012年“釣魚島之爭”、春節(jié)、中秋節(jié)、感恩節(jié)等重大事件和節(jié)假日都呈現(xiàn)出了較為靈敏而合理的反應(yīng)。例如,2011年7月23日,甬溫線段發(fā)生了旅客列車特別重大事故,事故發(fā)生當天,快樂情緒開始下降,而悲傷、憤怒和恐懼情緒開始上升。隨后的幾天人們一直沉浸在悲傷、憤怒和恐懼的氛圍中,一直到7月29日悼念活動結(jié)束以后公眾的各種基本情緒才逐漸恢復(fù)到往日的水平。尤其是在事故發(fā)生之初,生命至上、緊急救援是主要問題,因此人們的悲傷情緒首先上升到高點;但隨著時間的推移,事故的處理方式和對原因的調(diào)查使得公眾對政府的不滿、憤怒情緒不斷推高。以上檢驗結(jié)果表明,研究團隊基于基本情緒結(jié)構(gòu)理論開發(fā)的Weibo-5BML微博情緒測量工具,在分析大眾情緒信息時是有效的,這對于實時、高效地感知公眾的社會情緒變化具有重要的意義。[39]
(二)基于微博情緒的應(yīng)用社會心理學(xué)研究
1.預(yù)測股市
在發(fā)現(xiàn)新浪微博上單個情緒詞(例如“緊張”)與上證指數(shù)之間存在顯著關(guān)聯(lián)的基礎(chǔ)上,為了探索更一般性的微博情緒與股市關(guān)系,賴凱聲等基于心理學(xué)的情緒理論和情緒測量量表,抓取了新浪微博上2011年8月1日至2012年2月29日期間2 242個情緒詞匯的詞頻數(shù)據(jù)。結(jié)果發(fā)現(xiàn),2242個情緒詞中,有993個情緒詞與上證指數(shù)之間存在顯著的相關(guān)關(guān)系,并且基于這2 242個情緒詞通過相關(guān)系數(shù)篩選、加權(quán)得到的微博情緒綜合指數(shù)與上證指數(shù)之間的相關(guān)高達0.877。進一步對微博情緒綜合指數(shù)和上證指數(shù)的時間序列構(gòu)建協(xié)整模型發(fā)現(xiàn),二者存在顯著的長期均衡關(guān)系,且微博情緒綜合指數(shù)能顯著預(yù)測下一個交易日的上證指數(shù)。[40]
Dong等通過構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具和2012年2月1日至2012年11月30日期間的新浪微博數(shù)據(jù),檢驗了不同類型的微博情緒與股市之間的關(guān)系。研究結(jié)果發(fā)現(xiàn),五種情緒中悲傷情緒能顯著提高上證指數(shù)成交量(預(yù)測準確率提高2.4%)。考慮到悲傷情緒的喚醒度最低,研究者再把悲傷情緒詞中喚醒度最低的25%作為新的悲傷指數(shù),結(jié)果發(fā)現(xiàn)對上證指數(shù)成交量的預(yù)測能力仍然顯著。該研究結(jié)果表明,具有低喚醒度的負性情緒與上證指數(shù)交易量相關(guān),該結(jié)果從群體層面支持了情緒維持假說,并為情緒泛化假說和情緒維持假說的爭論提供了新證據(jù)。[41]
2.風(fēng)險社會預(yù)測
處于社會轉(zhuǎn)型期和全球化進程的中國社會面臨著各種社會風(fēng)險。個體層面的研究認為,由感知的社會風(fēng)險誘發(fā)的情緒,例如憤怒,可能會引發(fā)集體行動。但在宏觀群體層面,由于測量手段和成本的限制,大眾感知的社會風(fēng)險與社會情緒之間的關(guān)系并不明確。為探索大眾對感知的社會風(fēng)險的情緒反應(yīng)規(guī)律,Dong等的研究通過百度搜索數(shù)據(jù)來刻畫中國網(wǎng)民的社會風(fēng)險感知水平(分為社會穩(wěn)定風(fēng)險、日常生活風(fēng)險、資源環(huán)境風(fēng)險、公共道德風(fēng)險、政府執(zhí)政風(fēng)險、國家安全風(fēng)險、經(jīng)濟金融風(fēng)險七大類),通過微博客基本情緒詞庫(Weibo-5BML)工具分析新浪微博數(shù)據(jù)得到五類基本情緒水平。通過Granger因果檢驗發(fā)現(xiàn),大眾感知的社會風(fēng)險對社會情緒有顯著的預(yù)測力,但不同的風(fēng)險類型對不同情緒的預(yù)測力是不同的。例如,感知的政治執(zhí)政風(fēng)險能顯著預(yù)測憤怒情緒,資源環(huán)境風(fēng)險感知能顯著預(yù)測未來2~5日的悲傷情緒。[42]
另一方面,大眾感知的社會風(fēng)險對社會穩(wěn)定和社會和諧有負面影響,因此研究群體層面的大眾情緒能否影響或預(yù)測社會風(fēng)險感知也具有重要意義。Dong等同樣采用百度搜索數(shù)據(jù)和新浪微博數(shù)據(jù),研究了中國網(wǎng)民的社會情緒對大眾社會風(fēng)險感知的預(yù)測效果。結(jié)果發(fā)現(xiàn),社會情緒對大眾感知的社會風(fēng)險具有顯著的預(yù)測力,但不同的社會情緒對不同類型的社會風(fēng)險感知的預(yù)測效果是不同的。相比快樂情緒,悲傷、厭惡、憤怒、恐懼四種負性社會情緒是社會風(fēng)險感知水平更為重要的預(yù)測變量。關(guān)于社會風(fēng)險與社會風(fēng)險感知水平的關(guān)系研究表明,通過社會化媒體捕捉和研究大眾心理特征和規(guī)律是可行的。[43]
3.精英與大眾的微博情緒關(guān)系
關(guān)于精英與大眾的關(guān)系一直是政治學(xué)、社會學(xué)、傳播學(xué)、心理學(xué)等多學(xué)科領(lǐng)域?qū)W者關(guān)注的問題。傳播學(xué)的意見領(lǐng)袖研究認為,意見領(lǐng)袖在信息傳播中起著二級傳播的作用,對大眾具有重要的引領(lǐng)作用;政治學(xué)領(lǐng)域的研究者認為,政治精英只是強化和激發(fā)現(xiàn)存的公共輿論,整體上對公共輿論的影響是“微不足道”的;而另一些研究則反對這種認為影響微不足道的觀點,并給出了一些政治精英利用大眾傳媒操縱公共輿論的證據(jù)。隨著社會的發(fā)展,精英和大眾之間的關(guān)系變得越來越復(fù)雜。尤其是互聯(lián)網(wǎng)時代,微博等自媒體的發(fā)展,精英與大眾互動的頻率和強度都產(chǎn)生了巨大的飛躍,這無疑更加凸顯了探究精英和大眾的關(guān)系問題的重要性。精英是因為能準確感知大眾輿論的趨勢,迎合或順應(yīng)大眾的“民意”,從而獲得大眾擁戴,即“時勢造英雄”;還是因為能憑借自身能力制造、引領(lǐng)時勢,充當大眾引領(lǐng)者的角色,即“英雄造時勢”?
Lai等以微博情緒的分析視角為切入點,借助研究團隊構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具和新浪微博2011—2012年的微博數(shù)據(jù),探索了覆蓋房地產(chǎn)、教育等9個行業(yè)的894名微博精英和160多萬名大眾用戶之間的微博情緒關(guān)系。綜合分析9大領(lǐng)域結(jié)果發(fā)現(xiàn):(1)當下中國的經(jīng)濟資本比文化資本具有更大的影響力。房產(chǎn)、財經(jīng)和科技類意見領(lǐng)袖(即經(jīng)濟資本領(lǐng)域)均有顯著領(lǐng)先于大眾情緒的傾向,而傳媒、時尚、藝術(shù)、娛樂、教育、文學(xué)意見領(lǐng)袖(即文化資本領(lǐng)域)領(lǐng)先大眾情緒的傾向相對更低甚至落后于大眾情緒。(2)不同領(lǐng)域、不同情緒類型下的影響關(guān)系不完全相同,但總體來看,“時勢造英雄”的效果要比“英雄造時勢”的效果強些。(3)消極情緒比積極情緒更易傳播。其中,積極情緒中快樂情緒在4個領(lǐng)域的意見領(lǐng)袖群體和大眾情緒中有顯著的領(lǐng)先和滯后關(guān)系;而消極情緒中悲傷情緒在8個領(lǐng)域、厭惡情緒在6個領(lǐng)域、恐懼情緒在5個領(lǐng)域、憤怒情緒在2個領(lǐng)域內(nèi)的意見領(lǐng)袖群體和大眾情緒中有顯著的領(lǐng)先和滯后關(guān)系??偟膩碚f,經(jīng)濟資本和文化資本之間的支配和被支配關(guān)系取決于哪類資本占據(jù)了相對較高的話語權(quán)?;谖⒉┣榫w的研究發(fā)現(xiàn)經(jīng)濟資本比文化資本更具影響力的結(jié)果在一定程度上能反映轉(zhuǎn)型期中國文化轉(zhuǎn)型落后于經(jīng)濟轉(zhuǎn)型的社會現(xiàn)狀。[44]
4.厭惡情緒預(yù)測地區(qū)民族主義
關(guān)注情緒的進化意義的研究者認為,厭惡情緒可保護人們免受有毒物質(zhì)、病菌和疾病的威脅。[45]厭惡情緒在道德決策和意識形態(tài)層面的影響作用也得到了研究者的關(guān)注。個體層面的實驗和調(diào)查證據(jù)發(fā)現(xiàn),厭惡情緒與個體的政治意識形態(tài),例如預(yù)測保守主義、投票行為,有顯著關(guān)聯(lián)。民族主義是個體認同或依附于自己民族和國家的一種信仰或意識形態(tài),具有以自我民族中心,以及排斥、貶低外民族的傾向等主要特征。那么,在群體層面的厭惡情緒與地區(qū)的民族主義是否有關(guān)聯(lián)?
高樹青等借助研究團隊構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具來測量2011年中國各?。ㄊ?、自治區(qū))的新浪微博厭惡情緒表達,并結(jié)合包含17萬網(wǎng)民樣本的“中國政治坐標系測試”關(guān)于政治意識形態(tài)網(wǎng)絡(luò)大調(diào)查數(shù)據(jù),從宏觀層面探索了網(wǎng)絡(luò)厭惡情緒表達與地區(qū)民主主義之間的關(guān)系。研究結(jié)果發(fā)現(xiàn):(1)中國各省的厭惡情緒表達與地區(qū)民族主義存在顯著相關(guān);(2)在控制了各省的人均GDP、地理封閉性、農(nóng)村人口比重等變量之后,厭惡情緒表達與地區(qū)民族主義之間的相關(guān)仍然顯著;(3)進一步的穩(wěn)健性檢驗發(fā)現(xiàn),5類基本情緒中,有且僅有厭惡情緒與地區(qū)民族主義具有顯著關(guān)聯(lián)。因此,微博厭惡情緒表達與地區(qū)民族主義正相關(guān)的結(jié)果具有較好的區(qū)分效度,這為理解群體層面的情緒表達和民族主義傾向之間的關(guān)系提供了直接證據(jù)。[46]
(一)大數(shù)據(jù)“萬能論”與“無用論”
關(guān)于網(wǎng)絡(luò)大數(shù)據(jù)的定位問題,尤其是大數(shù)據(jù)在受到商界熱炒的背景下,如何客觀、理性地看待大數(shù)據(jù)研究也是一個值得討論的問題。認為大數(shù)據(jù)能解決一切問題,采用大數(shù)據(jù)的研究方法就是高質(zhì)量的研究,這便是推崇大數(shù)據(jù)“萬能論”;也有觀點認為大數(shù)據(jù)一無是處,存在數(shù)據(jù)不精確,結(jié)果是偽相關(guān)等問題,便是信奉大數(shù)據(jù)“無用論”。筆者認為,我們既不要盲從于大數(shù)據(jù)“萬能論”,也不必因大數(shù)據(jù)“無用論”而望而卻步。客觀來講,大數(shù)據(jù)更像是一種新范式或者新方法,它有它自己的優(yōu)勢,例如樣本量大、生態(tài)效度高。大數(shù)據(jù)也有一些缺陷,包括不精確、信度低,難以揭示因果等問題。正如傳統(tǒng)的實驗法有控制嚴格的優(yōu)點和生態(tài)效度低的缺點,而問卷法有被試范圍廣的優(yōu)點和存在社會稱許性反應(yīng)的弊端一樣,大數(shù)據(jù)會存在優(yōu)點和缺點自然也屬情理之中。因此,將大數(shù)據(jù)看成一種新的研究范式,研究者可以更好地結(jié)合一般方法論、研究范式的優(yōu)缺點的視角來客觀、理性地評價和應(yīng)用它。
(二)大數(shù)據(jù)的因果關(guān)系問題
大數(shù)據(jù)研究具有全體、混雜和相關(guān)三大特點。[47]27-96其中,相關(guān)指的是大數(shù)據(jù)研究通常更加關(guān)注相關(guān)性,而不是因果性。因果關(guān)系的確立需要排除很多可能的干擾因素,而大數(shù)據(jù)混雜的特點很難保證因果關(guān)系的推論,要通過大數(shù)據(jù)來研究因果是比較困難的。很多大數(shù)據(jù)研究中找到的因果也只是統(tǒng)計學(xué)意義上的因果,例如,基于Granger因果檢驗的研究。但統(tǒng)計意義上的因果關(guān)系代表的是數(shù)據(jù)在時間上的領(lǐng)先滯后關(guān)系,與邏輯學(xué)意義上的因果并不等同。因此,如果需要進一步確定因果關(guān)系,建議可再結(jié)合傳統(tǒng)的實驗法進行檢驗和確定。值得一提的是,大數(shù)據(jù)發(fā)現(xiàn)的相關(guān),尤其是時間序列上的領(lǐng)先—滯后相關(guān)由于具有預(yù)測性,因此仍然是具有較強的實踐應(yīng)用價值的。這也可能是大數(shù)據(jù)在產(chǎn)業(yè)界傳播范圍廣、影響力大的重要原因之一。
(三)大數(shù)據(jù)的隱私問題
在大數(shù)據(jù)被廣泛應(yīng)用于科研、商業(yè)和管理等諸多實踐領(lǐng)域的同時,人們也開始思考大數(shù)據(jù)對人類帶來的威脅和負面影響。其中以對數(shù)據(jù)隱私問題的顧慮最具代表性。人們在搜索引擎上的搜索記錄、在電子商務(wù)網(wǎng)站上的購物記錄、在社交媒體上與好友的互動記錄等,這些數(shù)據(jù)都被網(wǎng)絡(luò)服務(wù)商所掌握。這些數(shù)據(jù)的安全性則成為了網(wǎng)絡(luò)信息化社會的一大隱患。尤其是2013年的“棱鏡門”事件更是激發(fā)了人們對數(shù)據(jù)安全、數(shù)據(jù)隱私問題的關(guān)注。關(guān)于數(shù)據(jù)收集者是否有權(quán)收集、分析以及使用相關(guān)信息也引起了廣泛的討論。例如,傳統(tǒng)社會中,由于社會流動性的存在,對于一些犯過一些過錯的人,往往還具備通過更換環(huán)境來重新開啟新生活的權(quán)力。但網(wǎng)絡(luò)社會信息的全覆蓋,一旦有任何負面的信息發(fā)布到網(wǎng)上,幾乎世界上任何有互聯(lián)網(wǎng)覆蓋的角落都能知道該信息,并且它可能被永久的記載。換言之,在大數(shù)據(jù)時代,人們的隱私空間越來越小,這種現(xiàn)象被稱為“被遺忘權(quán)”的剝奪。數(shù)據(jù)隱私權(quán)隱患引起了社會各界的大討論,世界各國已經(jīng)開始著手建設(shè)和完善大數(shù)據(jù)隱私保護相關(guān)的法律。對于學(xué)術(shù)研究而言,大數(shù)據(jù)研究者可通過建立一個自由、透明的學(xué)術(shù)共同體,共同遵循和監(jiān)督在充分保證用戶個人隱私的條件下開展有價值的學(xué)術(shù)研究的數(shù)據(jù)使用原則。例如,對個體關(guān)鍵信息進行匿名化處理是大數(shù)據(jù)研究中常用的保護用戶個人隱私的辦法。
近些年圍繞網(wǎng)絡(luò)大數(shù)據(jù)的社會心理學(xué)研究展現(xiàn)出了巨大的發(fā)展?jié)摿?,在研究視角、研究方法的多元化等方面都取得了重大的突破?013 年Watts曾就計算社會科學(xué)的研究現(xiàn)狀和面臨的挑戰(zhàn)問題指出,雖然目前已經(jīng)有了成百上千篇關(guān)于社會網(wǎng)絡(luò)、金融危機、群體形成等問題相關(guān)的計算社會科學(xué)研究成果,但這些成果中很少能被傳統(tǒng)社會科學(xué)的期刊所認可并發(fā)表。[48]換言之,Watts一針見血地指出了當時信息科學(xué)領(lǐng)域研究者與社會科學(xué)研究者之間的合作仍然不夠充分,從而導(dǎo)致主流社會科學(xué)和計算社會科學(xué)研究領(lǐng)域之間仍然存在較深隔閡的問題。這也與大多數(shù)計算社會科學(xué)領(lǐng)域的研究缺乏對傳統(tǒng)社會科學(xué)理論和現(xiàn)實重要社會實踐的關(guān)注有關(guān)。對于大數(shù)據(jù)心理學(xué)研究領(lǐng)域的發(fā)展而言,該問題和挑戰(zhàn)同樣存在,并且將長期存在。值得肯定的是,就在最近的幾年發(fā)展中,已經(jīng)開始涌現(xiàn)出一批具有代表性意義的大數(shù)據(jù)心理學(xué)研究,并得到了一些主流心理學(xué)期刊的認可。例如,在2014—2015年期間,有多篇基于Facebook、Twitter、Google網(wǎng)絡(luò)搜索的大數(shù)據(jù)研究相繼在社會心理學(xué)領(lǐng)域的國際頂級期刊,如美國的《人格與社會心理學(xué)》《心理科學(xué)》等雜志上發(fā)表。這意味著基于大數(shù)據(jù)的社會心理學(xué)研究領(lǐng)域已經(jīng)逐漸步入主流心理學(xué)研究的視野,并開始展示其蓬勃的生命力。筆者認為,要想獲得長足的發(fā)展,并且真正獲得主流心理學(xué)的認可,研究者在未來研究中不能僅僅只把網(wǎng)絡(luò)作為一種人類活動的特定情境來研究網(wǎng)絡(luò)用戶的心理與行為規(guī)律,更應(yīng)重視借助網(wǎng)絡(luò)大數(shù)據(jù)相關(guān)的研究技術(shù)和手段來解決心理學(xué)領(lǐng)域的重要理論和現(xiàn)實問題。
尤其是對于國內(nèi)的研究者而言,國內(nèi)相關(guān)領(lǐng)域的研究總體上仍處于探索期,研究成果和經(jīng)驗相對較少。這既意味著存在廣闊的發(fā)展空間,也意味著面臨巨大的挑戰(zhàn)。數(shù)據(jù)公開、數(shù)據(jù)共享也是未來發(fā)展的大趨勢。我國作為人口大國,網(wǎng)民用戶群體規(guī)模龐大,這為研究者研究轉(zhuǎn)型期中國人的心理與行為規(guī)律提供了鮮活的證據(jù)。當前正處于轉(zhuǎn)型期的中國,在大眾心理與行為層面涌現(xiàn)出許多可供深入挖掘的研究資源。建議國內(nèi)研究者在延續(xù)傳統(tǒng)心理學(xué)研究范式,探討網(wǎng)絡(luò)化環(huán)境下個體心理、社會適應(yīng)的影響機制研究的同時,也多關(guān)注借助網(wǎng)絡(luò)大數(shù)據(jù)探索群體心理和行為問題。這對于及時發(fā)現(xiàn)和解決社會問題,從而促進社會的和諧發(fā)展具有重要的意義。
建議未來研究多結(jié)合心理信息學(xué)的視角,將網(wǎng)絡(luò)大數(shù)據(jù)研究技術(shù)多應(yīng)用于解決具有重要現(xiàn)實意義的社會問題(例如,醫(yī)療衛(wèi)生問題、幸福感問題、環(huán)境問題),落實心理學(xué)服務(wù)社會的使命。從已有的研究證據(jù)來看,心理信息學(xué)的研究范式不但在探索有關(guān)個體和群體心理與行為規(guī)律的研究問題上展示出了巨大的潛力,還能幫助研究者從理論驅(qū)動出發(fā),通過網(wǎng)絡(luò)大數(shù)據(jù)來驗證一些心理學(xué)的經(jīng)典假設(shè),從而為理論假說、爭論提供新的證據(jù)。因此,心理信息學(xué)有望成為未來心理學(xué)發(fā)展的重要方向之一。[1]但心理信息學(xué)研究的順利開展,需要心理學(xué)和信息科學(xué)領(lǐng)域研究者的密切配合以及相關(guān)資源的全力支持。建議國家多提供一些跨學(xué)科領(lǐng)域合作的資源項目,支持和鼓勵開展跨學(xué)科領(lǐng)域合作的課題;而研究者自身則應(yīng)能主動地學(xué)習(xí)和了解相關(guān)領(lǐng)域的知識,打破傳統(tǒng)的學(xué)科思維界限,積極投身于跨學(xué)科合作實踐中,從而把握網(wǎng)絡(luò)大數(shù)據(jù)時代的機遇。
參考文獻
[1]薛婷,陳浩,賴凱聲,等.心理信息學(xué):網(wǎng)絡(luò)信息時代下的心理學(xué)新發(fā)展[J].心理科學(xué)進展,2015,23(2).
[2]陳浩,樂國安,李萌,等.計算社會科學(xué):社會科學(xué)與信息科學(xué)的共同機遇[J].西南大學(xué)學(xué)報(社會科學(xué)版),2013,39(3).
[3]Lazer D,Pentland A S,Adamic L,et al.Life in the network:The coming age of computational social science[J].Science,2009,323(5915).
[4]Yarkoni T.Psychoinformatics new horizons at the interface of the psychological and computing sciences[J].Current Directions in Psychological Science,2012,21(6).
[5]Gosling S D,Mason W.Internet research in psychology[J].Annual Review of Psychology,2014,66.
[6]Gosling S D,Vazire S,Srivastava S,et al.Should we trust web-based studies? A comparative analysis of six preconceptions about internet questionnaires[J].American Psychologist,2004,59(2).
[7]Golder S A,Macy M W.Diurnal and seasonal mood vary with work,sleep,and daylength across diverse cultures [J].Science,2011,333(6051).
[8]Kramer A D I,Guillory J E,Hancock J T.Experimental evidence of massive-scale emotional contagion through social networks[J].Proceedings of the National Academy of Sciences,2014,111(24).
[9]Lorenzo C,Yunkyu S,Kramer A D I,et al.Detecting emotional contagion in massive social networks[J].PLoS ONE,2014,9(3).
[10]Aral S,Walker D.Identifying influential and susceptible members of social networks[J].Science,2012,337(6092).
[11]Schwartz H A,Eichstaedt J C,Kern M L,et al.Personality,gender,and age in the language of social media:the open-vocabulary approach[J].PLoS ONE,2013,8(9).
[12]Park G,Schwartz H A,Eichstaedt J C,et al.Automatic personality assessment through social media language[J].Journal of Personality and Social Psychology,2015,108(6).
[13]Michal K,David S,Thore G.Private traits and attributes are predictable from digital records of human behavior[J].Proceedings of the National Academy of Sciences,2013,110(15).
[14]Youyou W,Kosinski M,Stillwell D.Computer-based personality judgments are more accurate than those made by humans[J].Proceedings of the National Academy of Sciences,2015,112(4).
[15]賴凱聲,陳浩,樂國安,董穎紅.情緒能預(yù)測股市嗎?[J].心理科學(xué)進展,2014,22(11).
[16]Bollen J,Mao H,Zeng X.Twitter mood predicts the stock market[J].Journal of Computational Science,2011,2(1).
[17]Bordino I,Battiston S,Caldarelli G,et al.Web search queries can predict stock market volumes[J].PLoS ONE,2012,7(7).
[18]Preis T,Moat H S,Stanley H E.Quantifying trading behavior in financial markets using google trends[J].Scientific Reports,2013,3(7446).
[19]Ginsberg J,Mohebbi M H,Patel R S,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009,457(7232).
[20]Breyer B N,Eisenberg M L.Use of google in study of noninfectious medical conditions[J].Epidemiology,2010,21 (4).
[21]Frijters P,Johnston D W,Lordan G,et al.Exploring the relationship between macroeconomic conditions and problemdrinking as captured by google searches in the US[J].Social Science and Medicine,2013,84(5).
[22]Kang M,Zhong H,He J,et al.Using google trends for influenza surveillance in south China.[J].PLoS ONE,2013,8(1).
[23]Eichstaedt J C,Schwartz H A,Kern M L,et al.Psychological language on twitter predicts county-level heart disease mortality[J].Psychological Science,2015,26(2).
[24]McCarthy M J.Internet monitoring of suicide risk in the population[J].Journal of Affective Disorders,2010,122(3).
[25]Guido C,Alessandro C,F(xiàn)abio P,et al.A multi-level geographical study of Italian political elections from twitter data [J].PLoS ONE,2014,9(5).
[26]Markey P M,Markey C N.Changes in pornography-seeking behaviors following political elections:An examination of the challenge hypothesis[J].Evolution and Human Behavior,2010,31(6).
[27]Bond R,Messing S.Quantifying social media’s political space:Estimating ideology from publicly revealed preferences on facebook[J].American Political Science Review,2015,109(1).
[28]Wojcik S P,Arpine H,Jesse G,et al.Conservatives report,but liberals display,greater happiness[J].Science,2015,347(6227).
[29]Michel J B,Shen Y K,Aiden A P,et al.Quantitative analysis of culture using millions of digitized books[J].Science,2011,331(6014).
[30]Greenfield P M.The changing psychology of culture from 1800 through 2000[J].Psychological Science,2013,24 (9).
[31]Twenge J M,W Keith C,Brittany G.Increases in individualistic words and phrases in American books,1960-2008 [J].PLoS ONE,2012,7(7).
[32]Twenge J M,Campbell W K,Gentile B.Changes in pronoun use in American books and the rise of individualism,1960-2008[J].Journal of Cross-Cultural Psychology,2013,44(3).
[33]Hamamura T,Xu Y.Changes in Chinese culture as examined through changes in personal pronoun usage[J].Journal of Cross-Cultural Psychology,2015,46.
[34]Twenge J M,Campbell W K,Gentile B.Male and female pronoun use in U.S.books reflects women’s status,1900-2008[J].Sex Roles,2012,67(9-10).
[35]Schich M,Song C,Ahn Y Y,et al.A network framework of cultural history[J].Science,2014,345(6196).
[36]Deville P,Linard C,Martin S,et al.Dynamic population mapping using mobile phone data[J].Proceedings of the National Academy of Sciences,2014,111(45).
[37]Bagrow J P,Dashun W,Albert-László B.Collective response of human populations to large-scale emergencies[J].PLoS ONE,2011,6(3).
[38]樂國安,董穎紅,陳浩,等.在線文本情感分析技術(shù)及應(yīng)用[J].心理科學(xué)進展,2013,21(10).
[39]董穎紅,陳浩,賴凱聲,等.微博客基本社會情緒的測量及效度檢驗[J].心理科學(xué),2015,38(5).
[40]賴凱聲,陳浩,錢衛(wèi)寧,等.微博情緒與中國股市:基于協(xié)整分析[J].系統(tǒng)科學(xué)與數(shù)學(xué),2014,(5).
[41]Dong Y,Chen H,Qian W,et al.Micro-blog social moods and Chinese stock market:The influence of emotional valence and arousal on Shanghai composite index volume[J].International Journal of Embedded Systems,2015,7(2).
[42]Dong Y,Chen H,Tang X J,et al.Collective emotional reaction to societal risks in China[C].Hongkong:Proceedings of 2015 IEEE international conference on systems,man,and cybernetics(SMC),2015.
[43]Dong Y,Chen H,Tang X,et al.Prediction of social mood on chinese societal risk perception[C].Nanjing:Proceedings of the 2nd international conference on behavioral,economic,and socio-cultural computing(BESC),IEEE,2015.
[44]Lai K,Chen H,Qi L,et al.Times makes heroes or heroes shape their times?:The Emotion relationship between elites and masses on micro-blogging[C].Shanghai:Proceedings of the 1st international conference on behavior,economic and social computing(BESC),IEEE,2014.
[45]Inbar Y,Pizarro D,Iyer R,et al.Disgust sensitivity,political conservatism,and voting[J].Social Psychological andPersonality Science,2012,3(5).
[46]高樹青,陳浩,賴凱聲,等.厭惡情緒網(wǎng)絡(luò)表達與地區(qū)民族主義氛圍[C].天津:第十八屆全國心理學(xué)學(xué)術(shù)大會,2015.
[47]邁爾-舍恩伯格.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[48]Watts.Computational social science:exciting progress and grand challenges[EB/OL].[2015-08-23].http://www.naefrontiers.org/File.aspx?id=39645.
[責(zé)任編輯:江 波]
Progress in Big Data-based Social Psychological Research
YUE Guo-an LAI Kai-sheng
(Department of Social Psychology,Nankai University,Tianjin 300071,China)
Abstract:With the rapid development of the Internet and computer science and technology,psychological research based on big data has received increasing attention.The big data approach provides a new perspective for studying human psychological and behavioral patterns.As an important part of social sciences,psychology has shown great potential in the great wave of computational social sciences,and has informed fruitful research of significant theoretical and practical implications in various fields such as emotion psychology,personality psychology,behavioral finance,health psychology,and political psychology.Researchers in social psychology in China have conducted a series of pioneering researches regarding Weibo emotions,which are linked to various issues of social and practical significance such as the prediction of the stock market,social risk perception,the relationship between elites and the mass,and regional nationalism.Regarding the social psychology research based on big data,future researchers should put this new paradigm in perspective and fully develop its potential so as to solve the issues of significant theoretical and practical value in social sciences.
Key words:big data;psychoinformatics;Weibo;emotion
* 通訊作者:樂國安,E-mail:yuega@126.com。
中圖分類號:B849;C912.6-0
文獻標識碼:A
文章編號:2095-7068(2016)01-0001-11
收稿日期:2015-11-12
基金項目:國家社會科學(xué)基金重大項目“基于大規(guī)模網(wǎng)絡(luò)實際測量的個體與群體行為影響分析研究”(項目編號:12&ZD218)、國家社會科學(xué)基金重點項目“網(wǎng)絡(luò)群體性事件發(fā)展規(guī)律的社會學(xué)研究”(項目編號:12ASH006)、中國科學(xué)技術(shù)協(xié)會中國心理學(xué)會創(chuàng)新和服務(wù)能力提升工程優(yōu)秀科技社團建設(shè)項目“‘互聯(lián)網(wǎng)+’大戰(zhàn)略中的心理學(xué)應(yīng)用”的階段性研究成果。
作者簡介:樂國安(1946—),男,江西東鄉(xiāng)人,博士,南開大學(xué)周恩來政府管理學(xué)院社會心理學(xué)系教授、博士生導(dǎo)師,主要從事社會心理學(xué)、網(wǎng)絡(luò)心理學(xué)研究。