郝龍
互聯(lián)網(wǎng)社會(huì)科學(xué)實(shí)驗(yàn):方法創(chuàng)新與價(jià)值評(píng)價(jià)
郝龍
(南京航空航天大學(xué)人文與社會(huì)科學(xué)學(xué)院,江蘇南京,211100)
實(shí)驗(yàn)法是社會(huì)科學(xué)探索和檢驗(yàn)因果關(guān)系的最重要手段。隨著在線行為與在線現(xiàn)象重要性的不斷提升,實(shí)驗(yàn)方法同互聯(lián)網(wǎng)技術(shù)相結(jié)合逐漸成為研究方法創(chuàng)新的主要方向之一。互聯(lián)網(wǎng)實(shí)驗(yàn)是一種在互聯(lián)網(wǎng)空間中開展隨機(jī)控制實(shí)驗(yàn)的研究方法。它遵循著實(shí)驗(yàn)方法的基本邏輯與研究流程,同時(shí)在研究設(shè)計(jì)、實(shí)驗(yàn)環(huán)境、實(shí)驗(yàn)操作和受試者獲取與分組等方面表現(xiàn)出一定的方法創(chuàng)新性。同傳統(tǒng)社會(huì)科學(xué)實(shí)驗(yàn)方法相比,互聯(lián)網(wǎng)實(shí)驗(yàn)有著拓展研究對(duì)象、綜合研究方式、擴(kuò)大和豐富受試者的規(guī)模與類型、提升研究效率等優(yōu)勢(shì),但也存在著較高的技術(shù)門檻和測(cè)量與計(jì)算上的部分困難等局限。在復(fù)雜性科學(xué)和計(jì)算社會(huì)科學(xué)的方法體系中,互聯(lián)網(wǎng)實(shí)驗(yàn)還兼具實(shí)現(xiàn)“計(jì)算—模擬—實(shí)驗(yàn)”“微觀—宏觀”之間銜接與整合的重要方法價(jià)值。
社會(huì)研究方法;實(shí)驗(yàn)法;互聯(lián)網(wǎng)實(shí)驗(yàn);復(fù)雜系統(tǒng);計(jì)算社會(huì)科學(xué)
自實(shí)證主義方法論成形以來,實(shí)驗(yàn)方法一直被視為社會(huì)科學(xué)探索和檢驗(yàn)因果關(guān)系的最重要手段[1]。雖然利用新開發(fā)出的計(jì)量技術(shù)(如傾向值匹配、工具變量),社會(huì)科學(xué)家們已經(jīng)有能力回答“自然發(fā)生的數(shù)據(jù)變化引起的因果問題”[2],但這些技術(shù)在控制無關(guān)變量干擾和確定變量時(shí)序方面依然遠(yuǎn)遜于實(shí)驗(yàn)法。當(dāng)前,根據(jù)實(shí)驗(yàn)環(huán)境與操作方式的不同,常用的社會(huì)科學(xué)實(shí)驗(yàn)方法主要包括三種類型:一是為保證內(nèi)在效度而在純粹人工創(chuàng)設(shè)環(huán)境中開展的實(shí)驗(yàn)室實(shí)驗(yàn)(Laboratory Experiments),二是為保證外在效度而將自然事件當(dāng)作干預(yù)的自然實(shí)驗(yàn)(Natural Experiments),三是在真實(shí)社會(huì)環(huán)境中開展的,致力于平衡內(nèi)外效度的田野實(shí)驗(yàn)(Field Experiments)。隨著互聯(lián)網(wǎng)普及率和各種數(shù)字設(shè)備使用頻率的提升,日常生活的網(wǎng)絡(luò)化與數(shù)字化趨勢(shì)對(duì)上述實(shí)驗(yàn)方法均提出了不同程度的挑戰(zhàn)。一方面,網(wǎng)絡(luò)世界的連通性、匿名性、脫域性等特征,削弱了依賴“方便樣本”“人工模擬環(huán)境”的實(shí)驗(yàn)室實(shí)驗(yàn)的適用性;另一方面,網(wǎng)絡(luò)世界作為現(xiàn)實(shí)社會(huì)結(jié)構(gòu)的一部分,也為田野實(shí)驗(yàn)創(chuàng)造了一種去身體化與數(shù)字化的全新田野環(huán)境。尤其是Web2.0技術(shù)出現(xiàn)以后,互聯(lián)網(wǎng)不再停留于扮演線下生活的信息記錄空間角色,它同時(shí)還搭建起一個(gè)新型的社會(huì)行動(dòng)空間。發(fā)生于這一空間中的在線心理與行為現(xiàn)象,在規(guī)則與邏輯、情境與表征等方面,可能迥然不同于其線下形態(tài)。面對(duì)環(huán)境與研究對(duì)象的雙重變化,一些研究者開始嘗試?yán)眯屡d的信息技術(shù)工具對(duì)傳統(tǒng)實(shí)驗(yàn)方法進(jìn)行改造、創(chuàng)新,并由此發(fā)展出一種新的社會(huì)科學(xué)實(shí)驗(yàn)方法——互聯(lián)網(wǎng)實(shí)驗(yàn)。
20世紀(jì)90年代,隨著萬維網(wǎng)(World Wild Web) 及其超文本標(biāo)記語言(HTML)和JavaScript腳本語言技術(shù)的出現(xiàn),利用互聯(lián)網(wǎng)開展社會(huì)科學(xué)實(shí)驗(yàn)的設(shè)想逐漸萌生出來。1995年,加拿大麥吉爾大學(xué)的韋爾奇(N. Welch)和美國漢諾威學(xué)院的克蘭茨(J.H. Krantz)合作開展的心理學(xué)聽覺實(shí)驗(yàn),第一次將互聯(lián)網(wǎng)與實(shí)驗(yàn)方法相結(jié)合[3]。兩年后,由克蘭茨及其同事所做的“女性吸引力影響因素”研究則被視為第一項(xiàng)真正的互聯(lián)網(wǎng)實(shí)驗(yàn),他們將相同的實(shí)驗(yàn)方案在實(shí)驗(yàn)室和互聯(lián)網(wǎng)上分別實(shí)施,而最終結(jié)果顯示兩種方法在研究結(jié)論上有著高度的相似性,由此證明了互聯(lián)網(wǎng)實(shí)驗(yàn)作為一種研究方法的可行性[4]。2000年,由伯恩鮑姆(M.H. Birnbaum)主編的《互聯(lián)網(wǎng)上的心理學(xué)實(shí)驗(yàn)》()一書出版,書中簡(jiǎn)單回顧了互聯(lián)網(wǎng)實(shí)驗(yàn)的初興歷程,并對(duì)數(shù)據(jù)有效性、方法優(yōu)劣勢(shì)、技術(shù)支持及其同實(shí)驗(yàn)室方法的異同等進(jìn)行了介紹[5]。此后,安德哈博(V. Anderhub)等將互聯(lián)網(wǎng)實(shí)驗(yàn)引入個(gè)體經(jīng)濟(jì)決策行為研究之中[6],由此推動(dòng)這一方法由心理學(xué)向其他社會(huì)科學(xué)領(lǐng)域擴(kuò)展。不過在這一時(shí)期,互聯(lián)網(wǎng)實(shí)驗(yàn)尚未發(fā)展成為一種獨(dú)立的研究方法,研究者們關(guān)注的焦點(diǎn)也主要放在通過互聯(lián)網(wǎng)來豐富受試者的來源及其異質(zhì)性方面,因此在名稱上更多地使用“互聯(lián)網(wǎng)實(shí)驗(yàn)”(Internet Experiment)[7]、“萬維網(wǎng)實(shí)驗(yàn)”([World Wild] Web Experiment)或“基于網(wǎng)絡(luò)的實(shí)驗(yàn)”(Web-Based Experiment)[8]。
進(jìn)入21世紀(jì)后,互聯(lián)網(wǎng)普及率和使用率的雙重提升以及數(shù)據(jù)處理技術(shù)的快速發(fā)展,為樣本代表性、實(shí)驗(yàn)平臺(tái)、實(shí)驗(yàn)環(huán)境和數(shù)據(jù)處理等實(shí)驗(yàn)條件和手段工具的改善提供了支持,由此推動(dòng)互聯(lián)網(wǎng)實(shí)驗(yàn)方法進(jìn)入一個(gè)新的發(fā)展階段。2006年,薩爾加尼克(M.J. Salganik)等人的“社交因素對(duì)文化產(chǎn)品成功的影響”實(shí)驗(yàn)[9]以及海德斯托姆(P. Hedstr?m)的相應(yīng)評(píng)論文章[10],使互聯(lián)網(wǎng)實(shí)驗(yàn)方法第一次出現(xiàn)在《科學(xué)》雜志之上。在薩氏等人的實(shí)驗(yàn)中,受試者全部從一個(gè)特定的在線音樂平臺(tái)招募而來,而實(shí)驗(yàn)環(huán)境則以人工模擬的方式加以創(chuàng)建,向我們呈現(xiàn)了“虛擬實(shí)驗(yàn)室”的可行性和重要價(jià)值。此后的十年間,和又接連刊發(fā)了多篇相關(guān)論文,引發(fā)了西方學(xué)界對(duì)這一新方法的關(guān)注。隨著方法的日趨系統(tǒng)化,學(xué)術(shù)界對(duì)互聯(lián)網(wǎng)實(shí)驗(yàn)的稱呼也開始發(fā)生變化,更多地使用“虛擬實(shí)驗(yàn)”(Virtual Experiment)[11]和“在線(田野)實(shí)驗(yàn)”(Online [Field] Experiment)[12]來指稱。與Internet、Web等強(qiáng)調(diào)連通性的詞匯相比,Online一詞更能突出研究對(duì)象的行為屬性和交互屬性。
簡(jiǎn)單來說,互聯(lián)網(wǎng)實(shí)驗(yàn)就是一種在數(shù)字化的互聯(lián)網(wǎng)空間中開展隨機(jī)控制實(shí)驗(yàn),以檢驗(yàn)變量間因果作用關(guān)系的研究方法。作為一種實(shí)證主義量化方法,它既遵循著“假設(shè)檢驗(yàn)”的一般邏輯,也遵循著“刺激?反應(yīng)”和“操縱?控制”等實(shí)驗(yàn)方法的特殊邏輯。受此規(guī)定,實(shí)驗(yàn)方案的“理論先行”、受試者的“隨機(jī)分組”、實(shí)驗(yàn)條件的“高度控制”和刺激變量的“人為干預(yù)”等構(gòu)成了互聯(lián)網(wǎng)實(shí)驗(yàn)的基本要求[13]。在研究流程上,互聯(lián)網(wǎng)實(shí)驗(yàn)與傳統(tǒng)實(shí)驗(yàn)方法大體一致,首先從特定的研究假設(shè)出發(fā),設(shè)計(jì)出相應(yīng)的實(shí)驗(yàn)方案;然后根據(jù)研究目標(biāo)與設(shè)計(jì),選擇合適的互聯(lián)網(wǎng)平臺(tái)并編寫相應(yīng)的實(shí)驗(yàn)程序;其次從選定的互聯(lián)網(wǎng)平臺(tái)上獲取和隨機(jī)分組受試者,并以計(jì)算機(jī)程序化或人工方式開展實(shí)驗(yàn)控制和干預(yù),收集實(shí)驗(yàn)數(shù)據(jù);再次對(duì)所收集的數(shù)據(jù)進(jìn)行預(yù)處理,并基于對(duì)前測(cè)和后測(cè)數(shù)據(jù)的比較計(jì)算刺激變量的平均干預(yù)效應(yīng)及其統(tǒng)計(jì)顯著性;最后對(duì)實(shí)驗(yàn)的內(nèi)在效度和外在效度展開系統(tǒng)評(píng)估,以檢驗(yàn)實(shí)驗(yàn)結(jié)果的可靠性。
互聯(lián)網(wǎng)實(shí)驗(yàn)盡管在研究邏輯和實(shí)驗(yàn)流程層面同傳統(tǒng)實(shí)驗(yàn)方法基本一致,但實(shí)驗(yàn)環(huán)境和技術(shù)工具等方面的變化使其在操作應(yīng)用層面呈現(xiàn)出一定的方法創(chuàng)新性。這些創(chuàng)新集中表現(xiàn)在實(shí)驗(yàn)類型、實(shí)驗(yàn)平臺(tái)、實(shí)驗(yàn)程序、受試者的獲取與分組四個(gè)方面。
互聯(lián)網(wǎng)實(shí)驗(yàn)的最基本形式為“單次單因素實(shí)驗(yàn)”設(shè)計(jì),即設(shè)置一個(gè)控制組和一個(gè)實(shí)驗(yàn)組(只有一個(gè)自變量),在較短時(shí)間內(nèi)只在同一網(wǎng)絡(luò)平臺(tái)上進(jìn)行一次實(shí)驗(yàn)。要注意的是,由于互聯(lián)網(wǎng)實(shí)驗(yàn)既不需要將受試者聚在一處,也不需要嚴(yán)格統(tǒng)一受試者的參與時(shí)間,單組實(shí)驗(yàn)的時(shí)間相比于傳統(tǒng)實(shí)驗(yàn)方法可以被顯著延長。如果擔(dān)心因時(shí)間過長而導(dǎo)致實(shí)驗(yàn)受到某些不可預(yù)知因素的干擾,還可以設(shè)計(jì)為“重復(fù)性實(shí)驗(yàn)”,即在實(shí)驗(yàn)方案和平臺(tái)不變的情況下,在不同的時(shí)段內(nèi)進(jìn)行多次實(shí)驗(yàn)。例如,森托拉(D. Centola)的“健康行為傳染”實(shí)驗(yàn)設(shè)計(jì)時(shí)長為7周,為排除干擾,實(shí)驗(yàn)基于不同的受試者重復(fù)進(jìn)行了5次,5次的結(jié)果基本一致,從而有力地證明了實(shí)驗(yàn)結(jié)果的內(nèi)在效度[14]。對(duì)于那些需要考慮時(shí)間變量的研究,則可以采用“追蹤實(shí)驗(yàn)”設(shè)計(jì),即考察同一批受試者在較長時(shí)間內(nèi)的連續(xù)變化。例如,薩爾加尼克等人的單次實(shí)驗(yàn)就耗時(shí)長達(dá)69天[15]。如果還需進(jìn)一步考察環(huán)境變量的影響,則可以采用“同步實(shí)驗(yàn)”的設(shè)計(jì),即將同一實(shí)驗(yàn)在不同的互聯(lián)網(wǎng)平臺(tái)上同時(shí)進(jìn)行。例如,范德賴特(R.A. van de Rijt)等人的“成功動(dòng)力學(xué)”實(shí)驗(yàn),就同時(shí)在眾籌網(wǎng)站、消費(fèi)者評(píng)論網(wǎng)站、維基百科和請(qǐng)?jiān)妇W(wǎng)站等四個(gè)網(wǎng)絡(luò)平臺(tái)上展開,而四個(gè)平臺(tái)的實(shí)驗(yàn)結(jié)果基本一致,顯著提升了實(shí)驗(yàn)結(jié)論的外在效度[16]。
得益于數(shù)字化設(shè)計(jì)的低成本(尤其是低時(shí)間成本)和更大的受試者規(guī)模,互聯(lián)網(wǎng)實(shí)驗(yàn)降低了進(jìn)行多因素實(shí)驗(yàn)、組合實(shí)驗(yàn)和因果中介實(shí)驗(yàn)的難度。當(dāng)實(shí)驗(yàn)中作為刺激因素加以操作的自變量數(shù)目超過一個(gè)時(shí),即構(gòu)成多因素實(shí)驗(yàn)。相較于只有一個(gè)自變量的單因素實(shí)驗(yàn),多因素實(shí)驗(yàn)不僅能夠考察單個(gè)自變量的主效應(yīng),還能計(jì)算多個(gè)自變量之間的交互效應(yīng)。在互聯(lián)網(wǎng)實(shí)驗(yàn)中,無論是直接設(shè)計(jì)多因素實(shí)驗(yàn),還是將初始的單因素實(shí)驗(yàn)擴(kuò)展為多因素實(shí)驗(yàn)都變得更為簡(jiǎn)單。例如,在一項(xiàng)關(guān)于“網(wǎng)絡(luò)結(jié)構(gòu)與合作貢獻(xiàn)度”的實(shí)驗(yàn)中,研究者首先考察了網(wǎng)絡(luò)集中程度對(duì)個(gè)體合作貢獻(xiàn)度的影響,但發(fā)現(xiàn)這種影響并不顯著。為檢驗(yàn)這一結(jié)論,研究者在網(wǎng)絡(luò)結(jié)構(gòu)中額外加入了極端合作者(貢獻(xiàn)度要么滿額要么為零)這一新刺激變量,盡管結(jié)果仍不具有統(tǒng)計(jì)顯著性,但這種設(shè)計(jì)方式的確有助于豐富和深化對(duì)變量間作用關(guān)系的認(rèn) 識(shí)[17]。與只有一個(gè)因變量的多因素實(shí)驗(yàn)不同,組合實(shí)驗(yàn)設(shè)計(jì)是對(duì)多個(gè)考察不同因變量的實(shí)驗(yàn)方案的嵌套組合,即后一項(xiàng)實(shí)驗(yàn)的刺激變量內(nèi)含在前一項(xiàng)實(shí)驗(yàn)的刺激變量之中,而前后兩項(xiàng)實(shí)驗(yàn)分別指向不同的結(jié)果變量。例如,霍波克(A. Coppock)等基于Twitter的“在線參與請(qǐng)?jiān)浮毖芯?,就以在線傳播的動(dòng)員信息為共享刺激變量設(shè)計(jì)了兩項(xiàng)實(shí)驗(yàn)。其中,第一項(xiàng)實(shí)驗(yàn)考察信息傳播方式對(duì)受眾參與行為的影響;第二項(xiàng)實(shí)驗(yàn)緊接著在此基礎(chǔ)上,考察所傳播的信息內(nèi)容對(duì)受眾信息轉(zhuǎn)發(fā)行為的影響[18]。這種組合實(shí)驗(yàn)設(shè)計(jì)的價(jià)值,在于以較低的時(shí)間和資金成本,通過一次實(shí)驗(yàn)完成對(duì)多個(gè)研究假設(shè)的檢驗(yàn)。此外,組合實(shí)驗(yàn)設(shè)計(jì)還可以向因果中介實(shí)驗(yàn)轉(zhuǎn)換,即通過對(duì)實(shí)驗(yàn)方案的組合嵌套發(fā)現(xiàn)多個(gè)變量間的因果作用鏈條。因果中介實(shí)驗(yàn)至少檢驗(yàn)三個(gè)變量間的因果關(guān)系,其中先要檢驗(yàn)自變量同中介變量和因變量的關(guān)系,然后再檢驗(yàn)中介變量與因變量的關(guān)系。在具體操作上,因果中介實(shí)驗(yàn)可以采用雙隨機(jī)設(shè)計(jì)(兩個(gè)實(shí)驗(yàn)方案的嵌套組合)、并發(fā)雙隨機(jī)設(shè)計(jì)(自變量取值數(shù)乘以中介變量取值數(shù)的多因素實(shí)驗(yàn)設(shè)計(jì)) 和平行設(shè)計(jì)(前兩種設(shè)計(jì)類型的綜合)等不同 形式[19]。
互聯(lián)網(wǎng)實(shí)驗(yàn)一般采用單盲實(shí)驗(yàn)設(shè)計(jì),即只讓實(shí)驗(yàn)的執(zhí)行者了解實(shí)驗(yàn)設(shè)計(jì),而向受試者隱匿實(shí)驗(yàn)的有關(guān)信息,其目的在于避免因受試者知曉自己在參加實(shí)驗(yàn)而出現(xiàn)“霍桑效應(yīng)”(Hawthorne Effect)和“約翰亨利效應(yīng)”(John Henry effect)等損害實(shí)驗(yàn)內(nèi)在效度的現(xiàn)象。前者是指受試者發(fā)現(xiàn)自己正在被別人關(guān)注或者觀察時(shí),刻意改變自身的行為或態(tài)度;而后者則是指受試者在知曉分組狀況時(shí),可能會(huì)將實(shí)驗(yàn)視為“實(shí)驗(yàn)組”與“控制組”之間的一場(chǎng)競(jìng)賽,從而把主要精力放在比賽而非實(shí)驗(yàn)上。在實(shí)際操作中,互聯(lián)網(wǎng)實(shí)驗(yàn)設(shè)計(jì)上的“單盲”,往往還能達(dá)到“雙盲”的效果。因?yàn)楹芏嗷ヂ?lián)網(wǎng)實(shí)驗(yàn)是通過計(jì)算機(jī)程序自動(dòng)完成與受試者互動(dòng)的任務(wù),所以即使在“單盲”的設(shè)計(jì)下也能夠有效避免由研究者與受試者人際互動(dòng)所引發(fā)的“期望效應(yīng)”(Expectation Effect)——研究者對(duì)實(shí)驗(yàn)結(jié)果期望的直接表達(dá)或間接流露,會(huì)誘導(dǎo)受試者做出迎合這一期望的回應(yīng))——以及干預(yù)分配的個(gè)體間不均衡等問題。
在互聯(lián)網(wǎng)實(shí)驗(yàn)方法興起之初,研究者主要通過自建在線平臺(tái)的方式來進(jìn)行實(shí)驗(yàn)。自建平臺(tái)的優(yōu)勢(shì)在于研究者能根據(jù)實(shí)驗(yàn)方案來布局平臺(tái)結(jié)構(gòu)和設(shè)計(jì)程序代碼,既省去了獲取平臺(tái)使用權(quán)限的麻煩,也增強(qiáng)了對(duì)實(shí)驗(yàn)條件的控制力。然而,這種做法的劣勢(shì)也非常明顯,即需要耗費(fèi)較多的人力與經(jīng)費(fèi),且難以保證受試者的規(guī)模及其代表性。因此,新近的研究更傾向于使用那些用戶規(guī)模較大的既有互聯(lián)網(wǎng)平臺(tái)。
目前,適用于互聯(lián)網(wǎng)實(shí)驗(yàn)的在線平臺(tái)大體可分為三類:第一類是在線眾包平臺(tái),如美國亞馬遜公司的機(jī)械頑童(Mechanical Turk)和中國的威客網(wǎng)?!氨姲?Crowd sourcing)是一種基于互聯(lián)網(wǎng)的連通性優(yōu)勢(shì)而形成的全新任務(wù)處理模式,它將那些原本為特定機(jī)構(gòu)專業(yè)人員所處理的任務(wù),通過互聯(lián)網(wǎng)有償外包給機(jī)構(gòu)之外的眾多非專業(yè)人員來集體協(xié)作完成,從而能夠以極低的成本獲取與調(diào)用機(jī)構(gòu)之外的豐富資源(尤其是智力資源)[20]。該模式所具有的低成本、大規(guī)模和高回報(bào)優(yōu)勢(shì),使其非常適用于開展互聯(lián)網(wǎng)實(shí)驗(yàn)。研究者可以將實(shí)驗(yàn)內(nèi)容以有償任務(wù)的形式發(fā)布在眾包平臺(tái)上,而承包者對(duì)任務(wù)的處理也就構(gòu)成了對(duì)實(shí)驗(yàn)的參與[21]。第二類是以臉書(Facebook)、推特(Twitter)、新浪微博為代表的在線社交平臺(tái)[22]。這類平臺(tái)有著三大獨(dú)特優(yōu)勢(shì),即用戶規(guī)模、社交關(guān)系網(wǎng)絡(luò)、人均活躍度。知名的在線社交平臺(tái)都具有跨地域、跨年齡甚至跨文化分布的龐大用戶群,這不但可以提升樣本數(shù)據(jù)的代表性,更使開展大尺度互聯(lián)網(wǎng)實(shí)驗(yàn)成為可能。真實(shí)且大規(guī)模的在線社交關(guān)系網(wǎng)絡(luò),特別有助于開展諸如社會(huì)傳染之類的基于人際關(guān)系的實(shí)驗(yàn)研究[23]。較高的人均活躍度,使社交平臺(tái)持續(xù)不斷地生產(chǎn)與記錄著豐富的個(gè)體心理與行為信息,為實(shí)驗(yàn)結(jié)果計(jì)算提供了必要或額外的數(shù)據(jù)支持[24]。第三類是專業(yè)信息服務(wù)平臺(tái),如健身網(wǎng)站、婚戀網(wǎng)站、音樂網(wǎng)站、眾籌網(wǎng)站、消費(fèi)者評(píng)論網(wǎng)站、維基百科和政務(wù)公開網(wǎng)站。這些專門化平臺(tái)聚焦于特定的專業(yè)/興趣領(lǐng)域,特別適用于那些需要特殊情境或特定人群的互聯(lián)網(wǎng)實(shí)驗(yàn)。這類平臺(tái)有時(shí)也具備社交功能,雖然在關(guān)系網(wǎng)絡(luò)的規(guī)模方面遠(yuǎn)遜于在線社交平臺(tái),但其所建立或維持的社會(huì)關(guān)系通常帶有一定的專業(yè)性和更明確的目的性。
在具體的互聯(lián)網(wǎng)實(shí)驗(yàn)中,研究者對(duì)在線平臺(tái)的選擇需要遵循契合性和可用性兩大原則。所謂契合性原則,是指在線平臺(tái)的結(jié)構(gòu)與特征應(yīng)當(dāng)符合實(shí)驗(yàn)方案的需要。一方面,不同類型的平臺(tái)不僅會(huì)塑造出差異化的實(shí)驗(yàn)環(huán)境,也限定著實(shí)驗(yàn)可以利用的資源與條件。以在線動(dòng)員實(shí)驗(yàn)為例,那些以請(qǐng)?jiān)浮⒙?lián)署、聲援和投票等低成本參與行為作為結(jié)果變量的實(shí)驗(yàn),可以在開放的大型社交網(wǎng)絡(luò)平臺(tái)上進(jìn)行;但當(dāng)實(shí)驗(yàn)中涉及金錢(如在線籌款實(shí)驗(yàn))之類高度需要機(jī)構(gòu)信用做背書的因素時(shí),專業(yè)的信息服務(wù)平臺(tái)(如非營利組織的官方網(wǎng)站)相比之下則更為合適。另一方面,以往研究也發(fā)現(xiàn),用戶特征與在線平臺(tái)特征之間存在著不同程度(或強(qiáng)或弱)的相關(guān)關(guān)系,這意味著不同類型的實(shí)驗(yàn)平臺(tái)在受試者庫的規(guī)模、結(jié)構(gòu)與特征等方面常常存在著較大的差異,需根據(jù)實(shí)驗(yàn)方案所要求的受試者群體類型進(jìn)行選擇。至于可用性原則,則是強(qiáng)調(diào)研究者必須能夠獲得在線平臺(tái)的使用權(quán)限。相較而言,自建平臺(tái)和眾包平臺(tái)最容易使用,而各類社交平臺(tái)和專業(yè)平臺(tái)由于為商業(yè)公司和社會(huì)組織機(jī)構(gòu)所擁有,獲取使用權(quán)限的難度 較大。
出于理解上的便利性,初始的互聯(lián)網(wǎng)實(shí)驗(yàn)方案通常是以自然語言的形式表述出來。然而,自然語言無法被計(jì)算機(jī)直接識(shí)讀與執(zhí)行,必須轉(zhuǎn)換為二進(jìn)制代碼形式的程序語言,即通過編寫一系列的功能程序,將那些原本需要人工操作的實(shí)驗(yàn)任務(wù)交由計(jì)算機(jī)完成。干預(yù)、控制與測(cè)量是互聯(lián)網(wǎng)實(shí)驗(yàn)程序必須具備的三項(xiàng)核心功能。實(shí)驗(yàn)干預(yù)程序主要執(zhí)行向受試者施加實(shí)驗(yàn)刺激的任務(wù),其是否需要單獨(dú)編寫要視在線平臺(tái)的可用條件而定??紤]到實(shí)驗(yàn)環(huán)境的“自然發(fā)生”要求與經(jīng)濟(jì)成本,最理想的情況是直接以在線平臺(tái)的既有功能程序來實(shí)施干預(yù),其次是根據(jù)實(shí)驗(yàn)方案對(duì)既有平臺(tái)程序做一些修改后加以利用。例如,有研究者就曾以社交平臺(tái)中常見的“匿名瀏覽”(查看他人頁面而不留下任何痕跡)功能作為刺激變量,以考察匿名功能對(duì)“弱信號(hào)”能力的剝奪是否會(huì)導(dǎo)致約會(huì)成功率的下降[25]。實(shí)驗(yàn)控制程序用于對(duì)實(shí)驗(yàn)發(fā)生的環(huán)境條件進(jìn)行控制。該程序一方面要保證全體受試者處于大致相似的在線環(huán)境中,并盡量將那些有可能對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生干擾的因素排除出去;另一方面,也要避免控制組直接或間接受到刺激變量的影響。無論在何種在線平臺(tái)上,這部分程序都需要單獨(dú)編寫,并嵌入平臺(tái)的系統(tǒng)架構(gòu)之中。實(shí)驗(yàn)測(cè)量程序的功能在于收集實(shí)驗(yàn)過程中所產(chǎn)生的各種數(shù)據(jù),尤其是結(jié)果變量的指標(biāo)數(shù)據(jù),并將其存入特定的數(shù)據(jù)庫中。這一程序通常也需要根據(jù)在線平臺(tái)的API接口命令而單獨(dú)編寫,因?yàn)槿绻苯邮褂闷脚_(tái)本身的數(shù)據(jù)存儲(chǔ)程序,很可能會(huì)導(dǎo)致大量無關(guān)數(shù)據(jù)混入實(shí)驗(yàn)數(shù)據(jù)庫中,給后期的數(shù)據(jù)處理增添不必要的麻煩。
目前已有多款適用于主流在線平臺(tái)的程序設(shè)計(jì)工具可供選用,為社會(huì)科學(xué)研究者編寫實(shí)驗(yàn)程序提供了便利。例如,針對(duì)亞馬遜的機(jī)械頑童平臺(tái),就有支持實(shí)驗(yàn)迭代計(jì)算的Turkit工具[26],支持同步實(shí)驗(yàn)和追蹤實(shí)驗(yàn)計(jì)算的TurkServer工具[27]和用于經(jīng)濟(jì)學(xué)博弈行為研究的Seaweed工具[28]。其中,由MIT開發(fā)的Seaweed程序使用視覺化界面進(jìn)行實(shí)驗(yàn)設(shè)計(jì),非常適合那些缺乏編程經(jīng)驗(yàn)的研究者。著名社交網(wǎng)站Facebook也提供了一款名為Planout的在線實(shí)驗(yàn)設(shè)計(jì)工具,該工具能夠?qū)?shí)驗(yàn)設(shè)計(jì)代碼與應(yīng)用程序代碼分離開來,使研究者只需通過編寫一系列簡(jiǎn)單的指令腳本,即可實(shí)現(xiàn)對(duì)頁面參數(shù)的設(shè)置與調(diào)節(jié)[29]。此外,Google Forms、LimeSurvey、Qualtrics和問卷星等工具,能為那些需要使用問卷和量表測(cè)量的互聯(lián)網(wǎng)實(shí)驗(yàn)提供必要的服務(wù)支持。當(dāng)實(shí)驗(yàn)程序設(shè)計(jì)完畢并嵌入實(shí)驗(yàn)平臺(tái)之后,研究者還需對(duì)程序進(jìn)行調(diào)試和完善,著重檢查以下三個(gè)方面的情況:一是實(shí)驗(yàn)干預(yù)的作用效果,防止刺激變量無效(未能進(jìn)行干預(yù))或受損(未能達(dá)到預(yù)期的完整干預(yù)作用)等問題的出現(xiàn);二是實(shí)驗(yàn)條件的控制效果,防止干擾變量的出現(xiàn)和刺激變量的溢出(實(shí)驗(yàn)干預(yù)不僅作用于實(shí)驗(yàn)組,還以直接或間接方式作用于控制組);三是實(shí)驗(yàn)結(jié)果數(shù)據(jù)的記錄,防止出現(xiàn)信息記錄錯(cuò)位、數(shù)據(jù)存儲(chǔ)中斷、數(shù)據(jù)格式錯(cuò)誤等問題。
傳統(tǒng)實(shí)驗(yàn)方法主要通過“招募”的方式來獲取受試者,這一方式對(duì)互聯(lián)網(wǎng)實(shí)驗(yàn)而言同樣適用。最理想的招募方法是以預(yù)先獲得的受試者庫名單作為抽樣框,采用概率抽樣方法從中隨機(jī)抽取出一定數(shù)量的受試者。當(dāng)受試者庫規(guī)模足夠大,且其分布結(jié)構(gòu)與總體人口結(jié)構(gòu)相類似時(shí),這種方法能夠同時(shí)保證樣本的代表性及其獲取的隨機(jī)性。然而,受成本等因素限制,以上條件通常難以獲得,很多實(shí)驗(yàn)只好轉(zhuǎn)而采用非概率的便利抽樣來獲取受試者。便利抽樣的優(yōu)勢(shì)在于節(jié)約成本、方便快捷,但同時(shí)也有著巨大的劣勢(shì),即由于無法保證樣本獲取的隨機(jī)性,實(shí)驗(yàn)數(shù)據(jù)中可能會(huì)摻雜進(jìn)樣本的自我選擇偏誤。除此之外,抽樣的對(duì)象也一般局限于大學(xué)生群體,對(duì)部分研究主題而言,這類樣本的代表性被認(rèn)為會(huì)有損實(shí)驗(yàn)的外在效度[30]。
在上述兩種方法之外,互聯(lián)網(wǎng)實(shí)驗(yàn)利用互聯(lián)網(wǎng)的連通性優(yōu)勢(shì),創(chuàng)造出了第三種招募方法——眾包招募。所謂眾包招募,是指研究者將實(shí)驗(yàn)任務(wù)放置在專門的眾包網(wǎng)站上,通過提供一定的報(bào)酬引導(dǎo)受試者為獲得酬金而主動(dòng)去完成這些任務(wù)[31]。研究顯示,使用眾包方法招募受試者并不會(huì)損害樣本的代表性[32]。隨著網(wǎng)絡(luò)普及率的提升,網(wǎng)民群體結(jié)構(gòu)與總體人口結(jié)構(gòu)之間的相似性越來越強(qiáng);即使單一網(wǎng)絡(luò)平臺(tái)用戶的分布結(jié)構(gòu)難以與總體人口結(jié)構(gòu)相符合,但其多樣性和代表性仍要優(yōu)于以往常用的學(xué)生樣本或其他便利樣 本[33]。使用招募方式來獲取受試者,除了需要注意樣本選擇偏誤問題之外,一般還要考慮向參與者提供一定的報(bào)酬。由于互聯(lián)網(wǎng)的去身體化特性,研究者對(duì)受試者的控制力被嚴(yán)重削弱。一旦缺少足夠的激勵(lì),受試者很容易在實(shí)驗(yàn)過程中大量流失[34]。因此,以眾包方式招募受試者,其規(guī)模勢(shì)必會(huì)受到實(shí)驗(yàn)經(jīng)費(fèi)的制約。
為了應(yīng)對(duì)選擇性偏誤與規(guī)模限制問題,互聯(lián)網(wǎng)實(shí)驗(yàn)又創(chuàng)造性地發(fā)展出一種被稱為“在線抓取”的新方法,即研究者在用戶不知情的情況下,利用平臺(tái)管理員權(quán)限直接從中抓取受試者及其相關(guān)數(shù)據(jù)信息。與招募方式相比,這種方法不僅簡(jiǎn)單便捷,而且更容易獲取規(guī)模龐大的受試者群體。在一項(xiàng)關(guān)于選舉投票的在線實(shí)驗(yàn)中,研究者就曾通過抓取方法獲得了六千多萬的受試者[35]。受試者規(guī)模的增大,一方面能夠避免“招募”方式帶來的樣本自我選擇偏誤,并為受試者的隨機(jī)分組提供必要前提條件;另一方面,也能夠顯著提升樣本的代表性,優(yōu)化實(shí)驗(yàn)的外在效度。然而,研究倫理(知情同意)與法律(個(gè)人隱私權(quán)利)的雙重責(zé)難,以及商業(yè)平臺(tái)管理員權(quán)限的獲取困難,都會(huì)降低抓取方法的易用性。
在獲取足夠數(shù)量的受試者后,緊接著就要對(duì)其進(jìn)行分組。由于無法同時(shí)測(cè)量到同一位受試者在接受干預(yù)與未受干預(yù)兩種條件下的變化,社會(huì)科學(xué)實(shí)驗(yàn)總是在反事實(shí)框架(Counterfactual Framework)下進(jìn)行,實(shí)驗(yàn)結(jié)果需要通過計(jì)算刺激變量的平均干預(yù)效應(yīng)來獲得,因此保證實(shí)驗(yàn)組與控制組之間的可比性(相似性)至關(guān)重要。由于當(dāng)樣本數(shù)量較少時(shí)不具備隨機(jī)化的必要條件,傳統(tǒng)實(shí)驗(yàn)方法通常采用“配對(duì)法”來分組:根據(jù)預(yù)先確定的少數(shù)幾個(gè)重要特征,將特征相似的一對(duì)受試者分別劃入實(shí)驗(yàn)組和控制組。配對(duì)法實(shí)際上只能算是一種折中方法,因?yàn)椤拔覀儫o從知曉哪些相關(guān)變量應(yīng)作為配對(duì)的依據(jù)”[36];而且受試者的復(fù)雜特征通常難被研究者完整把握,那些未被重視或識(shí)別的特征因素很可能會(huì)對(duì)實(shí)驗(yàn)造成干擾?;ヂ?lián)網(wǎng)實(shí)驗(yàn)對(duì)受試者規(guī)模的擴(kuò)展,為隨機(jī)分組方法的使用提供了必要的前提條件。不過新的問題是,受試者參與實(shí)驗(yàn)時(shí)間的不統(tǒng)一,仍有可能損害隨機(jī)化的效果。當(dāng)實(shí)驗(yàn)過程時(shí)長較短時(shí),研究者在獲取到所需數(shù)量的受試者后就立即進(jìn)行分組,并不會(huì)因受試者參與時(shí)間的差異而造成組間特征分布的不均衡。但當(dāng)實(shí)驗(yàn)時(shí)間較長(如30天以上)時(shí),受試者可以在一開始就加入進(jìn)來,也可以等到最后一天才參與。過長的時(shí)間間隔,很可能會(huì)使后參與的受試者受到未經(jīng)控制的因素(如其間恰逢某一重大社會(huì)事件發(fā)生)的影響。這種情況下,預(yù)先分組的方法就難以保證組間特征分布的隨機(jī)性。一個(gè)可行的策略是,將“預(yù)先分組”變?yōu)椤凹磿r(shí)分組”,即事先不對(duì)受試者進(jìn)行分組,只有當(dāng)參與行為發(fā)生時(shí)才通過計(jì)算機(jī)程序?qū)⑵潆S機(jī)分入實(shí)驗(yàn)組或控制組[37]。
作為一種新的網(wǎng)絡(luò)化和數(shù)字化實(shí)驗(yàn)方法,互聯(lián)網(wǎng)實(shí)驗(yàn)在研究對(duì)象、實(shí)驗(yàn)環(huán)境與操作技術(shù)等方面的諸多創(chuàng)新,使其在擴(kuò)展研究對(duì)象、綜合研究方式、擴(kuò)大和豐富受試者的規(guī)模與類型等方面,相對(duì)于傳統(tǒng)實(shí)驗(yàn)方法而有著一定的方法優(yōu)勢(shì)(見表1)。
首先,互聯(lián)網(wǎng)實(shí)驗(yàn)?zāi)軌蜇S富和拓展實(shí)驗(yàn)法的研究對(duì)象和適用范圍。隨著網(wǎng)絡(luò)交互技術(shù)的創(chuàng)新發(fā)展和廣泛應(yīng)用,互聯(lián)網(wǎng)數(shù)字化空間的雙重屬性愈加鮮明:一方面,它是一個(gè)信息記錄空間,是線下物理空間的復(fù)制或延伸;另一方面,它又是一個(gè)新型的社會(huì)行動(dòng)空間,在線活動(dòng)的頻率、范圍和重要性日益提升。得益于這種雙重屬性,互聯(lián)網(wǎng)實(shí)驗(yàn)方法既能夠應(yīng)用于線下心理與行為的研究——在這方面它是傳統(tǒng)實(shí)驗(yàn)方法的補(bǔ)充,也可以用來研究新興的在線心理與行為以及線上線下的相互作用關(guān)系——在這方面它有著不可替代的重要性,更加凸顯出其獨(dú)特的方法價(jià)值。
其次,互聯(lián)網(wǎng)實(shí)驗(yàn)?zāi)軌驅(qū)崿F(xiàn)對(duì)以往多種實(shí)驗(yàn)類型的有效綜合。實(shí)驗(yàn)環(huán)境的可控性和仿真性,分別關(guān)系到研究結(jié)果的內(nèi)在效度和外在效度。在但實(shí)際操作中,上述兩項(xiàng)標(biāo)準(zhǔn)呈現(xiàn)一種矛盾對(duì)立狀態(tài),對(duì)其中一項(xiàng)的強(qiáng)化會(huì)造成對(duì)另一項(xiàng)的弱化。在互聯(lián)網(wǎng)實(shí)驗(yàn)中,這一問題有機(jī)會(huì)得到一定程度的解決。首先,我們能夠通過創(chuàng)建虛擬實(shí)驗(yàn)室的方式來確保環(huán)境的可控性。虛擬實(shí)驗(yàn)室可以被視為傳統(tǒng)實(shí)驗(yàn)室的數(shù)字化呈現(xiàn),其實(shí)驗(yàn)環(huán)境仍通過人工模擬方式創(chuàng)設(shè),對(duì)干擾的控制力較強(qiáng),適用于討論一般性議題。其次,我們也能夠運(yùn)用在線田野實(shí)驗(yàn)的方法來提升環(huán)境的仿真性。在線田野實(shí)驗(yàn)將實(shí)驗(yàn)放置在自然發(fā)生的互聯(lián)網(wǎng)環(huán)境之中,對(duì)干擾的控制力相對(duì)減弱,但隨著真實(shí)情境化因素的加入,其外在效度會(huì)得到顯著提升。最后,數(shù)字化設(shè)計(jì)的低成本和受試者獲取的便利性,還降低了實(shí)驗(yàn)方案平行設(shè)計(jì)的難度。所謂平行設(shè)計(jì),是指可以同時(shí)設(shè)計(jì)基于人工環(huán)境和田野環(huán)境的兩套實(shí)驗(yàn)方案,最終通過對(duì)研究結(jié)果的比照來平衡實(shí)驗(yàn)的內(nèi)外效度。
再次,互聯(lián)網(wǎng)實(shí)驗(yàn)?zāi)軌蛴行U(kuò)大受試者的規(guī)模,并提升其異質(zhì)性和代表性。借助互聯(lián)網(wǎng)的優(yōu)勢(shì),研究者能夠通過多樣化的在線招募方法與程序抓取方法,以較低的時(shí)間與經(jīng)費(fèi)成本,獲得規(guī)模更大、穩(wěn)定性相對(duì)更高、更具多樣性且跨文化分布的受試者群體。受試者規(guī)模的擴(kuò)大,有助于提升樣本數(shù)據(jù)的代表性,進(jìn)而優(yōu)化實(shí)驗(yàn)結(jié)果的外在效度。除此之外,互聯(lián)網(wǎng)還為接近特定隱秘性社會(huì)群體和亞文化群體提供了新的途徑,也為跨文化研究提供了便利。在以往的社會(huì)科學(xué)實(shí)驗(yàn)中,由于文化因素過于宏大和抽象,難以被有效操作。互聯(lián)網(wǎng)實(shí)驗(yàn)憑借受試者的跨地域、跨文化分布,能夠?qū)⑦@一軟變量有效引入實(shí)驗(yàn)研究 之中。
最后,程序化設(shè)計(jì)能夠顯著提升實(shí)驗(yàn)研究的效率?;ヂ?lián)網(wǎng)的數(shù)字化特征,使實(shí)驗(yàn)過程可以通過計(jì)算機(jī)程序自動(dòng)運(yùn)行,在節(jié)省人力的同時(shí),也有助于減少乃至避免研究者對(duì)受試者可能造成的干擾;實(shí)驗(yàn)的測(cè)量也可以不再需要人工完成,流處理技術(shù)能夠?qū)?shí)驗(yàn)過程中產(chǎn)生的數(shù)據(jù)實(shí)時(shí)記錄下來。除了節(jié)省實(shí)驗(yàn)室空間、人員工時(shí)、設(shè)備和管理費(fèi)用之外,互聯(lián)網(wǎng)實(shí)驗(yàn)還能夠?qū)崿F(xiàn)理論與實(shí)驗(yàn)間的快速迭代。在以往的實(shí)驗(yàn)研究中,從提出理論假設(shè)到得出實(shí)驗(yàn)結(jié)論再到修正理論假設(shè),以及再次對(duì)新假設(shè)進(jìn)行驗(yàn)證,往往需要經(jīng)歷一個(gè)較長的時(shí)間過程?;ヂ?lián)網(wǎng)實(shí)驗(yàn)的快速和便捷,有效縮短了實(shí)驗(yàn)與理論間的迭代過程,這無疑會(huì)大大提高研究的效率。
當(dāng)然,互聯(lián)網(wǎng)實(shí)驗(yàn)也存在著一定的方法局限性。一方面,實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)手段/工具的數(shù)字化和程序化,為互聯(lián)網(wǎng)實(shí)驗(yàn)設(shè)定了較高的技術(shù)門檻。在應(yīng)用這一方法時(shí),如何將自然語言表述的實(shí)驗(yàn)方案以計(jì)算機(jī)語言的方式加以實(shí)現(xiàn),如何確保實(shí)驗(yàn)程序能夠完整、穩(wěn)定地實(shí)現(xiàn)預(yù)期的干預(yù)和控制效果等都是需要妥善解決的技術(shù)問題,都向缺乏計(jì)算思維和編程經(jīng)驗(yàn)的社會(huì)科學(xué)研究者提出了較高的跨學(xué)科合作的要求。此外,絕大多數(shù)的互聯(lián)網(wǎng)服務(wù)平臺(tái)均由商業(yè)公司運(yùn)營和掌控,其后臺(tái)管理權(quán)限并不對(duì)外開放,這就為那些以在線田野實(shí)驗(yàn)方式設(shè)計(jì)實(shí)驗(yàn)方案的研究者提出了同商業(yè)公司溝通和合作的要求。另一方面,互聯(lián)網(wǎng)實(shí)驗(yàn)在數(shù)據(jù)測(cè)量方面也存在著一定的困難。“前測(cè)”加“后測(cè)”是現(xiàn)代實(shí)驗(yàn)方法的基本搭配,實(shí)驗(yàn)結(jié)果的計(jì)算也是通過對(duì)前后測(cè)數(shù)據(jù)的比較來量化呈現(xiàn)刺激變量的平均干預(yù)效應(yīng)。然而,在一部分互聯(lián)網(wǎng)實(shí)驗(yàn)中,前測(cè)任務(wù)可能難以完成,例如當(dāng)結(jié)果變量被視為純粹的計(jì)算機(jī)程序響應(yīng)結(jié)果時(shí),在受試者同程序交互之前,研究者無法預(yù)先獲取相應(yīng)數(shù)據(jù);當(dāng)受試者群體規(guī)模過于龐大時(shí),通常也難以進(jìn)行前測(cè)。與此同時(shí),許多互聯(lián)網(wǎng)數(shù)據(jù)都以非結(jié)構(gòu)化數(shù)據(jù)的形式存在,這給統(tǒng)計(jì)分析的信度和效度均帶來了考驗(yàn)。當(dāng)前,對(duì)音頻和視頻數(shù)據(jù)的常用處理方法是將其轉(zhuǎn)換為文本數(shù)據(jù);而對(duì)文本數(shù)據(jù)的處理方法主要有兩種,一種是計(jì)算詞頻、詞序、詞距的計(jì)量方法,另一種則是基于機(jī)器學(xué)習(xí)的自動(dòng)內(nèi)容分析法。這兩種方法在數(shù)據(jù)處理的精細(xì)度和準(zhǔn)確性上均遠(yuǎn)遜于結(jié)構(gòu)化數(shù)據(jù)處理方法,而且數(shù)據(jù)信息本身與變量操作化指標(biāo)之間的匹配程度——數(shù)據(jù)效度問題——常常也存在著很大疑問。
表1 四種社會(huì)科學(xué)實(shí)驗(yàn)方法比較
互聯(lián)網(wǎng)實(shí)驗(yàn)方法的價(jià)值,實(shí)際上不只表現(xiàn)在對(duì)于傳統(tǒng)實(shí)驗(yàn)方法不足的改進(jìn)方面。在數(shù)字化生活愈發(fā)重要和計(jì)算社會(huì)科學(xué)方法體系日臻成熟的背景下,互聯(lián)網(wǎng)實(shí)驗(yàn)還有著實(shí)現(xiàn)“計(jì)算—模擬—實(shí)驗(yàn)”“微觀—宏觀”之間銜接與整合的重要方法價(jià)值。
興起于20世紀(jì)80年代的復(fù)雜性科學(xué)(complexity science),極大地開闊了社會(huì)科學(xué)的視野,也使研究者深刻認(rèn)識(shí)到:人類社會(huì)是一個(gè)具有自組織能力的復(fù)雜適應(yīng)系統(tǒng)(complex adaptive systems),兼具簡(jiǎn)單性與復(fù)雜性、規(guī)律性與隨機(jī)性、有序性與無序性,其演變過程有簡(jiǎn)單系統(tǒng)所不具備的模式和特征[38]。面對(duì)這樣的研究對(duì)象,尤其是面對(duì)適應(yīng)性主體(adaptive agent)與環(huán)境以及其他主體的復(fù)雜、非線性交互作用關(guān)系,傳統(tǒng)的實(shí)證研究方法遭遇了嚴(yán)重的適用性危機(jī)。這使一直深諳現(xiàn)有方法局限的社會(huì)科學(xué)家們更加迫切地探索在方法體系上取得突破的路徑。正是在這一背景下,推動(dòng)社會(huì)科學(xué)同信息科學(xué)和計(jì)算機(jī)科學(xué)的相互融合,已成為量化社會(huì)研究方法創(chuàng)新的主要方向之一,并由此催生出一個(gè)名為“計(jì)算社會(huì)科學(xué)”的新興交叉學(xué)科領(lǐng)域[39]。計(jì)算社會(huì)科學(xué)通過將多樣化的信息數(shù)據(jù)和數(shù)字化工具引入到社會(huì)研究之中,創(chuàng)造性地發(fā)展出社會(huì)科學(xué)大數(shù)據(jù)計(jì)算、社會(huì)仿真模擬和互聯(lián)網(wǎng)社會(huì)科學(xué)實(shí)驗(yàn)三種研究方式,為提升量化研究的資料收集能力、認(rèn)識(shí)能力和分析能力開辟出了新的方法路徑[40]。
計(jì)算社會(huì)科學(xué)的出現(xiàn),最初源于社會(huì)模擬(social simulation)——當(dāng)前最具代表性的是基于行動(dòng)者的建模與仿真(agent-based modeling and simulation,ABMS)——方法的發(fā)展。該方法通過數(shù)學(xué)建模并轉(zhuǎn)換為可被計(jì)算機(jī)執(zhí)行的程序,嘗試建立起一個(gè)與現(xiàn)實(shí)社會(huì)相平行的“人工社會(huì)”,借以考察現(xiàn)實(shí)社會(huì)中的復(fù)雜互動(dòng)機(jī)制,預(yù)測(cè)社會(huì)變遷趨勢(shì)等[41]。不過,社會(huì)建模的困難和程序迭代的復(fù)雜,使得“人工社會(huì)”與“現(xiàn)實(shí)社會(huì)”之間始終存在著難以彌合的鴻溝,進(jìn)而制約著模擬方法在社會(huì)科學(xué)研究中的應(yīng)用[42]。此后,隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)普及率與使用率的相繼提升,海量的人類心理與行為互動(dòng)信息源源不斷地在三大網(wǎng)絡(luò)中生成與累積,為社會(huì)科學(xué)研究提供了全新的數(shù)據(jù)來源[43];而大規(guī)模數(shù)據(jù)處理技術(shù)的進(jìn)步也為數(shù)據(jù)密集型知識(shí)發(fā)現(xiàn)創(chuàng)造了可能,并由此為計(jì)算社會(huì)科學(xué)增添了新的內(nèi)容——社會(huì)科學(xué)大數(shù)據(jù)計(jì)算[44]。
社會(huì)科學(xué)大數(shù)據(jù)計(jì)算方法的出現(xiàn),的確為在線心理和行為研究提供了新的數(shù)據(jù)來源和手段工具。然而,現(xiàn)實(shí)中的多數(shù)社會(huì)科學(xué)大數(shù)據(jù)普遍存在著價(jià)值低、可關(guān)聯(lián)性差(信息維度少)、信息真實(shí)性存疑等潛在問題,加之社會(huì)系統(tǒng)本身的復(fù)雜性,大數(shù)據(jù)計(jì)算檢驗(yàn)因果關(guān)系的能力也嚴(yán)重落后于其發(fā)現(xiàn)相關(guān)性知識(shí)的能力[45]。一部分學(xué)者就此提出,在大數(shù)據(jù)時(shí)代探求“是什么”(相關(guān))要比“為什么”(因果)更為重要。另一部分學(xué)者則持相反觀點(diǎn),認(rèn)為因果關(guān)系依然重要,并試圖去彌補(bǔ)大數(shù)據(jù)計(jì)算方法在這一方面的不足。前一種觀點(diǎn)實(shí)際上并不足取,因?yàn)閷?duì)社會(huì)科學(xué)研究而言,盡管相關(guān)性知識(shí)對(duì)于加深對(duì)社會(huì)的認(rèn)識(shí)意義非凡,但因果性知識(shí)才構(gòu)成了社會(huì)理論建立、發(fā)展與檢驗(yàn)的核心內(nèi)容。然而后一種的觀點(diǎn)亦不完整,因?yàn)閷?shí)驗(yàn)方法才是社會(huì)科學(xué)進(jìn)行因果關(guān)系檢驗(yàn)的最常用和最重要手段。正是在這層意義上,互聯(lián)網(wǎng)實(shí)驗(yàn)方法構(gòu)成了對(duì)大數(shù)據(jù)計(jì)算和社會(huì)模擬方法的補(bǔ)充[46]。例如,大數(shù)據(jù)計(jì)算方法的一大特征是數(shù)據(jù)生產(chǎn)與科學(xué)研究之間的分離,即數(shù)據(jù)不再是通過研究工具測(cè)量產(chǎn)生的結(jié)果,而是在研究之外獨(dú)立生成。這種數(shù)據(jù)生產(chǎn)的獨(dú)立性,使得大數(shù)據(jù)計(jì)算普遍面臨著數(shù)據(jù)信度和效度問題的威脅?;ヂ?lián)網(wǎng)實(shí)驗(yàn)方法的出現(xiàn),有助于重建數(shù)據(jù)生產(chǎn)與科學(xué)研究之間的關(guān)聯(lián),并通過重新引導(dǎo)數(shù)據(jù)的生成過程來檢驗(yàn)大數(shù)據(jù)計(jì)算的結(jié)論[47]。再如,在社會(huì)仿真模擬方法中,對(duì)社會(huì)行為與現(xiàn)象的建模精度直接影響著模擬的仿真程度。互聯(lián)網(wǎng)實(shí)驗(yàn)方法所發(fā)現(xiàn)或檢驗(yàn)的變量間因果關(guān)系,對(duì)于建模精度的提升而言大有助益,尤其是在基于行動(dòng)者的模擬中能夠?yàn)榻换バ袨橐?guī)制的設(shè)置提供重要的參考[48]。
微觀行為與宏觀現(xiàn)象之間的關(guān)系,始終是困擾社會(huì)科學(xué)家的重要議題之一。按照復(fù)雜自適應(yīng)系統(tǒng)理論的觀點(diǎn),要真正理解集體的屬性,就必須考慮個(gè)體的行為及其相互作用;就必須考慮它們是如何聚合為集體屬性的,亦即從微觀到宏觀的“涌現(xiàn)”過程。同時(shí),集體屬性對(duì)個(gè)人的行為也有著形塑、規(guī)制作用,因此需要了解集體屬性在某個(gè)時(shí)間點(diǎn)上如何影響個(gè)人偏好、信念等,并如何進(jìn)而影響個(gè)人的行為方式。這種影響可能反過來繼續(xù)對(duì)集體屬性產(chǎn)生某種作用,從而形成動(dòng)態(tài)循環(huán)的復(fù)雜過程。傳統(tǒng)的社會(huì)實(shí)證研究主要基于隨機(jī)調(diào)查數(shù)據(jù),這些數(shù)據(jù)雖然在探知個(gè)體的態(tài)度與行為方式等方面表現(xiàn)出色,但在分析和理解個(gè)體之間交互式作用過程方面則常常無能為力。在對(duì)這一問題的回應(yīng)上,計(jì)算社會(huì)科學(xué)的三種研究方式均有著較大的方法價(jià)值。例如,基于行動(dòng)者的建模與仿真方法,就是通過計(jì)算機(jī)仿真技術(shù)模擬行動(dòng)者之間的持續(xù)互動(dòng),以獲得對(duì)復(fù)雜社會(huì)現(xiàn)象及其演變過程的更好理解,探究從微觀行為到宏觀現(xiàn)象的涌現(xiàn)過程。大數(shù)據(jù)時(shí)代到來以后,計(jì)算社會(huì)科學(xué)又嘗試?yán)么笠?guī)模的個(gè)體數(shù)據(jù)來分析和認(rèn)識(shí)宏觀社會(huì)現(xiàn)象。
長期以來,社會(huì)科學(xué)實(shí)驗(yàn)法都被認(rèn)為是一種個(gè)體主義取向的研究方法,其分析單位局限于微觀個(gè)體層面,所能獲得的有關(guān)“總體”的知識(shí)也更多地表現(xiàn)為一種忽略單個(gè)個(gè)體之間差異的“平均”認(rèn)識(shí)。這正是實(shí)驗(yàn)法盡管為心理學(xué)、經(jīng)濟(jì)學(xué)所重視,卻始終為集體主義取向的社會(huì)學(xué)家們所忽視的原因所在。在這一方面,互聯(lián)網(wǎng)實(shí)驗(yàn)方法龐大的受試者規(guī)模、多樣化數(shù)據(jù)來源和自動(dòng)化記錄工具以及社會(huì)網(wǎng)絡(luò)和交互因素的加入,為從微觀到中觀(甚至宏觀)的因果知識(shí)發(fā)現(xiàn)提供了可能。例如,隨著社會(huì)網(wǎng)絡(luò)理論的發(fā)展,行動(dòng)者之間的互動(dòng)關(guān)系及其影響日益受到社會(huì)科學(xué)的關(guān)注。然而,由于受試者數(shù)量有限,加之關(guān)系變量常常難以控制和測(cè)量,傳統(tǒng)實(shí)驗(yàn)方法在考察大規(guī)模受試者間相互作用方面普遍面臨著障礙?;ヂ?lián)網(wǎng)實(shí)驗(yàn)的出現(xiàn),被認(rèn)為有機(jī)會(huì)打破以往實(shí)驗(yàn)法只適于研究小團(tuán)體互動(dòng)的限制。基于龐大的受試者規(guī)模、低成本且便捷的即時(shí)在線交互和(大規(guī)模的)真實(shí)或模擬社交網(wǎng)絡(luò)數(shù)據(jù),互聯(lián)網(wǎng)實(shí)驗(yàn)方法在研究在線社會(huì)互動(dòng)、社會(huì)傳染方面已取得了重要進(jìn)展。正如海德斯托姆在評(píng)價(jià)薩爾加尼克等人在《實(shí)驗(yàn)宏觀社會(huì)學(xué)》一文中所指出的那樣,互聯(lián)網(wǎng)實(shí)驗(yàn)方法向我們展示了如何利用互聯(lián)網(wǎng)技術(shù)來克服傳統(tǒng)實(shí)驗(yàn)的規(guī)模和信息限制,對(duì)理解從個(gè)人行為和相互作用產(chǎn)生集體屬性結(jié)果的復(fù)雜過程具有重要的方法論意義[49]。
[1] FALK A, HECKMAN J J. Lab experiments are a major source of knowledge in the social sciences[J]. Science, 2009, 326(5952): 535?538.
[2] LIST J A . An introduction to field experiments in economics[J]. Journal of Economic Behavior & Organization, 2009, 70(3): 439?442.
[3] WELCH N, KRANTZ J H. The world-wide web as a medium for psychoacoustical demonstrations and experiments: Experience and results[J]. Behavior Research Methods Instruments & Computers, 1996, 28(2): 192?196.
[4] KRANTZ J H, BALLARD J, SCHER J. Comparing the results of laboratory and world-wide web samples on the determinants of female attractiveness[J]. Behavior Research Methods Instruments & Computers, 1997, 29(2): 264?269.
[5] BIRNBAUM M H. Psychological experiments on the internet[M]. San Diego:Academic Press, 2000.
[6] ANDERHUB V, MüLLER R, SCHMIDT C. Design and evaluation of an economic experiment via the internet[J]. Journal of Economic Behavior & Organization, 2001, 46(2): 227?247.
[7] REIPS U D. Standards for internet-based experimenting[J]. Experimental Psychology, 2002, 49(4): 243?256.
[8] MORONEY N, ESCHBACH R, MARCU G G. Unconstrained web-based color naming experiment[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2003, 5008: 36?46.
[9] SALGANIK M J, DODDS P S, WATTS D J. Experimental study of inequality and unpredictability in an artificial cultural market[J]. Science, 2006, 311(5762): 854?856.
[10] HEDSTR?M P. Experimental macro sociology: Predicting the next best seller[J]. Science, 2006, 311(5762): 786?787.
[11] CHESNEY T, CHUAH S H, HOFFMANN R.Virtual world experimentation: An exploratory study[J]. Journal of Economic Behavior & Organization, 2009,72(1): 618?635.
[12] CENTOLA D. The spread of behavior in an online social network experiment[J]. Science, 2010, 329(5996): 1194?1197.
[13] 郝龍. 互聯(lián)網(wǎng)社會(huì)科學(xué)實(shí)驗(yàn):數(shù)字時(shí)代行為與社會(huì)研究的新方法[J]. 吉首大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2018(2): 26?34. HAO Long. Online social science experiment: A new research method of behavior and society in the digital age[J]. Journal of Jishou University (Social Sciences), 2018(2): 26?34.
[14] CENTOLA D. An experimental study of homophily in the adoption of health behavior[J]. Science, 2011, 334(6060): 1269?1272.
[15] SALGANIK M J, DODDS P S, WATTS D J. Experimental study of inequality and unpredictability in an artificial cultural market[J]. Science, 2006, 311(5762): 854?856.
[16] VAN DE RIJT R A, KANG S M, RESTIVO M, et al. Field experiments of success-breeds-success dynamics [C]// Proceedings of the National Academy of Sciences of the United States of America, Washington: National Academy of Schence, 2014, 111(19): 6934?6939.
[17] SURI S, WATTS D J. Cooperation and contagion in web-based, networked public goods experiments[J]. Sigecom Exchanges, 2011, 10(2): e16836.
[18] COPPOCK A, GUESS A, TERNOVSKI J. When treatments are tweets: A network mobilization experiment over twitter[J]. Political Behavior, 2016, 38(1): 105?128.
[19] 胡安寧. 社會(huì)科學(xué)因果推斷的理論基礎(chǔ)[M]. 北京: 社會(huì)科學(xué)文獻(xiàn)出版社, 2015: 107. HU Anning. The theoretical bases of causal inferenceinsocial science[M]. Beijing: Social Sciences Academic Press(CHINA), 2015: 127.
[20] HOWE J. The rise of crowdsourcing[J]. Wired Magazine, 2006, 35(4): 996.
[21] HORTON J J, RAND D G, ZECKHAUSER R J. The online laboratory: Conducting experiments in a real labor market[J]. Experimental Economics, 2010, 14(3): 399?425.
[22] MUNGER K. Tweetment effects on the tweeted: Experimentally reducing racist harassment[J]. Political Behavior, 2017, 39(3): 629?649.
[23] TSVETKOVA M, MACY M W. The social contagion of generosity[J]. PloS One, 2014, 9(2): e87275.
[24] GOLDERS A, MACYM W. Digital footprints: Opportunities and challenges for online social research[J]. Annual Review of Sociology, 2014, 40(1): 129?152.
[25] BAPNA R, RAMAPRASAD J, SHMUELI G, et al. One-way mirrors in online dating: a randomized field experiment[J]. Management Science, 2016, 62(11): 3100?3122.
[26] LITTLE G, CHILTON LB, GOLDMAN M, et al. Turkit: Human computation algorithms on mechanical turk[C]// Proceedings of the 23rd Annual ACM Symposium on User Interface Software and Technology.New York, USA, 2010.
[27] MAO A. CHEN Y, GAJOS K Z, et al. TurkServer: Enabling synchronous and longitudinal online experiments [C]//In AAAI Workshop-Technical Report, Vol. WS-12-08: 33?39.
[28] CHILTON L B, SIMS C T, GOLDMAN M, et al. Seaweed: A web application for designing economic games [C]// BENNETT P, CHANDRASEKAR R. HCOMP '09: Proceedings of the ACM SIGKDD Workshop on Human Computation, New York: Association for Computing Machinery, 2009: 34?35.
[29] BAKSHY E, ECKLES D, BERNSTEIN M S. Designing and deploying online field experiments [C]// Chin-Wan Chung. WWW '14: Proceedings of the 23rd international conference on World wide web, New York: Association for Computing Machinery, 2014: 283?292.
[30] G?CHTER S.(Dis) advantages of student subjects: What is your research question?[J]. Behavioral & Brain Sciences, 2010, 33(2?3): 92?93.
[31] SHANK D B. Using crowd sourcing websites for sociological research: The case of amazon mechanical Turk[J]. American Sociologist, 2015, 47(1): 47?55.
[32] BERINSKY A J, HUBER G A, LENZ G S, ET A L. Evaluating online labor markets for experimental research: Amazon. com's mechanical Turk[J]. Political Analysis, 2012, 20(3): 351?368.
[33] BUHRMESTER M, KWANG T, GOSLING S D. Amazon's mechanical Turk: A new source of inexpensive, yet high-quality, data?[J]. Perspectives on Psychological Science, 2011, 6(1): 3?5.
[34] DUERSCH P, OECHSSLER J, SCHIPPER B C. Incentives for subjects in internet experiments[J]. Economics Letters, 2008, 105(1): 120?122.
[35] BOND R M, FARISS C J, JONES J J, et al. A 61-million-person experiment in social influence and political mobilization[J]. Nature, 2012, 489(7415): 295?298.
[36] 艾爾?巴比.社會(huì)研究方法: 第十一版[M]. 邱澤奇, 譯. 北京: 華夏出版社, 2009: 229. BABBLE E. The practice of social research[M]. Trans. QIU Zeqi. Beijing: Huaxia Publishing House, 2009: 229.
[37] ARECHAR A A, G?CHTER S, MOLLEMAN L. Conducting interactive experiments online[J]. Experimental Economics, 2018, 21(1): 99?131.
[38] 米勒, 佩奇. 復(fù)雜適應(yīng)系統(tǒng): 社會(huì)生活計(jì)算模型導(dǎo)論[M]. 隆云滔,譯. 上海:上海人民出版社, 2012: 32?36. MILLER J H, PAGE S E. Complex adaptive systems: An Introduction to computational models of social life[M]. Trans. LONG Yuntao. Shanghai: Shanghai People's Publishing House, 2012: 32?36.
[39] LAZER D, PENTLAND A, ADAMIC L, et al. Computational social science [J]. Science, 2009, 323(5915): 721?723.
[40] 喬菲?雷維利亞. 計(jì)算社會(huì)科學(xué): 原則與應(yīng)用[M]. 梁君英, 等譯. 杭州: 浙江大學(xué)出版社, 2019: 1?2. CIOFFI R C. Introduce to computation social science: Principles and application[M]. Trans. LIANG Junying, et al. Hangzhou: Zhejiang University Press, 2019: 1?2.
[41] GILBERT N, TROITZSCH K G. Simulation for the social scientist [M]. Maidenhead: Open University Press, 2005: 2?6.
[42] BANKES S C, LEMPERT R J, POPPER S, et al. Making computational social science effective: Epistemology, methodology, and technology[J]. Social Science Computer Review, 2002, 20(4): 377?388.
[43] GOLDER S A, MACY M W. Digital footprints: Opportunities and challenges for online social research[J]. Review of Sociology, 2014, 40(1): 129?152.
[44] 郝龍, 李鳳翔. 社會(huì)科學(xué)大數(shù)據(jù)計(jì)算——大數(shù)據(jù)時(shí)代計(jì)算社會(huì)科學(xué)的核心議題[J]. 圖書館學(xué)研究, 2017(22): 20?29. HAO Long, LI Feng-xiang. Big data computing applied in social science: The core issue of computational social science in the big data age[J]. Research on Library Science, 2017(22): 20?29.
[45] 郝龍. “計(jì)算”的邊界: 互聯(lián)網(wǎng)大數(shù)據(jù)與社會(huì)研究[J]. 中南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2018(2): 20?29. HAO Long. The boundary of computation: Internet big data and social research[J]. Journal of Central South University(Social Sciences),2018(2): 20?29.
[46] 薩爾加尼克. 計(jì)算社會(huì)學(xué): 數(shù)據(jù)時(shí)代的社會(huì)研究[M]. 趙紅梅, 趙婷, 譯. 北京: 中信出版社, 2019: 133?135. SALGANIK M J. Bit by bit: Social research in the digital age[M]. Trans. ZHAO Hongmei, ZHAO Ting. Beijing: China Citic Press, 2019: 133?135.
[47] CHENG J, DANESCU-NICULESCU-MIZILC, LESKOVEC J, et al. Anyone can become a troll[J]. American Scientist, 2017,105(3): 152?155.
[48] 羅俊. 計(jì)算?模擬?實(shí)驗(yàn): 計(jì)算社會(huì)科學(xué)的三大研究方法[J]. 學(xué)術(shù)論壇, 2020(1): 35?49. LUO Jun. Computation?Simulation?Expeiment: Three research methods of computaion social science[J]. Academic Forum, 2020(1): 35?49.
[49] HEDSTR?M P. Experimental macro sociology: Predicting the next best seller[J]. Science, 2006, 311(5762): 786?787.
Online experiment for social sciences: Methodological innovation and evaluation
HAO Long
(School of Humanities and Social Sciences, Nanjing University of Aeronautics and Astronautics, Nanjing 211100, China)
Experimental method is the most important approach for social sciences to explore and test causality. With the constantly increasing importance of online behaviors and virtual phenomena, the combination of experimental method and Internet technology has gradually become one of the main directions of research method innovation. Online experiment, a research method to carry out random-control experiments in the digital space, follows the basic logic and research procedure of experimental methods and has certain methodological innovations in research design, experimental environment, experimental operation, acquisition and grouping of subjects. Compared with traditional experimental methods of social sciences, online experiment boasts of such advantages as expanding research objects, integrating comprehensive research methods, enlarging and enriching the scales and types of subjects, and improving research efficiency. However, there are some methodological limitations, such as higher technical threshold and some difficulties in measurement and calculation. In the method system of complexity science and computational social sciences, online experiment is also of important methodological values in realizing the integration of both "computation-simulation-experiment" and "micro-macro".
social research methods; experimental method; online experiment; complex system; computational social science
C910
A
1672-3104(2020)06?0163?12
10.11817/j.issn. 1672-3104. 2020.06.015
2020?01?03;
2020?05?04
中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)“計(jì)算社會(huì)科學(xué)研究方法的創(chuàng)新、應(yīng)用與價(jià)值研究”(ND2020006)
郝龍,山東新泰人,博士,南京航空航天大學(xué)人文與社會(huì)科學(xué)學(xué)院公共管理系講師,主要研究方向:網(wǎng)絡(luò)社會(huì)學(xué)與計(jì)算社會(huì)科學(xué),聯(lián)系郵箱:haolong2019@nuaa.edu.cn
[編輯: 游玉佩]