胡安寧,陳 滔,李東雨
復(fù)旦大學(xué) 社會(huì)發(fā)展與公共政策學(xué)院,上海 200433
研究方法的多元化是社會(huì)學(xué)的重要學(xué)科特征之一。在中國(guó)社會(huì)學(xué)發(fā)展的早期階段,囿于計(jì)算能力以及調(diào)查規(guī)模的限制,20世紀(jì)初中期,以吳文藻、孫本文、潘光旦、費(fèi)孝通等為代表的社會(huì)學(xué)家多從基于實(shí)地考察的定性分析資料出發(fā),交匯融合中國(guó)社會(huì)思想與西方社會(huì)學(xué)理論,深入剖析中國(guó)社會(huì)。改革開(kāi)放后,中國(guó)社會(huì)學(xué)恢復(fù)重建,學(xué)習(xí)西方社會(huì)學(xué)定量分析方法成為中外社會(huì)學(xué)初期交流的主要內(nèi)容[1]。這一學(xué)習(xí)過(guò)程使得中國(guó)定量社會(huì)學(xué)在較短的時(shí)間內(nèi)完成了人才、教材、課程體系的建設(shè)與發(fā)展。有研究分析了《社會(huì)學(xué)研究》期刊1986—2015年的論文發(fā)表情況,發(fā)現(xiàn)定量研究的論文占比為23.8%,高于定性研究的17.7%[2]。可以說(shuō),今日中國(guó)社會(huì)學(xué)界基于定量分析的研究已經(jīng)占據(jù)了一席之地(1)但是,相較于國(guó)際社會(huì)學(xué)期刊而言,定量社會(huì)學(xué)研究論文在中文社會(huì)學(xué)期刊的占比仍相對(duì)較低。例如,2011—2012年American Journal of Sociology刊發(fā)的文章中,定量研究約占68%,而在American Sociological Review中定量研究占比為72%。。
定量社會(huì)學(xué)研究的基本特征是對(duì)結(jié)構(gòu)化數(shù)據(jù)(主要是調(diào)查數(shù)據(jù))進(jìn)行統(tǒng)計(jì)建模。但隨著信息技術(shù)的發(fā)展與普及,在結(jié)構(gòu)化數(shù)據(jù)之外,社會(huì)生活中產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù)(如文本信息、人類(lèi)生活痕跡)。社會(huì)學(xué)家雖然很早就認(rèn)識(shí)到非結(jié)構(gòu)化數(shù)據(jù)背后的重要學(xué)理價(jià)值(2)1972年,蘭德公司建立“蘭德恐怖主義年鑒”數(shù)據(jù)庫(kù),為美國(guó)政府提供政策咨詢(xún)。,但囿于方法以及計(jì)算能力等限制,這類(lèi)數(shù)據(jù)并未得到充分的開(kāi)發(fā)與利用[3]。這一情況在21世紀(jì)發(fā)生了改變[4],一方面,隨著信息科學(xué)技術(shù)的發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)對(duì)于社會(huì)現(xiàn)實(shí)的反映度日漸提高,使得社會(huì)學(xué)家不得不重視其背后的社會(huì)研究?jī)r(jià)值;另一方面,計(jì)算能力以及計(jì)算技術(shù)的快速發(fā)展,讓處理與分析大體量的非結(jié)構(gòu)化數(shù)據(jù)成為可能。之前受限于技術(shù)與算法而不能深入探討的研究主題(如復(fù)雜社會(huì)網(wǎng)絡(luò)分析[5]、大體量的文本分析[6]、網(wǎng)絡(luò)民情分析[7-8]等),已經(jīng)成為引領(lǐng)社會(huì)學(xué)研究新發(fā)展潮流的重要領(lǐng)域。在此背景下,新的學(xué)科分支逐漸興起,作為大數(shù)據(jù)時(shí)代科技進(jìn)步、數(shù)據(jù)迸發(fā)的產(chǎn)物,計(jì)算社會(huì)學(xué)成為近十年來(lái)社會(huì)學(xué)研究關(guān)注的焦點(diǎn)[9]。
本文從時(shí)代背景出發(fā),探討在新數(shù)據(jù)、新技術(shù)、新方法的推動(dòng)下,計(jì)算社會(huì)學(xué)對(duì)于傳統(tǒng)定量社會(huì)學(xué)的傳承與發(fā)展。具體而言,本文試圖回答以下兩個(gè)問(wèn)題:第一,傳統(tǒng)定量社會(huì)學(xué)分析的研究范式突出體現(xiàn)在哪些分析進(jìn)路上?第二,相較傳統(tǒng)定量社會(huì)學(xué),計(jì)算社會(huì)學(xué)在哪些研究領(lǐng)域有了新的拓展?這些問(wèn)題的回答將有助于社會(huì)學(xué)研究者結(jié)合時(shí)代發(fā)展潮流,理解當(dāng)代社會(huì)研究方法論的發(fā)展路徑,把握量化社會(huì)學(xué)研究發(fā)展的新方向與新趨勢(shì)。
自19世紀(jì)社會(huì)學(xué)家孔德提出實(shí)證主義開(kāi)始,源自于自然科學(xué)研究的原則和范式被應(yīng)用到人類(lèi)行為和社會(huì)結(jié)構(gòu)的研究之中,實(shí)驗(yàn)和統(tǒng)計(jì)定量方法逐步成為社會(huì)科學(xué)研究的重要工具。以數(shù)據(jù)為基礎(chǔ)對(duì)人類(lèi)社會(huì)進(jìn)行觀測(cè)、描述與解析的定量分析在社會(huì)科學(xué)研究中日漸扮演著重要角色??偨Y(jié)傳統(tǒng)定量社會(huì)學(xué)的研究邏輯,以分析思路為基準(zhǔn),本文認(rèn)為傳統(tǒng)定量社會(huì)學(xué)研究可以歸納為過(guò)程、結(jié)構(gòu)、反事實(shí)和前景四種思維進(jìn)路。
所謂過(guò)程思維,是指展示從A如何過(guò)渡到B這一具體的過(guò)程,即揭示概念之間聯(lián)系機(jī)制的分析過(guò)程?!陡柲λ固桨讣分嘘P(guān)于“華生是否在南非投資”的推理完整地展示了過(guò)程思維的邏輯路徑。福爾摩斯看到華生袖口沾上了白色的粉末,于是推論說(shuō)華生不打算在南非投資,如果只是從相關(guān)關(guān)系出發(fā),似乎看不出這兩個(gè)事件之間的關(guān)聯(lián)。而過(guò)程思維恰恰是要把其中的邏輯關(guān)聯(lián)找出來(lái)。具體到以上例子中,福爾摩斯的過(guò)程思維是:華生袖口有白色的粉末→華生去打臺(tái)球→打臺(tái)球總是有一個(gè)朋友作伴→這個(gè)朋友曾經(jīng)邀約華生一起投資南非→華生的支票本一直沒(méi)有動(dòng)用→華生不打算投資南非。通過(guò)這樣的過(guò)程解釋,看似無(wú)關(guān)的A和B就關(guān)聯(lián)起來(lái)了。以上分析思路若要轉(zhuǎn)換成傳統(tǒng)的定量社會(huì)學(xué)話語(yǔ),則是從袖口上的粉末到投資決策之間經(jīng)過(guò)了四個(gè)中間變量,最后形成結(jié)論。
科爾曼的船型模型是過(guò)程思維在學(xué)術(shù)研究上的經(jīng)典體現(xiàn)[10-11]。該模型指出,理解兩個(gè)宏觀因素的關(guān)聯(lián)過(guò)程,研究者需要考慮三個(gè)中間機(jī)制:第一個(gè)機(jī)制稱(chēng)為情境機(jī)制,意在解釋處于特定場(chǎng)景中個(gè)體的獨(dú)特表現(xiàn)。在定量社會(huì)學(xué)研究的學(xué)術(shù)話語(yǔ)體系中,這種機(jī)制常常歸于分組比較的方法。分組比較分析的經(jīng)典案例是涂爾干的自殺論研究,涂爾干描述了法國(guó)天主教地區(qū)和基督新教地區(qū)個(gè)人自殺率的差異,發(fā)現(xiàn)處于不同宗教環(huán)境中的個(gè)體,自殺傾向會(huì)有所不同。分組比較在中國(guó)社會(huì)情境下的社會(huì)學(xué)分析中十分常見(jiàn),如Hu等[12]分析了中國(guó)不同學(xué)科大學(xué)生的收入差異,發(fā)現(xiàn)理工科的收入優(yōu)勢(shì)取決于所處的環(huán)境,只有在市場(chǎng)部門(mén)中,理工科的收入優(yōu)勢(shì)才能實(shí)現(xiàn);而在公共部門(mén)中,文理之間的收入差異實(shí)際上并不顯著。
第二個(gè)機(jī)制即所謂的行動(dòng)形成機(jī)制。行動(dòng)形成的目的是從個(gè)體層面尋找能夠解釋個(gè)體行為的原因。由于社會(huì)學(xué)的學(xué)科特點(diǎn)往往強(qiáng)調(diào)社會(huì)性因素對(duì)于個(gè)體行為的解釋力,行動(dòng)形成機(jī)制在心理學(xué)方面的分析中更為常見(jiàn)。但隨著不同學(xué)科的互相融合,社會(huì)學(xué)研究已經(jīng)不能對(duì)行動(dòng)形成機(jī)制視而不見(jiàn)。實(shí)際上,從個(gè)人微觀層次上解釋行動(dòng)的相關(guān)理論資源已經(jīng)十分豐富。以中位投票模型為例[13],其指出在一個(gè)左偏的收入分布中,由于收入均值比中位值低,那么至少一半以上的個(gè)體會(huì)覺(jué)得自己的收入比平均收入高。在一人一票投票機(jī)制下,民主投票所形成的政策將會(huì)傾向于刺激消費(fèi)。但是如果收入分布右偏,整個(gè)社會(huì)的收入中位值低于均值,則意味著一半以上的個(gè)體出于理性而投票選擇的政策會(huì)偏向轉(zhuǎn)移支付。也就是說(shuō),個(gè)體出于維護(hù)個(gè)人利益的動(dòng)機(jī),在不同的現(xiàn)實(shí)情境中會(huì)形成有差異的行為,這就是行為形成機(jī)制的分析。
第三個(gè)機(jī)制是集體行為分析機(jī)制。即從個(gè)人互動(dòng)過(guò)程中衍生的一個(gè)不能通過(guò)個(gè)體特征解釋的集體性模式。以門(mén)檻模型(又稱(chēng)門(mén)限模型)為例,該模型認(rèn)為某種集體性行為的形成與群體中個(gè)人的道德底線相關(guān)[14]。也就是說(shuō),當(dāng)群體中個(gè)體的道德底線彼此接近時(shí),違背社會(huì)道德的惡行在突破某個(gè)個(gè)體的道德底線后很容易傳染給第二個(gè)人,第二個(gè)人再傳染給第三個(gè)人,依次類(lèi)推,最后形成一個(gè)集體性的不幸結(jié)果。但是,如果個(gè)體彼此之間道德門(mén)檻差異很大,部分個(gè)體的惡行傳到道德門(mén)檻高的個(gè)體處就會(huì)被制止,從而抑制集體亂象的發(fā)生,這種對(duì)集體層面差異的解釋就是集體性行為的分析。
綜上所述,傳統(tǒng)量化研究旨在通過(guò)一系列量化分析手段,盡可能地呈現(xiàn)出某種關(guān)聯(lián)的形成過(guò)程??茽柭拇湍P瓦M(jìn)一步揭示了過(guò)程分析進(jìn)路中可能涉及的一系列中間機(jī)制,為量化研究提供了分析方向,是定量社會(huì)學(xué)研究范式中過(guò)程思維進(jìn)路的經(jīng)典體現(xiàn)。
傳統(tǒng)定量社會(huì)學(xué)的另一個(gè)思維進(jìn)路是結(jié)構(gòu)思維,即跳出分析對(duì)象的內(nèi)容約束,轉(zhuǎn)而關(guān)注結(jié)構(gòu)性變化。基于常規(guī)思路分析某個(gè)具體概念時(shí),研究者往往從內(nèi)容的角度入手,傾向于討論某個(gè)概念的實(shí)質(zhì)含義。但是,采用結(jié)構(gòu)思維的量化研究者不必然關(guān)注某一概念或者變量的實(shí)質(zhì)含義,而是聚焦于某種關(guān)聯(lián)結(jié)構(gòu)的變異性。換句話說(shuō),結(jié)構(gòu)思維是從內(nèi)容到形式的過(guò)渡,在一定程度上填補(bǔ)了一種常規(guī)思維習(xí)慣的空白。
具體而言,結(jié)構(gòu)思維進(jìn)路在社會(huì)學(xué)研究中最經(jīng)典的體現(xiàn)是探討概念聯(lián)系的變異性。以教育回報(bào)的異質(zhì)性研究為例,有研究探析了那些特別容易上大學(xué)的個(gè)體與那些特別不容易上大學(xué)的個(gè)體相比,誰(shuí)能夠從大學(xué)中獲益最多[15]。針對(duì)此問(wèn)題,結(jié)構(gòu)思維的角度實(shí)際上考察的是教育水平和收入水平之間的聯(lián)系(結(jié)構(gòu))在不同類(lèi)型群體之間的差異。布蘭德等[15]研究發(fā)現(xiàn),越不容易上大學(xué)的人(如那些家庭背景不是很好的高中畢業(yè)生)一旦有機(jī)會(huì)上大學(xué),將比那些容易上大學(xué)的高中畢業(yè)生從高等教育過(guò)程中獲取更高的經(jīng)濟(jì)回報(bào)。也就是說(shuō),如果大學(xué)錄取政策偏向于弱勢(shì)群體的高中畢業(yè)生,那么大學(xué)教育政策的實(shí)際功效反而更高。
概念之間聯(lián)系的變異性還可以通過(guò)某種更為細(xì)微的方式呈現(xiàn)出來(lái)。以政府信任分析為例,這里的研究對(duì)象涉及多級(jí)政府——在城市中,從中央政府一直到街道。很多研究發(fā)現(xiàn),人們對(duì)上層政府的信任度高于基層政府。那么,問(wèn)題在于,在人們的認(rèn)知中,從中央政府到基層政府,哪些算上層,哪些算基層?換言之,上層政府和基層政府的界限在哪里?對(duì)于這一問(wèn)題,不同的人劃分界限各不一樣,有些認(rèn)為基層政府只是街道,有些認(rèn)為國(guó)務(wù)院之外都是基層政府,有些則認(rèn)為省政府和國(guó)務(wù)院一樣都是屬于上層政府。為了勾勒出這種認(rèn)知差異,研究者可以根據(jù)不同個(gè)體對(duì)于不同層級(jí)政府的信任度,進(jìn)行某種認(rèn)知結(jié)構(gòu)的劃分。Hu等[16]基于全國(guó)性的調(diào)查資料,區(qū)分出兩種不同政府信任的人群:一類(lèi)人群將所有層級(jí)的政府視為一體,不進(jìn)行基層和上級(jí)的劃分;另一類(lèi)人群則認(rèn)為中央政府和省政府屬于上層政府,而市政府、區(qū)政府和街道是地方政府。一旦有了這種認(rèn)知差異,其對(duì)于政府信任的判斷也在基層政府與上層政府之間表現(xiàn)出不同。
對(duì)差序格局的操作化測(cè)量也體現(xiàn)了概念聯(lián)系之間的異質(zhì)性[17]。具體而言,測(cè)量差序格局時(shí)需要考慮兩種結(jié)構(gòu)因素:一方面,在個(gè)人的社會(huì)網(wǎng)絡(luò)中,從一個(gè)信任對(duì)象跳到另一個(gè)信任對(duì)象之間的間距是多大?例如,從父母兄弟到同學(xué)代表了一種間距,而從同學(xué)到同事則代表了另一種間距,這兩個(gè)間距是否相等?這是需要考慮的一個(gè)結(jié)構(gòu)性因素。另一方面,當(dāng)從一個(gè)聯(lián)系緊密的人到一個(gè)聯(lián)系較為疏遠(yuǎn)的人過(guò)渡時(shí),對(duì)其信任度如何下降?這實(shí)際上是一個(gè)信任梯度的問(wèn)題。如果把這兩種結(jié)構(gòu)性因素都考慮進(jìn)來(lái),就形成了一個(gè)針對(duì)差序格局的測(cè)量。
傳統(tǒng)量化研究的第三個(gè)思維進(jìn)路可以稱(chēng)為反事實(shí)思維。這一思維進(jìn)路強(qiáng)調(diào)對(duì)一種相反狀態(tài)的想象,這一想象過(guò)程可以超越傳統(tǒng)的對(duì)于相關(guān)問(wèn)題的考察。例如,假設(shè)有兩個(gè)歷史趨勢(shì)A和B,它們?cè)趦蓚€(gè)歷史節(jié)點(diǎn)之間均呈現(xiàn)出上升趨勢(shì),如果只觀察相關(guān)性,可以發(fā)現(xiàn)A和B共變,從而呈現(xiàn)很高的相關(guān)性;如果進(jìn)行反事實(shí)的思維想象,可能會(huì)發(fā)現(xiàn)A無(wú)論如何都會(huì)上升,與B的變化方向無(wú)關(guān),這樣則說(shuō)明A的變化與B沒(méi)有關(guān)聯(lián)??梢?jiàn),運(yùn)用反事實(shí)思維方式可能發(fā)現(xiàn)看起來(lái)兩個(gè)高度相關(guān)的變量之間并沒(méi)有實(shí)質(zhì)性的關(guān)聯(lián)。
反事實(shí)思維方式與因果推斷高度關(guān)聯(lián),基于反事實(shí)思維的社會(huì)學(xué)定量分析通常以經(jīng)驗(yàn)因果推斷的方式展開(kāi)[18]。大學(xué)教育的收入回報(bào)分析是反事實(shí)思維的經(jīng)典應(yīng)用,針對(duì)這一問(wèn)題,傳統(tǒng)的分析思路是,因?yàn)槭苓^(guò)大學(xué)教育,所以收入更高。但是經(jīng)濟(jì)學(xué)家提出,或許這種看起來(lái)“合情合理”的歸因是選擇性誤差使然,即在挑選學(xué)生時(shí),把那些未來(lái)有掙錢(qián)潛力的人都挑選進(jìn)了大學(xué)。此時(shí),“畢業(yè)后找到一個(gè)好工作”的現(xiàn)象或許不是因?yàn)閷W(xué)校培養(yǎng)得好,而是因?yàn)樯幢旧淼馁|(zhì)量。那么,為了探究大學(xué)教育是否真正帶來(lái)了收入回報(bào),需要分析那些本來(lái)能上大學(xué)的人如果當(dāng)年未上大學(xué)的話(即反事實(shí)狀態(tài)),四年后其收入是多少?如果一個(gè)人上大學(xué)后的收入和不上大學(xué)的收入差不多,那么上大學(xué)就沒(méi)有帶來(lái)額外的收益。然而問(wèn)題在于如何找到那些已經(jīng)上了大學(xué)的人“反事實(shí)狀態(tài)”下的收入情況。一個(gè)思路是,尋找一些相似的人進(jìn)行對(duì)比,如可以觀察高考分?jǐn)?shù)線上下的兩撥人,其高考成績(jī)差別很小。因此,一定程度上有理由認(rèn)為,這兩撥人在進(jìn)入大學(xué)的可能性上是很接近的,但是由于一個(gè)在線上,一個(gè)在線下,線上的人獲得了大學(xué)的入學(xué)資格,而線下的人則失去了這個(gè)機(jī)會(huì)。此時(shí),對(duì)比線上線下兩撥人,就能夠發(fā)現(xiàn)上大學(xué)與否對(duì)于收入是否具有影響。其中,分?jǐn)?shù)線下的那些人就是分?jǐn)?shù)線上那些人的反事實(shí)對(duì)象。
尋找現(xiàn)實(shí)中個(gè)體的反事實(shí)狀態(tài)雖然煩瑣,卻并非不可能?;诜词聦?shí)思維的量化研究,研究者可以尋找到很多不是那么完美的反事實(shí)備選對(duì)象,再把這些備選對(duì)象進(jìn)行加權(quán)平均,形成反事實(shí)狀態(tài)。這方面的經(jīng)典案例是加州的香煙稅收政策變化對(duì)于香煙消費(fèi)量的影響[19]。在這項(xiàng)研究中,通過(guò)綜合其他州的情況,研究者能夠模擬出一個(gè)虛擬加州的香煙消費(fèi)量趨勢(shì),從而與真實(shí)的香煙消費(fèi)量趨勢(shì)進(jìn)行對(duì)比。由于虛擬加州和真實(shí)加州之間的區(qū)別只是真實(shí)加州實(shí)施了針對(duì)香煙的稅收政策,因此二者相比所呈現(xiàn)出的香煙消費(fèi)量變化便只能歸因于這一政策了。其中,虛擬加州就是真實(shí)加州的一個(gè)反事實(shí)狀態(tài),其核心的思維邏輯就是反事實(shí)的分析進(jìn)路。
傳統(tǒng)定量社會(huì)學(xué)研究常用的第四個(gè)思維進(jìn)路可以稱(chēng)為前景思維。這一思維方式具體表現(xiàn)為強(qiáng)調(diào)分析“原因的某種結(jié)果”,這和一般意義上分析“結(jié)果的某種原因”是不同的。傳統(tǒng)“結(jié)果的原因”分析思路強(qiáng)調(diào)研究者首先應(yīng)該確定關(guān)注的因變量Y,然后再尋找能夠解釋該因變量Y的因素(即自變量X)。例如,韋伯研究的一個(gè)經(jīng)驗(yàn)議題是為什么理性的資本主義在西方誕生[20]。為了解釋Y(即理性資本主義的誕生),韋伯分析了一系列的可能影響因素,其中包括現(xiàn)代化的簿記制度、基督新教、城邦體制、理性化的法律等,這是一個(gè)典型的“結(jié)果的原因”分析思路。與之相比,“原因的結(jié)果”關(guān)注的則是給定一個(gè)原因X,其會(huì)帶來(lái)什么樣的結(jié)果。雖然兩種思路最終落腳點(diǎn)都是X和Y的關(guān)系,但是基于前景思維的“原因的結(jié)果”分析進(jìn)路強(qiáng)調(diào)的是“向前看”。
在過(guò)去幾十年中,量化社會(huì)科學(xué)的研究日漸強(qiáng)調(diào)“原因的結(jié)果”這一分析思路。具體開(kāi)展過(guò)程涉及到采用一系列實(shí)驗(yàn)或者類(lèi)實(shí)驗(yàn)的方法。關(guān)于社會(huì)代際流動(dòng)的分析很好地展示了“原因的結(jié)果”這一思維進(jìn)路的優(yōu)勢(shì)與特點(diǎn)。對(duì)于代際流動(dòng),常規(guī)的思路都是從結(jié)果倒回去找原因,即先收集子女一代的信息,然后回溯考察其父母的情況。但是,這種尋找“結(jié)果的原因”的分析思路可能帶來(lái)研究偏差[21]。因?yàn)檫@一分析思路默認(rèn)的分析對(duì)象是有子女的父母,而忽略了父母一代沒(méi)有配偶以及有配偶卻不生育的個(gè)體。假設(shè)教育水平越高的人越有可能不生育子女,在這種情況下,如果采用“結(jié)果的原因”分析思路,從子代回溯父代的相關(guān)信息,就相當(dāng)于把那些高教育水平的個(gè)體剔除掉了。那么,如果這些人生育子女的話,其子女更有可能獲得更高的教育水平,即體現(xiàn)出教育在代際間的優(yōu)勢(shì)傳遞。此時(shí),忽視了這些高教育水平的人之后計(jì)算得出的代際流動(dòng)情況無(wú)形中高估了代際流動(dòng)的水平。但是,如果研究的出發(fā)點(diǎn)不是子女,而是父代,通過(guò)觀察他們的生命歷程變化,這種潛在的高估就會(huì)被發(fā)現(xiàn),這也是前景思維相對(duì)于傳統(tǒng)后向思維的一個(gè)優(yōu)勢(shì)。
相比于傳統(tǒng)的定量社會(huì)學(xué)研究,新興的計(jì)算社會(huì)學(xué)為研究者提供了一個(gè)新的分析平臺(tái)和工具[22]。這里的“新”具體體現(xiàn)在三個(gè)方面,即新的數(shù)據(jù)、新的分析手段和新的因果識(shí)別策略。首先,新的數(shù)據(jù)處理能力是計(jì)算社會(huì)學(xué)在大數(shù)據(jù)時(shí)代的一個(gè)重要貢獻(xiàn)。信息化時(shí)代,人類(lèi)各種行為均會(huì)留下電子化痕跡,這些數(shù)據(jù)為我們更好地理解和認(rèn)識(shí)個(gè)體和群體行為的發(fā)生規(guī)律提供了新的可能。但與傳統(tǒng)定量社會(huì)學(xué)分析的數(shù)據(jù)不同,電子化痕跡數(shù)據(jù)體量龐大、覆蓋范圍較廣,在分析方法上不需要很強(qiáng)的前期假設(shè)(如變量正態(tài)分布假設(shè)等),且呈現(xiàn)出明顯的“非結(jié)構(gòu)化數(shù)據(jù)”特征,對(duì)傳統(tǒng)定量社會(huì)學(xué)及其方法論帶來(lái)新的挑戰(zhàn),從而成為新興計(jì)算社會(huì)學(xué)的重要研究對(duì)象[23]。其次,新的分析手段指的是計(jì)算社會(huì)學(xué)可以使用一系列傳統(tǒng)社會(huì)學(xué)研究方法所不涉及的新興技術(shù),例如社會(huì)網(wǎng)絡(luò)研究、地理信息系統(tǒng)研究、基于行動(dòng)者的模擬(agent-based modeling)分析,等等。這些新興技術(shù)方法都在某一方面突破了傳統(tǒng)結(jié)構(gòu)化線性模型的分析框架,為研究者提供了新的研究信息。最后,在因果識(shí)別策略方面,傳統(tǒng)的因果關(guān)系識(shí)別重在對(duì)平均因果效果的識(shí)別,分析手段上也更為“中規(guī)中矩”;而在計(jì)算社會(huì)學(xué)的背景下,因果關(guān)系的分析開(kāi)始引入大量的基于算法的計(jì)算技術(shù),同時(shí)在分析對(duì)象上也逐漸從一種平均意義上的因果關(guān)系轉(zhuǎn)向一種異質(zhì)性的、基于個(gè)體特質(zhì)的因果關(guān)系。
需要說(shuō)明的是,計(jì)算社會(huì)學(xué)的興起以及那些和大數(shù)據(jù)緊密相連的研究議題自20世紀(jì)初期開(kāi)始,多由其他領(lǐng)域(如計(jì)算機(jī)科學(xué))的研究展開(kāi)。但自然科學(xué)家從事社會(huì)科學(xué)相關(guān)研究很大程度上不是出于理論關(guān)切或是社會(huì)關(guān)懷,而是更多出于技術(shù)能力的使用。因此,從某種意義上說(shuō),自然科學(xué)領(lǐng)域的研究者對(duì)于社會(huì)科學(xué)相關(guān)議題的理論理解與詮釋還有待改善[24]。在此背景下,社會(huì)學(xué)家始終關(guān)心人類(lèi)行為的理論解釋,在大數(shù)據(jù)時(shí)代有能力扮演更重要的角色,探索和開(kāi)發(fā)新數(shù)字空間的研究路線與范式[9]。不過(guò),新的基于計(jì)算的研究范式并不一定會(huì)完全取代原有的研究范式,而是可能形成一種新舊范式并存的學(xué)術(shù)生態(tài)。可以預(yù)見(jiàn),在未來(lái)一定時(shí)期內(nèi),社會(huì)學(xué)仍然是“計(jì)算范式”與其他范式共存的局面[22]。
“新”數(shù)據(jù)是計(jì)算社會(huì)學(xué)誕生與興起的原始驅(qū)動(dòng)力。大數(shù)據(jù)時(shí)代,研究數(shù)據(jù)的“新”不僅體現(xiàn)在體量上,更表現(xiàn)為數(shù)據(jù)的形式和結(jié)構(gòu)。一方面,電子郵件、社交媒介、網(wǎng)頁(yè)記錄等電子化檔案極大地?cái)U(kuò)充了社會(huì)學(xué)研究可獲得的數(shù)據(jù)體量,讓一些社會(huì)學(xué)分析擺脫了抽樣調(diào)查的束縛。傳統(tǒng)定量社會(huì)學(xué)研究的數(shù)據(jù)往往來(lái)自于耗費(fèi)巨大的人力、物力以及財(cái)力的抽樣調(diào)查,能夠獲得的樣本量相對(duì)較小,且所獲得的資料信息來(lái)自于研究者前期設(shè)計(jì)的結(jié)構(gòu)性問(wèn)卷,具有很強(qiáng)的結(jié)構(gòu)性特征,經(jīng)常被稱(chēng)為“設(shè)計(jì)的數(shù)據(jù)”[24],在推斷整體情況的過(guò)程中往往需要通過(guò)強(qiáng)有力的前期假設(shè)。而電子化痕跡數(shù)據(jù)大多來(lái)自于現(xiàn)實(shí)生活中的實(shí)時(shí)記錄,是各種社會(huì)活動(dòng)自然呈現(xiàn)的結(jié)果,具有明顯的“非結(jié)構(gòu)性”特征。此外,電子化數(shù)據(jù)的體量十分龐大,在一定情況下,分析的數(shù)據(jù)幾乎覆蓋研究總體,無(wú)需通過(guò)特定的假設(shè)前提。另一方面,視頻監(jiān)控、在線地圖、電子書(shū)籍等圖像型、文本型數(shù)據(jù)豐富了社會(huì)學(xué)分析數(shù)據(jù)的形式。傳統(tǒng)定量社會(huì)學(xué)研究受限于分析技術(shù)與計(jì)算能力,圖像數(shù)據(jù)并沒(méi)有獲得過(guò)多關(guān)注。但是隨著電子科技的發(fā)展,圖像是記錄社會(huì)活動(dòng)的重要載體,已經(jīng)成為計(jì)算社會(huì)學(xué)研究的重要資料。文本數(shù)據(jù)雖然在傳統(tǒng)定量社會(huì)學(xué)中獲得了大量關(guān)注,但是傳統(tǒng)的內(nèi)容分析能夠處理的文本資料有限,且主題分類(lèi)大多基于研究者的理論積淀,存在較大的主觀性。相較而言,計(jì)算社會(huì)學(xué)對(duì)于文本數(shù)據(jù)的挖掘則更為自動(dòng)化,對(duì)于研究者的主觀性有一定的規(guī)避。
具體而言,計(jì)算社會(huì)學(xué)通過(guò)采用新的技術(shù)與新的分析方法,可以對(duì)傳統(tǒng)定量社會(huì)學(xué)難以處理的數(shù)據(jù)形式進(jìn)行研究。尤其是在對(duì)網(wǎng)絡(luò)數(shù)據(jù)、文本數(shù)據(jù)和圖像數(shù)據(jù)的分析中,計(jì)算社會(huì)學(xué)展現(xiàn)出了獨(dú)特的優(yōu)勢(shì)。網(wǎng)絡(luò)數(shù)據(jù)分析方面,一個(gè)比較典型的數(shù)據(jù)來(lái)源是個(gè)體在搜索引擎中留下的搜索痕跡。在個(gè)體層面,這種搜索痕跡可以幫助我們了解某一個(gè)體隨著時(shí)間推移其關(guān)注點(diǎn)如何變化。在群體層面,一些詞語(yǔ)被大量搜索,恰恰說(shuō)明這個(gè)詞語(yǔ)成為了一項(xiàng)社會(huì)性議題。關(guān)于網(wǎng)絡(luò)搜索痕跡的研究,最為經(jīng)典的是利用谷歌搜索來(lái)預(yù)測(cè)美國(guó)各地的流感情況[25],其分析思路極大地啟發(fā)了后續(xù)的一系列研究。當(dāng)然,網(wǎng)絡(luò)信息并不都是由搜索痕跡構(gòu)成,人們完全可以在網(wǎng)絡(luò)上表達(dá)個(gè)人的想法。考慮到網(wǎng)絡(luò)的匿名特性,甚至有理由認(rèn)為,人們?cè)诰W(wǎng)絡(luò)平臺(tái)匿名的觀點(diǎn)表達(dá)更能反映其內(nèi)心真實(shí)的想法。正因如此,近年來(lái),社會(huì)學(xué)領(lǐng)域涌現(xiàn)了大量基于網(wǎng)絡(luò)平臺(tái)觀念表達(dá)的研究[7-8]。可以說(shuō),網(wǎng)絡(luò)數(shù)據(jù)就像是一個(gè)信息的富礦,關(guān)鍵在于學(xué)者們?nèi)绾芜M(jìn)行挖掘。
除了網(wǎng)絡(luò)數(shù)據(jù)外,另一個(gè)日漸流行的數(shù)據(jù)是文本數(shù)據(jù)。傳統(tǒng)對(duì)于文本的考察常?;趦?nèi)容分析方法,即通過(guò)學(xué)者或者其他參與者的閱讀對(duì)內(nèi)容進(jìn)行編碼,進(jìn)而發(fā)現(xiàn)文本背后的信息和模式。而計(jì)算社會(huì)學(xué)的文本挖掘盡管仍然致力于從文本中抽離出一些基本的模式,但對(duì)于文本的閱讀可以讓機(jī)器來(lái)完成。通過(guò)探索不同詞語(yǔ)的分布狀態(tài),學(xué)者們可以通過(guò)構(gòu)造主題模型確定文本的主題。通過(guò)結(jié)構(gòu)主題模型,可以進(jìn)一步判斷這個(gè)主題的關(guān)聯(lián)因素,從而形成對(duì)于文本的解釋。當(dāng)然,也可以對(duì)文本中的詞語(yǔ)進(jìn)行一些向量化的處理,以計(jì)算上下文背景下詞語(yǔ)的特定意涵。此外,還可以對(duì)文本進(jìn)行情感分析,了解文本背后的情緒特點(diǎn)。文本數(shù)據(jù)分析是計(jì)算社會(huì)學(xué)領(lǐng)域中發(fā)展非??斓难芯糠较?無(wú)論是國(guó)內(nèi)還是國(guó)際上的專(zhuān)業(yè)期刊,這方面的研究都越來(lái)越多[6]。但是需要提及的是,文本分析的很多手段需要一些基礎(chǔ)性的工作,最簡(jiǎn)單的基礎(chǔ)性信息是語(yǔ)言學(xué)相關(guān)的一系列數(shù)據(jù)庫(kù)。舉例而言,社會(huì)學(xué)的研究者在語(yǔ)言使用上有什么樣的習(xí)慣和特征,這些特征可以形成數(shù)據(jù)庫(kù),以便后續(xù)對(duì)社會(huì)學(xué)的文本進(jìn)行分析。但這些僅是一些基礎(chǔ)性的工作,相較于英語(yǔ),目前中文的語(yǔ)言數(shù)據(jù)庫(kù)建設(shè)仍然不足,這或許是文本分析的一個(gè)瓶頸。
近年來(lái),計(jì)算社會(huì)學(xué)對(duì)于圖像數(shù)據(jù)的處理也逐步增多。長(zhǎng)期以來(lái),圖像對(duì)于社會(huì)學(xué)研究而言是一個(gè)處理的難點(diǎn),當(dāng)然也可以采用傳統(tǒng)的內(nèi)容分析手段,由學(xué)者或者其他研究者判斷一幅圖像背后要表達(dá)的意思,之后通過(guò)編碼探究其潛在的模式。在計(jì)算社會(huì)學(xué)時(shí)代,完全可以借助機(jī)器對(duì)圖像進(jìn)行讀取、分析。之所以讓機(jī)器去讀取圖像,是因?yàn)槭苌飳W(xué)局限,肉眼并不能判斷有些圖像中的元素。如日常生活中,醫(yī)生可以讓機(jī)器根據(jù)特定的算法輔助讀片,從而為醫(yī)學(xué)上的進(jìn)一步診斷提供數(shù)據(jù)基礎(chǔ)。這種人機(jī)協(xié)作也是目前處理圖像數(shù)據(jù)的基本思路。具體到社會(huì)學(xué)領(lǐng)域,圖像數(shù)據(jù)的應(yīng)用也逐步趨于廣泛,如Legewie等[26]通過(guò)更新某一圖像識(shí)別的算法,利用機(jī)器對(duì)紐約市的地圖進(jìn)行分析,其目的在于識(shí)別不同社區(qū)的社會(huì)性邊界,從而進(jìn)一步考察社區(qū)邊界的潛在犯罪問(wèn)題。盡管目前采用圖像數(shù)據(jù)進(jìn)行分析的社會(huì)學(xué)研究并不是很多,但計(jì)算機(jī)領(lǐng)域中的圖像處理技術(shù)已經(jīng)十分成熟,如何進(jìn)一步與社會(huì)學(xué)研究相結(jié)合是未來(lái)的一個(gè)發(fā)展趨勢(shì)。
需要指出的是,計(jì)算時(shí)代產(chǎn)生的“新”數(shù)據(jù)也存在一些問(wèn)題。首先,新數(shù)據(jù)讓社會(huì)學(xué)研究過(guò)程中收集數(shù)據(jù)與分析數(shù)據(jù)這兩個(gè)步驟不再割裂,這雖然保證了對(duì)數(shù)據(jù)生成邏輯的了解,但研究者既是數(shù)據(jù)的收集者也是數(shù)據(jù)的分析者,數(shù)據(jù)的可靠性依賴(lài)于研究者的自身素養(yǎng),其可靠性缺乏保證[27]。其次,社會(huì)科學(xué)研究者并不在數(shù)字媒體主導(dǎo)的計(jì)算中心當(dāng)中,因此有可能受制于各種數(shù)據(jù)霸權(quán)[28]。
與傳統(tǒng)的量化社會(huì)學(xué)研究相比,計(jì)算社會(huì)學(xué)作為一個(gè)正在興起的研究范式,整合納入了多種有別于傳統(tǒng)結(jié)構(gòu)化線性模型的新方法,其中包括大數(shù)據(jù)分析、關(guān)聯(lián)數(shù)據(jù)、社會(huì)網(wǎng)絡(luò)分析、文本分析、基于行動(dòng)者的建模以及地理空間分析等一系列對(duì)計(jì)算能力要求較高的分析模式。這些方法都從不同側(cè)面涉及某種統(tǒng)計(jì)量的計(jì)算和算法應(yīng)用。
關(guān)于社會(huì)網(wǎng)絡(luò)分析的經(jīng)典研究考察的是美國(guó)一個(gè)高中的艾滋病傳播[29]。在這一案例中,艾滋病之所以傳播迅速的原因在于學(xué)生彼此之間形成的親密關(guān)系網(wǎng)絡(luò)中存在一個(gè)核心的交往圈,通過(guò)這個(gè)交往圈可以將整體社會(huì)網(wǎng)絡(luò)中的每一個(gè)個(gè)體牽扯進(jìn)去,從而造成病毒的迅速傳播。關(guān)于這一網(wǎng)絡(luò)結(jié)構(gòu)的形成原因,研究者分析了幾個(gè)機(jī)制,如同類(lèi)相吸機(jī)制發(fā)現(xiàn),家庭背景相似的人更加容易產(chǎn)生相互關(guān)聯(lián);“不和前任的現(xiàn)任的前任去談朋友”等學(xué)生之間的特殊“規(guī)則”使得學(xué)校形成了一種特定的核心圈網(wǎng)絡(luò)結(jié)構(gòu)。之所以援引這一案例說(shuō)明網(wǎng)絡(luò)分析是一種計(jì)算社會(huì)學(xué)的方法,原因在于研究者可以根據(jù)不同的規(guī)則對(duì)人們的社交網(wǎng)絡(luò)進(jìn)行模擬,操作方法是在不同的“規(guī)則”下模擬網(wǎng)絡(luò)結(jié)構(gòu)并進(jìn)行比對(duì)。上述案例的研究者發(fā)現(xiàn),當(dāng)改變交往規(guī)則后,學(xué)生之間呈現(xiàn)的網(wǎng)絡(luò)結(jié)構(gòu)完全不一樣,相關(guān)的疾病傳播機(jī)制也隨之產(chǎn)生變化。從這個(gè)角度來(lái)講,對(duì)網(wǎng)絡(luò)結(jié)構(gòu)假象狀態(tài)的模擬成為計(jì)算社會(huì)學(xué)的重要分析手段。
再如行動(dòng)者建模中著名的謝林模型(Schelling model)主要研究的是種族隔離問(wèn)題[30]?;谛袆?dòng)者的建模將不同元素賦予特定的行動(dòng)規(guī)則,然后讓計(jì)算機(jī)來(lái)模擬,觀察當(dāng)這些元素彼此互動(dòng)時(shí),是否會(huì)形成某種特定的宏觀模式。在謝林模型中,不同種族的人一開(kāi)始隨機(jī)交往,但隨著模擬的進(jìn)行,最后不同種族的人各自聚集,形成所謂的“隔離”?;诔WR(shí)判斷,“隔離”的形成是因?yàn)槊總€(gè)人都有很強(qiáng)烈的愿望和同類(lèi)型的個(gè)體交往,但謝林模型證明,希望和同類(lèi)交往的強(qiáng)烈愿望實(shí)際上是不足以形成“隔離”的;相反,如果人們只是有輕微的愿望和同類(lèi)相連,則足以形成隔離。對(duì)于這種反常識(shí)的驗(yàn)證,恰恰是基于行動(dòng)者建模的魅力所在。
計(jì)算社會(huì)科學(xué)作為一套新興的分析手段,對(duì)于傳統(tǒng)因果關(guān)系的識(shí)別也具有重要意義。首先,計(jì)算社會(huì)學(xué)可以被用來(lái)進(jìn)行網(wǎng)絡(luò)實(shí)驗(yàn)。心理學(xué)關(guān)注的預(yù)言的自我實(shí)現(xiàn)現(xiàn)象,實(shí)際上是觀察個(gè)體如何受到他人影響而形成一個(gè)與現(xiàn)實(shí)狀態(tài)無(wú)關(guān)的判斷[31]。例如,研究者在網(wǎng)絡(luò)上模擬了一種虛擬狀態(tài),之后讓實(shí)驗(yàn)參與者進(jìn)入這種虛擬狀態(tài)。參與者需要聽(tīng)完歌曲后對(duì)其進(jìn)行評(píng)價(jià)和排序。在不同的虛擬場(chǎng)景中,參與者所獲取的社會(huì)性信息是有差異的:在一個(gè)虛擬環(huán)境中,參與者被告知研究對(duì)象的信息是真實(shí)的,既被告知了真實(shí)社會(huì)中排序較高的歌曲,也告知研究對(duì)象哪首歌曲更受歡迎;另一個(gè)虛擬環(huán)境中,參與者所獲取的信息是相反的或虛假的,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),參與者的判斷與歌曲自身的本質(zhì)屬性聯(lián)系不大,反而更容易受周?chē)h(huán)境的影響。通過(guò)類(lèi)似實(shí)驗(yàn),可以更好地幫助研究者識(shí)別出特定的因果關(guān)聯(lián)。
其次,對(duì)于因果關(guān)系異質(zhì)性的分析是計(jì)算社會(huì)學(xué)另一個(gè)用武之地。如上文所述,傳統(tǒng)的因果推斷主要考察平均層次上的因果關(guān)系,相比而言,很難估計(jì)個(gè)體層次的因果關(guān)系。這主要是因?yàn)?個(gè)體層次的反事實(shí)狀態(tài)往往無(wú)法獲取。但是,計(jì)算社會(huì)科學(xué)認(rèn)為,如果研究者掌握的數(shù)據(jù)足夠多,研究算法足夠精確,即可以比較精確地在個(gè)體層面上估算其反事實(shí)狀態(tài)。例如,在關(guān)于個(gè)體大學(xué)畢業(yè)就業(yè)后獲得收入的測(cè)量中,其反事實(shí)狀態(tài)是如果個(gè)體當(dāng)年未上大學(xué),其收入是多少。傳統(tǒng)的傾向值匹配或者加權(quán)方法一般通過(guò)組間比較,估算出樣本中所有上大學(xué)的人在未上大學(xué)的情況下的反事實(shí)“平均”收入,但這一方法仍然無(wú)法獲知精準(zhǔn)個(gè)體在反事實(shí)狀態(tài)下的收入。然而在大數(shù)據(jù)時(shí)代,基于特定的算法可以對(duì)個(gè)體層次的反事實(shí)狀態(tài)進(jìn)行比較精確的估計(jì),從而進(jìn)一步估算出個(gè)體層面的因果效果。目前學(xué)界在這方面已經(jīng)有了一系列卓有成效的探索,這也是未來(lái)計(jì)算社會(huì)學(xué)的發(fā)展方向之一[32]。
以上展示了相較于“傳統(tǒng)”的定量社會(huì)學(xué)研究,計(jì)算社會(huì)學(xué)的獨(dú)特之處。但這并不意味著計(jì)算社會(huì)學(xué)是對(duì)傳統(tǒng)定量社會(huì)學(xué)研究路徑的一種革命性改變。對(duì)于二者的關(guān)系,筆者認(rèn)為,計(jì)算社會(huì)學(xué)是定量社會(huì)學(xué)的相承和演化。其中,相承指的是后者承繼了社會(huì)學(xué)一貫的研究目的,演化指的是后者改變了達(dá)成目的的手段。
具體而言,社會(huì)學(xué)的學(xué)科特點(diǎn)決定了其基本的研究目標(biāo)在于對(duì)社會(huì)現(xiàn)象的詮釋與理解,從而可以從一個(gè)更高的理論角度對(duì)社會(huì)現(xiàn)象進(jìn)行解讀和分析。計(jì)算社會(huì)學(xué)的相關(guān)研究無(wú)論是采用新的數(shù)據(jù)還是新的方法,其最終目標(biāo)都是希望能夠把握社會(huì)現(xiàn)實(shí)、提升對(duì)社會(huì)的理解力。從這一角度看,計(jì)算社會(huì)學(xué)對(duì)于社會(huì)學(xué)一脈相承的研究動(dòng)機(jī)和目標(biāo)有著繼承性。但是,在研究手段上,計(jì)算社會(huì)學(xué)無(wú)疑做出了很多革新:與傳統(tǒng)小數(shù)據(jù)的研究相比,大數(shù)據(jù)的分析可以在一個(gè)更廣泛的空間或時(shí)間維度上研究社會(huì);與傳統(tǒng)結(jié)構(gòu)化的線性模型相比,新興的數(shù)據(jù)分析方法可以從已有資料中更有效率地抽離出有價(jià)值的模式和信息;對(duì)于因果關(guān)系的新的識(shí)別策略亦可以突破傳統(tǒng)的觀測(cè)性研究和平均因果效應(yīng),從而更為精細(xì)地了解某一處理變量在特定情境與人群中的獨(dú)特效應(yīng)。
社會(huì)學(xué)研究從來(lái)不是一個(gè)單一范式的過(guò)程,本文分析和對(duì)比了傳統(tǒng)量化研究的不同分析路徑,并從新數(shù)據(jù)、新方法以及對(duì)因果關(guān)系的識(shí)別三個(gè)角度對(duì)新興的計(jì)算社會(huì)學(xué)進(jìn)行了討論和辨析。這些討論有其側(cè)重,雖不能完全反映量化研究和計(jì)算社會(huì)學(xué)的全貌,卻也展示了社會(huì)學(xué)研究在范式選擇上的開(kāi)放性以及在計(jì)算社會(huì)科學(xué)時(shí)代下社會(huì)學(xué)經(jīng)驗(yàn)研究的多種可能性。
需要指出的是,社會(huì)學(xué)的學(xué)科價(jià)值更多在于長(zhǎng)久積累下來(lái)的對(duì)于社會(huì)發(fā)展和社會(huì)形態(tài)的理論洞見(jiàn),而驗(yàn)證與豐富這些理論洞見(jiàn)也成為了社會(huì)學(xué)經(jīng)驗(yàn)研究的價(jià)值所在,即無(wú)論是傳統(tǒng)的定量研究,還是新興的計(jì)算社會(huì)學(xué),都旨在為研究人員提供研究工具與手段。
筆者認(rèn)為,作為一個(gè)新興的社會(huì)學(xué)研究范式,計(jì)算社會(huì)學(xué)未來(lái)的發(fā)展有幾個(gè)重要的方向需要把握:一是如何保持社會(huì)學(xué)學(xué)科的獨(dú)特性問(wèn)題。計(jì)算社會(huì)學(xué)的發(fā)展離不開(kāi)對(duì)計(jì)算機(jī)和人工智能等領(lǐng)域內(nèi)成熟技術(shù)的吸收與借鑒。但是,如何讓計(jì)算社會(huì)學(xué)保留其社會(huì)學(xué)的學(xué)科特點(diǎn),而不是演變?yōu)橛?jì)算機(jī)學(xué)科的某一分支,是社會(huì)學(xué)研究者亟待考慮的問(wèn)題。尤其是隨著社會(huì)學(xué)學(xué)者對(duì)于新興技術(shù)的應(yīng)用日益頻繁,很多研究成果的核心內(nèi)容很容易演變成對(duì)某一新興技術(shù)的社會(huì)場(chǎng)景應(yīng)用,從而降低社會(huì)學(xué)學(xué)科本身的價(jià)值。因此,未來(lái)計(jì)算社會(huì)學(xué)的一個(gè)發(fā)展方向是讓計(jì)算技術(shù)“為我所用”,避免實(shí)質(zhì)問(wèn)題的探索反而被技術(shù)反噬,成為技術(shù)的附庸。二是人機(jī)互動(dòng)問(wèn)題。在計(jì)算社會(huì)學(xué)研究中,隨著人工智能技術(shù)和相關(guān)算法的使用,人工因素的影響力逐漸下降。如傳統(tǒng)的文本分析重在研究者的編碼和后續(xù)詮釋,但是到了文本挖掘階段,研究者的這種“人工”編碼實(shí)際上被機(jī)器的計(jì)算所取代。但是,計(jì)算機(jī)領(lǐng)域?qū)τ诟鞣N新興算法的開(kāi)發(fā)往往以人工標(biāo)準(zhǔn)作為衡量機(jī)器表現(xiàn)的依據(jù)。可見(jiàn),無(wú)論是計(jì)算社會(huì)學(xué)還是人工智能,都需要妥善處理機(jī)器和人工的關(guān)系。由于二者之間各有強(qiáng)項(xiàng),未來(lái)計(jì)算社會(huì)學(xué)的研究要考慮人機(jī)協(xié)作的問(wèn)題,讓研究者的人工和算法的機(jī)器之間達(dá)成某種平衡,而不是片面以機(jī)器為主導(dǎo)。三是計(jì)算社會(huì)學(xué)的人才培養(yǎng)問(wèn)題。傳統(tǒng)定量社會(huì)學(xué)范式下的人才培養(yǎng)以數(shù)理知識(shí)為基本導(dǎo)向,在課程設(shè)計(jì)上以結(jié)構(gòu)化統(tǒng)計(jì)模型(如線性模型、結(jié)構(gòu)方程等)為主。但是在計(jì)算社會(huì)學(xué)范式下,人才培養(yǎng)將以算法理解和開(kāi)發(fā)為導(dǎo)向,這對(duì)于算法設(shè)計(jì)思維與編程能力提出了新的要求。如何在保留現(xiàn)有課程設(shè)置框架的前提下,優(yōu)化人才培養(yǎng)方式,讓社會(huì)學(xué)學(xué)科的課程設(shè)置更加配合計(jì)算社會(huì)學(xué)的要求,也將是未來(lái)計(jì)算社會(huì)學(xué)發(fā)展需要著重考慮的問(wèn)題之一。