国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

定量分析:大數(shù)據(jù)背景下語言哲學(xué)研究方法論

2021-04-15 01:58:37陳偉
浙江社會(huì)科學(xué) 2021年6期
關(guān)鍵詞:語料庫定量哲學(xué)

□陳偉

內(nèi)容提要 大數(shù)據(jù)時(shí)代,在數(shù)據(jù)驅(qū)動(dòng)下人文社會(huì)科學(xué)的研究方法在某些領(lǐng)域已發(fā)生改變,由定性研究為主轉(zhuǎn)向定量研究為主,以語言作為研究對(duì)象的語言哲學(xué)也是如此。定量分析法之所以越來越受到重視,是因?yàn)樗軌蜻m應(yīng)大數(shù)據(jù)和云計(jì)算的需求,可以提高精度以及保證處理結(jié)果的準(zhǔn)確性和可靠性。語言哲學(xué)中定量分析法主要有基于模型技術(shù)(計(jì)算機(jī)模擬、數(shù)學(xué)模型)的方法,和數(shù)據(jù)驅(qū)動(dòng)(實(shí)驗(yàn)哲學(xué)、語料庫)的方法,這些方法使得語言哲學(xué)的研究對(duì)象發(fā)生轉(zhuǎn)變,而且為人文社科研究提供新范式,并可對(duì)相關(guān)研究實(shí)踐進(jìn)行重構(gòu)。大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)已成為比自然語言更加精準(zhǔn)、便利、可操作、可計(jì)算的科學(xué)語言,語言哲學(xué)研究也將由此發(fā)生數(shù)據(jù)化的變革。

引言

人類智力的進(jìn)步可歸結(jié)為科技的進(jìn)步,當(dāng)今科技的發(fā)展以信息技術(shù)開發(fā)和利用為主要手段,與此同時(shí)大數(shù)據(jù)時(shí)代的到來,引發(fā)了人類思維模式和科技發(fā)展模式的變革。繼第三次工業(yè)革命之后,信息化和數(shù)據(jù)化腳步逐漸加快,自然科學(xué)領(lǐng)域中的互聯(lián)網(wǎng)、人工智能、人機(jī)交互等技術(shù)手段都需要有大數(shù)據(jù)作為支撐,那么人文社會(huì)科學(xué)研究也相應(yīng)地發(fā)生改變,可謂是面臨著機(jī)遇與挑戰(zhàn)。大數(shù)據(jù)不僅僅是信息技術(shù)的創(chuàng)新,從哲學(xué)方法論來看,以海量數(shù)據(jù)匯集、處理與利用的現(xiàn)代化社會(huì)必然會(huì)引發(fā)科學(xué)研究對(duì)象、范式、方法的轉(zhuǎn)變。在信息爆炸的時(shí)代,人們的生活形式具有海量數(shù)據(jù)存儲(chǔ)的特點(diǎn),大數(shù)據(jù)勢必會(huì)為語言認(rèn)知、自然語言處理帶來巨大變化①。大數(shù)據(jù)技術(shù)為哲學(xué)社會(huì)科學(xué)開啟新的研究領(lǐng)域②。

上個(gè)世紀(jì)被稱為“分析哲學(xué)時(shí)代”,由于數(shù)理邏輯的應(yīng)用,認(rèn)知研究的語言轉(zhuǎn)向使認(rèn)知研究語言更加嚴(yán)謹(jǐn)、明確,更加符合邏輯規(guī)范,并因此開辟了分析哲學(xué)、語言哲學(xué)等認(rèn)知研究新領(lǐng)域。但是,經(jīng)過近一個(gè)世紀(jì)的發(fā)展,語言轉(zhuǎn)向并沒有實(shí)現(xiàn)當(dāng)初的學(xué)術(shù)愿景。分析哲學(xué)家對(duì)形而上學(xué)語言的邏輯分析和邏輯重構(gòu)難以進(jìn)行,語言哲學(xué)家對(duì)自然語言的邏輯分析又讓自然語言支離破碎,因此20世紀(jì)的語言轉(zhuǎn)向雖然取得了不少成績,但最后基本上都以逐漸衰落而告終③。以往,哲學(xué)分析的一個(gè)顯著特征是對(duì)定性的研究方法高度依賴,而大數(shù)據(jù)時(shí)代的標(biāo)志是數(shù)據(jù)的海量匯集與處理,大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)無法再用常規(guī)的方法和工具處理,需要基于模型和數(shù)據(jù)驅(qū)動(dòng)的方法才能更加精確無誤地應(yīng)對(duì)。

一、由定性分析到定量分析:語言哲學(xué)必要的研究方法

以往哲學(xué)分析的一個(gè)顯著特征是嚴(yán)重依賴定性的方法,即采用自然語言論證的方式,但定性的分析方法無法以現(xiàn)代數(shù)理邏輯為工具對(duì)特定現(xiàn)象進(jìn)行分析。如上個(gè)世紀(jì)以克里普克(Kripke)和劉易斯(Lewis)對(duì)模態(tài)現(xiàn)實(shí)主義的辯護(hù)中可以看到,他們的論點(diǎn)完全是定性的,數(shù)理工具起不到任何作用,他們的成果二十世紀(jì)備受矚目,這種分析法是當(dāng)時(shí)分析哲學(xué)的主流。但是,完全依賴于定性的方法對(duì)于哲學(xué)的發(fā)展是不利的。首先,其他學(xué)科的常規(guī)分析法往往會(huì)用數(shù)理邏輯為工具,比如語言學(xué)、社會(huì)學(xué)、物理學(xué)等,這樣哲學(xué)家很難與其他領(lǐng)域的學(xué)者進(jìn)行有意義的對(duì)話,哲學(xué)就會(huì)與其他學(xué)科隔離開來,因此人們普遍聲稱的哲學(xué)與科學(xué)的普遍相關(guān)性,在方法論上是孤立的;其次,定性分析以價(jià)值判斷為主,多數(shù)是根據(jù)經(jīng)驗(yàn)、觀察、回顧等非量化手段進(jìn)行分析,具有主觀性較強(qiáng)的特點(diǎn);再者,以往哲學(xué)家對(duì)定性研究方法的偏愛似乎與他們所倡導(dǎo)的對(duì)分析精度和清晰度的承諾相矛盾,在許多情況下,定性的方法會(huì)使哲學(xué)話語變得不精確和不可靠,即使不是晦澀難懂也難以處理。當(dāng)然,這并不是說定性的方法沒有其使用價(jià)值,只是在哲學(xué)的某些領(lǐng)域確實(shí)產(chǎn)生了一些問題。

從庫恩《科學(xué)革命的結(jié)構(gòu)》一書自1962年出版以來,科學(xué)研究的信息化和數(shù)據(jù)化腳步逐漸加快,科學(xué)研究進(jìn)入大數(shù)據(jù)時(shí)代(Big Data Era)正在“催生最大的數(shù)據(jù)變革”④。新技術(shù)的出現(xiàn)為人文社會(huì)科學(xué)開辟新的領(lǐng)域,哲學(xué)及相關(guān)學(xué)科研究方法也在變革。大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘不僅因?qū)嵱脙r(jià)值越來越重要,而且在方法論上也越來越復(fù)雜,涉及的領(lǐng)域越來越寬,因此,正確的方法論是大數(shù)據(jù)時(shí)代所急需的哲學(xué)指導(dǎo)⑤。

大數(shù)據(jù)時(shí)代要有大數(shù)據(jù)思維,處理大量信息的迫切需求促使我們思考計(jì)算機(jī)如何為承擔(dān)這些繁重的任務(wù)提供幫助,如信息提取及機(jī)器翻譯,計(jì)算語言學(xué)和自然語言信息處理等相關(guān)學(xué)科都需要計(jì)算機(jī)進(jìn)行信息處理。在大數(shù)據(jù)背景下,定量的研究方法越來越盛行,這種方法的應(yīng)用能夠很好地適應(yīng)數(shù)據(jù)分析與處理的要求,并可以很好地解決哲學(xué)方法論中定性分析方法不足的空缺。定量方法包括各種各樣的工具,從基于模型的技術(shù)(數(shù)學(xué)模型和計(jì)算機(jī)模擬)到數(shù)據(jù)驅(qū)動(dòng)的方法(實(shí)驗(yàn)哲學(xué)和語料研究)。定量方法具有多樣性的特點(diǎn),基本都是以數(shù)學(xué)工具來制定和解決哲學(xué)問題的。

語言是信息的主要載體,在大數(shù)據(jù)浪潮之下語言學(xué)研究方法從某種程度上來說正是迎合信息傳遞和運(yùn)算的需求。在語言學(xué)學(xué)科領(lǐng)域,旨在探索語言結(jié)構(gòu)和模式的計(jì)量語言學(xué)已悄然興起,采用定量的統(tǒng)計(jì)方法來解釋語言學(xué)問題。傳統(tǒng)語言學(xué)重在分析特定示例,或利用語言直覺來尋求語言結(jié)構(gòu)的規(guī)則,許多情況下通過內(nèi)省的方法進(jìn)行語言的研究。與傳統(tǒng)語言學(xué)不同的是,定量語言學(xué)將語言識(shí)別為復(fù)雜的自適應(yīng)系統(tǒng),利用真實(shí)的語言數(shù)據(jù)并依靠定量方法來探索語言的結(jié)構(gòu)化并不斷發(fā)展,簡而言之,它具有準(zhǔn)確性、真實(shí)性、動(dòng)態(tài)性⑥。傳統(tǒng)的語言學(xué)研究成果很少被自然科學(xué)所運(yùn)用,如人工智能處理、大數(shù)據(jù)分析等,主要原因是缺乏準(zhǔn)確性、科學(xué)性以及可操作性。定量語言學(xué)作為語言學(xué)的一個(gè)分支,它的分析則是基于一種事實(shí)判斷,是建立在實(shí)證主義的方法論基礎(chǔ)上的,依照客觀真實(shí)的文本數(shù)據(jù),分析探索語言的結(jié)構(gòu)并建立模型,從而獲得更全面的信息。這種分析模式與自然科學(xué)相似,更有利于智能分析和處理。

以邏輯為工具在語言哲學(xué)研究中很常見,但多是基于形式邏輯,這種研究方式在處理有關(guān)語言的哲學(xué)問題方面有著悠久的傳統(tǒng)。相對(duì)而言,基于模型和數(shù)據(jù)驅(qū)動(dòng)的方法直到最近才在語言哲學(xué)中獲得突出地位,這些方法比邏輯推理在大數(shù)據(jù)時(shí)代更加適用,在多數(shù)情況下,基于模型和數(shù)據(jù)驅(qū)動(dòng)的方法可以提高精度,提高結(jié)果的準(zhǔn)確性和可靠性,并通過與相鄰學(xué)科中的有關(guān)方法相聯(lián)系,推動(dòng)語言哲學(xué)的發(fā)展。然而,盡管有諸多益處,但迄今為止尚無任何研究對(duì)語言哲學(xué)中的定量方法進(jìn)行全面的處理。我們試圖通過梳理定量研究方法在語言哲學(xué)領(lǐng)域的基本路徑和重要意義,為該領(lǐng)域的研究提供方法論上的借鑒。

二、科學(xué)模型的建構(gòu):以數(shù)學(xué)和計(jì)算模型為工具的定量分析

大數(shù)據(jù)時(shí)代的典型特征是數(shù)據(jù)的大量匯集,海量信息的捕捉和處理無法用傳統(tǒng)的方法進(jìn)行,隨著對(duì)大數(shù)據(jù)認(rèn)識(shí)的深化,人們發(fā)現(xiàn)大數(shù)據(jù)具有“七極”的特征,極大、極速、極多、極高、極真、極易變化和極為復(fù)雜,除了為人類帶來的效率和效用以外,其極易變化和極為復(fù)雜的負(fù)面特征也凸顯出來,因此正確的“數(shù)據(jù)挖掘”(data-mining)至關(guān)重要⑦。在語言哲學(xué)研究中進(jìn)行“數(shù)據(jù)挖掘”具體要使用什么樣的定量工具呢?

模型是目前語言哲學(xué)中爭議最小的量化工具,數(shù)學(xué)模型采用的是數(shù)學(xué)運(yùn)算的方式來分析客觀現(xiàn)象與數(shù)學(xué)對(duì)象之間的關(guān)系。數(shù)學(xué)模型在科學(xué)研究中無處不在,有豐富的哲學(xué)文獻(xiàn)可用于解釋它們的本質(zhì),并可用于深入的探討⑧。事實(shí)上,哲學(xué)家現(xiàn)在經(jīng)常依靠代數(shù)、概率論和微分方程來解決跟語言相關(guān)的一些問題。

除數(shù)學(xué)模型外,計(jì)算模型在語言哲學(xué)中也相當(dāng)普遍。計(jì)算模型通過將目標(biāo)系統(tǒng)表示為存儲(chǔ)在內(nèi)存和算法中的數(shù)據(jù)包(即更新控制系統(tǒng)行為的規(guī)則)來模擬研究的對(duì)象。通過在不連續(xù)的時(shí)間步長中迭代更新,可得出有關(guān)系統(tǒng)軌跡和最終狀態(tài)的數(shù)據(jù),以供進(jìn)一步處理和分析。基于代理的模型是計(jì)算機(jī)進(jìn)行模擬的一種特別普遍的類型,通常是模擬自治或半自治代理之間的交互過程。無論其形式如何,計(jì)算機(jī)模擬通常是通過闡明過于復(fù)雜而無法進(jìn)行分析處理的內(nèi)部工作原理,目的是為了補(bǔ)充數(shù)學(xué)模型。

但這拋開了如何證明在哲學(xué)中使用模型的合理性問題。哲學(xué)家為什么要訴諸數(shù)學(xué)和計(jì)算模型?在什么條件下應(yīng)該怎樣做?雖然很難詳盡地回答這些問題,但模型在研究生物和文化進(jìn)化產(chǎn)生的現(xiàn)象時(shí)特別有用。這是因?yàn)樯锖臀幕I(lǐng)域變化的主要?jiǎng)右蚴沁M(jìn)化,如選擇和漂移。而充滿定性論證的冗長散文往往難以追蹤其進(jìn)化過程,而以數(shù)學(xué)和計(jì)算機(jī)模型為工具的定量分析則表現(xiàn)出色,這使得數(shù)學(xué)和計(jì)算模型成為極富啟發(fā)性的工具,可用于研究傳統(tǒng)上困擾哲學(xué)家的各種現(xiàn)象。既然語言是生物和文化進(jìn)化的產(chǎn)物,那么語言哲學(xué)也可以從模型的使用中受益,模型有時(shí)會(huì)在言語推理失敗的情況下提供良好的結(jié)果。在不求助于數(shù)學(xué)和計(jì)算工具的情況下,要追蹤作為交流基礎(chǔ)的理性決策和進(jìn)化過程將是極其困難的。模型可以提供一般通過口頭推理而無法獲得的結(jié)果,可以提高哲學(xué)研究的可靠性。

模型的另一個(gè)好處在于其精確性。例如,語言哲學(xué)中的模型可以設(shè)置哪些是應(yīng)該出現(xiàn)的條件,哪些是不應(yīng)該出現(xiàn)的,有了明確的規(guī)定就可以進(jìn)行言語處理,否則數(shù)量龐雜的言語現(xiàn)象將無法有效地處理。例如,著名的語言哲學(xué)家格萊斯(Grice)(1975)提出的對(duì)話交流過程中的“合作原則(Cooperative Principle)”,包括“量的準(zhǔn)則”“質(zhì)的準(zhǔn)則”“關(guān)系準(zhǔn)則”“方式準(zhǔn)則”。但格萊斯所謂的“合作”到底指的是什么?而溝通的量又需要多少呢?這些問題,格賴斯的口頭論證是無法回答的,但是利用語用學(xué)中的數(shù)學(xué)模型可以很容易地解決⑨。至少可以說,在純粹定性方法的基礎(chǔ)上得出的結(jié)論是很難站住腳的,即便是有些語言哲學(xué)家為其辯護(hù)也很難找到充分的條件。

語言哲學(xué)研究中所使用的數(shù)學(xué)和計(jì)算模型,其實(shí)都來源于哲學(xué)以外的領(lǐng)域。哲學(xué)家主要是從經(jīng)濟(jì)學(xué)(理性選擇理論)和進(jìn)化生物學(xué)(進(jìn)化博弈論)等領(lǐng)域借鑒了這些方法,這種跨學(xué)科進(jìn)行研究的方式為語言哲學(xué)的研究帶來了生機(jī)。

三、研究方法的運(yùn)用:試驗(yàn)哲學(xué)與語料庫分析法

人類信息化的普及和大數(shù)據(jù)時(shí)代的到來,是新技術(shù)革命成功的結(jié)果,同時(shí)又由此引發(fā)了新一輪的技術(shù)與方法的變革。數(shù)據(jù)的運(yùn)用和處理無疑成為了一系列學(xué)科關(guān)注的熱點(diǎn)。數(shù)據(jù)在過去主要是指由數(shù)字和計(jì)量單位一起構(gòu)成的對(duì)事物量化的描述,在人類對(duì)世界的量化認(rèn)識(shí)中起著重要的作用⑩。大數(shù)據(jù)發(fā)展的基石就是數(shù)據(jù)量的指數(shù)增加,無論是數(shù)據(jù)挖掘、文本處理、自然語言處理還是機(jī)器模型的構(gòu)建,大多都是基于一定量的數(shù)據(jù),數(shù)據(jù)規(guī)模達(dá)到一定程度,然后采用基于規(guī)則的方法或者概率統(tǒng)計(jì)學(xué)的方法進(jìn)行模型構(gòu)建,知識(shí)的獲取才更有意義?。

語言哲學(xué)家對(duì)自然語言或人工語言的功能及結(jié)構(gòu)的分析,以往以調(diào)查或觀察為主,如今隨著語言數(shù)據(jù)的海量匯集,使我們能夠采用與計(jì)算機(jī)科學(xué)密切相關(guān)的大數(shù)據(jù)平臺(tái),如利用計(jì)算仿真實(shí)驗(yàn)和語料庫分析等,為語言哲學(xué)提供實(shí)證研究。語料庫的運(yùn)用與實(shí)驗(yàn)哲學(xué)分析在大數(shù)據(jù)時(shí)代背景下日漸普及開來。德維特(Devitt)指出,語言哲學(xué)家應(yīng)更多地依賴于實(shí)際用法的證據(jù),包括語料庫的句子和受控實(shí)驗(yàn)中的句子,來自調(diào)查數(shù)據(jù)的證據(jù)顯然是參與者對(duì)問題和命題的直觀判斷,而不是實(shí)際的語言使用?。為了收集使用真實(shí)語言的數(shù)據(jù),我們需要訴諸大數(shù)據(jù)方法。

語言哲學(xué)中一種相當(dāng)常見的定量研究形式是實(shí)驗(yàn)哲學(xué)。實(shí)驗(yàn)哲學(xué)通常借用人文社會(huì)科學(xué),特別是語言學(xué)和心理學(xué)的方法對(duì)指定的對(duì)象進(jìn)行研究。例如,在認(rèn)識(shí)論中,溫伯格(Weinberg)、尼克爾斯(Nichols)和斯蒂克(Stich)依靠實(shí)驗(yàn)數(shù)據(jù)來論證,關(guān)于構(gòu)成知識(shí)的直覺是不可靠的,事實(shí)證明它們會(huì)隨著理論無關(guān)的因素而變化?;在科學(xué)哲學(xué)中,斯托茨(Stotz),格里菲斯(Griffiths)和奈特(Knight)分析了調(diào)查數(shù)據(jù),表明生物學(xué)家對(duì)基因有不同的概念,這取決于他們的專業(yè)領(lǐng)域?;在語言哲學(xué)中,實(shí)驗(yàn)哲學(xué)的一個(gè)經(jīng)典例子是(Machery),馬?。∕allon),尼克爾斯(Nichols)以及斯蒂克(Stich)對(duì)克里普克(Kripke)思想實(shí)驗(yàn)的處理,發(fā)現(xiàn)關(guān)于參照的判斷在不同文化中呈現(xiàn)出不穩(wěn)定性?。以上實(shí)驗(yàn)哲學(xué)的研究曾引發(fā)一場關(guān)于是依靠直覺還是依靠試驗(yàn)數(shù)據(jù)的激烈辯論。

實(shí)驗(yàn)哲學(xué)家沒有自己的方法論,但是他們在研究中借鑒了許多來自社會(huì)心理學(xué)和認(rèn)知科學(xué)的各種實(shí)驗(yàn)工具和方法。最常用的實(shí)驗(yàn)哲學(xué)中的一種方法是問卷調(diào)查,用于引起人們對(duì)有關(guān)問題的直觀判斷。在特定情況下的問題或命題。盡管如此,人們已經(jīng)意識(shí)到調(diào)查只是一項(xiàng)可供哲學(xué)家使用的實(shí)驗(yàn)性工具,而且仍然有許多不同類型的實(shí)驗(yàn)方法可用于哲學(xué)研究。

盡管最近實(shí)驗(yàn)哲學(xué)獲得了大量關(guān)注,但哲學(xué)領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)研究不應(yīng)局限于實(shí)驗(yàn)工作。在哲學(xué)領(lǐng)域,語料庫研究依靠語料庫數(shù)據(jù)來解決哲學(xué)家感興趣的問題。

特別是基于語料庫的方法為語言哲學(xué)研究提供了一系列幫助,使它們成為實(shí)驗(yàn)工具的重要補(bǔ)充。語料庫僅僅是口語或書面語的樣本,不是在實(shí)驗(yàn)室環(huán)境中產(chǎn)生的,而是在特定領(lǐng)域內(nèi)收集的。與其他形式的數(shù)據(jù)驅(qū)動(dòng)研究中使用的實(shí)驗(yàn)數(shù)據(jù)相比,語料庫包含觀察數(shù)據(jù)。但是,語料庫語言學(xué)的研究表明,基于語料庫和實(shí)驗(yàn)數(shù)據(jù)集的結(jié)果有時(shí)會(huì)出現(xiàn)分歧?。這說明,語料庫研究和實(shí)驗(yàn)技術(shù)應(yīng)該相互補(bǔ)充,以評(píng)估和提高結(jié)果的準(zhǔn)確性和可靠性。

因此,語言哲學(xué)家也應(yīng)該在考慮實(shí)驗(yàn)數(shù)據(jù)的同時(shí)考慮語料庫數(shù)據(jù),特別是那些對(duì)我們實(shí)際語言行為的歸納及相關(guān)語料的收集,語料庫形式的觀察數(shù)據(jù)也應(yīng)該用于語言哲學(xué)理論的建構(gòu)中。當(dāng)然,在某些情況下,為哲學(xué)領(lǐng)域感興趣的問題去探究具有普遍意義的語料庫是具有挑戰(zhàn)性的。因此,哲學(xué)家有時(shí)可能更適合研究在實(shí)驗(yàn)室里產(chǎn)生的語言數(shù)據(jù)?。但如今隨著信息量的增加,大數(shù)據(jù)技術(shù)的介入,在更多情況下,也許可以使用語料庫數(shù)據(jù)來解決哲學(xué)家們長期以來感興趣的問題。

語料庫方法在涉及語言問題時(shí)有巨大的潛力。語料庫研究可以為日益廣泛的網(wǎng)絡(luò)語言提取、歸納、分析提供依據(jù)。針對(duì)網(wǎng)絡(luò)語言暴力、未成年不良網(wǎng)絡(luò)社交行為、低俗言語泛濫、網(wǎng)絡(luò)流行語使用不當(dāng)?shù)痊F(xiàn)象,以往研究是分析其語義內(nèi)容得到片面的主觀的結(jié)論,雖然相關(guān)學(xué)者提出很多提議,也用哲學(xué)分析的一些方法對(duì)照實(shí)際語言對(duì)其進(jìn)行評(píng)價(jià),但是一些問題始終不能回答。比如,污言穢語如果出自同一個(gè)主體,是否每次都會(huì)有冒犯性,是否其目標(biāo)具有一致性?在恰當(dāng)?shù)恼Z境中使用侮蔑語的頻率有多高?這些雖然是具有哲學(xué)意義的問題,但最好使用語料庫數(shù)據(jù)來解決,因?yàn)檎Z料庫研究可以通過對(duì)照實(shí)際語言用法及用例對(duì)這些問題進(jìn)行精準(zhǔn)的評(píng)價(jià)。

四、大數(shù)據(jù)背景下定量研究法的意義

在一般科學(xué)方法論中,馬克思將“研究方法”與“敘述方法”區(qū)別開來,“研究方法”是指科學(xué)發(fā)現(xiàn)的方法,“敘述方法”是指理論構(gòu)建的方法。馬克思在研究方法上認(rèn)為,研究必須充分地占有材料,分析它的各種發(fā)展形勢,探尋這些不同形式的內(nèi)在聯(lián)系,只有在這項(xiàng)工作完成后,現(xiàn)實(shí)的運(yùn)動(dòng)才能適當(dāng)?shù)財(cái)⑹龀鰜?。科學(xué)發(fā)現(xiàn)的方法也就是“研究方法”,務(wù)必要靠大量的、充分的、基于事實(shí)的資料才能構(gòu)建出科學(xué)的理論,所謂的資料即數(shù)據(jù)資源。

在大數(shù)據(jù)和云計(jì)算背景下,世界萬物皆可用數(shù)據(jù)表征,諸如文字、聲音、圖像、語言等等,數(shù)據(jù)像語言一樣是一種通用的表達(dá)工具。數(shù)據(jù)最基本的分析方法是定量分析,通過定量分析對(duì)事物發(fā)展的方向、人類的行為、各領(lǐng)域的情況進(jìn)行總結(jié)或預(yù)測,得出的結(jié)論甚至?xí)饺祟惖恼J(rèn)知。所以,在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”?。以數(shù)據(jù)作為支撐能夠解決以往因?yàn)椴粔蛉婢_而帶來的分析不足的短板,由對(duì)現(xiàn)象“怎么看”向現(xiàn)象“是什么”轉(zhuǎn)變,質(zhì)性研究向量性研究的變化使得人們的認(rèn)知也能夠更加的真實(shí)、客觀。

(一)語言哲學(xué)研究對(duì)象的轉(zhuǎn)變

大數(shù)據(jù)時(shí)代的到來產(chǎn)生了一系列的變化,不僅語言哲學(xué)研究方法發(fā)生變化,研究對(duì)象也隨之改變。在布雷斯南(Joan Bresnan)的《語言學(xué)的花園與灌木叢》(Linguistics:The Garden and the Bush)一文中?,布雷斯南回憶了她如何從“花園”到“灌木叢”,認(rèn)為大多數(shù)傳統(tǒng)的語言理論本質(zhì)上背離了社會(huì)對(duì)語言理論的要求。作為“花園”,包含生成語法的傳統(tǒng)語言學(xué)關(guān)注的是語言學(xué)家通過內(nèi)省仔細(xì)選擇或培養(yǎng)的語言現(xiàn)象,并使用語法樹和短語等符號(hào)定性地概括它們。相比之下,“灌木叢”又稱“田野語言學(xué)”,它關(guān)注的是人們在日常交流中實(shí)際使用的語言,以條件概率和信息內(nèi)容為基礎(chǔ)進(jìn)行定量分析。從“花園”到“灌木叢”的轉(zhuǎn)變,其實(shí)意味著研究對(duì)象發(fā)生了變化(范圍由微觀到宏觀),研究方法(定量方法)和性質(zhì)(形而上到實(shí)用主義)也發(fā)生變化。

語言是信息的主要載體,對(duì)它的研究在信息化時(shí)代應(yīng)同時(shí)滿足人機(jī)需求。自然語言處理需要轉(zhuǎn)化為語言數(shù)據(jù)。一般來說,科學(xué)研究涉及抽象建模。模型的特征代表了被建模對(duì)象的可觀察屬性。通過利用抽象創(chuàng)建的模型和模型所代表的內(nèi)容,以一種間接的方式解釋現(xiàn)實(shí)世界。因此,理論的構(gòu)建依賴于模型和現(xiàn)實(shí)之間的對(duì)應(yīng)關(guān)系,從一個(gè)忽略本質(zhì)和不能反映真實(shí)色彩的模型中得出的結(jié)論是很難應(yīng)用到實(shí)際的。

大數(shù)據(jù)是一項(xiàng)工具,定量研究是一種方法,這種工具和方法既可以處理形式語言也可以處理自然語言,而以往分析方法只能處理自然語言。語言學(xué)研究模式發(fā)生變化,那么為迎合實(shí)際需求,語言哲學(xué)也要迎接信息時(shí)代的重大轉(zhuǎn)變。

(二)人文社科研究的新范式

知識(shí)的發(fā)現(xiàn)和證明是哲學(xué)認(rèn)識(shí)論中兩個(gè)重要階段。在大數(shù)據(jù)時(shí)代,用定量的方法對(duì)已有知識(shí)進(jìn)行重新整合并論證,可以使已有結(jié)果更加可靠,或會(huì)產(chǎn)生新的發(fā)現(xiàn)。語言哲學(xué)基本的研究方式是用邏輯方法對(duì)相關(guān)語言材料進(jìn)行分析,今后語言哲學(xué)關(guān)注的焦點(diǎn)將是語言數(shù)據(jù)的發(fā)現(xiàn)和證明。

大數(shù)據(jù)時(shí)代的到來,對(duì)于人文社科領(lǐng)域可謂是充滿了機(jī)遇。將原有語言文本轉(zhuǎn)化成數(shù)據(jù),用量化的方法進(jìn)行統(tǒng)計(jì)分析。比如在文學(xué)領(lǐng)域,小說文本電子化、電子檔案的普及、大型數(shù)據(jù)庫建設(shè)完備和跨庫檢索、智能分析技術(shù)發(fā)展完善后,文學(xué)研究具備了宏觀研究的必要條件。比如對(duì)于《紅樓夢》成書過程的研究:公認(rèn)的說法是前80回由曹雪芹著,后40回由高鶚續(xù)寫的說法。后來通過數(shù)據(jù)分析發(fā)現(xiàn)結(jié)果并非如此,并否定了之前的說法。原因是人的認(rèn)識(shí)具有主觀性,即便是知名學(xué)者也難免會(huì)陷入誤區(qū)。窮盡式的大數(shù)據(jù)語言風(fēng)格定量分析,能夠精準(zhǔn)的把握作者的言語模式,因此能夠有新的發(fā)現(xiàn)。

實(shí)驗(yàn)哲學(xué)研究表明靠人類直覺獲得的概念是不可靠的,無論是自然科學(xué)還是人文社會(huì)科學(xué)靠實(shí)驗(yàn)的方法來論證更為可靠。莫萊蒂(Moretti)于2010年成立的斯坦福文學(xué)實(shí)驗(yàn)室,就是將文學(xué)文本數(shù)據(jù)化后再進(jìn)行量化分析的典范。這種對(duì)待文學(xué)研究有如對(duì)待一般科學(xué)研究的處理方式,對(duì)于文學(xué)領(lǐng)域來說是一個(gè)挑戰(zhàn)。通過從歷史傳統(tǒng)和文學(xué)研究的內(nèi)在需求來看,基于數(shù)理邏輯與數(shù)據(jù)實(shí)證的文藝研究方法具有合理性,把審美特性與科學(xué)邏輯相結(jié)合,帶來革命性的轉(zhuǎn)折。由此引發(fā)了一些新的學(xué)科提法,如“統(tǒng)計(jì)文藝學(xué)”“計(jì)量文學(xué)”等。將人文學(xué)科與數(shù)理邏輯、語料庫分析等相結(jié)合,用定量分析的方式進(jìn)行分析,普及開來后將會(huì)產(chǎn)生革命性的變革。

數(shù)據(jù)轉(zhuǎn)向是大勢所趨,研究范式隨之改變。與人類社會(huì)相關(guān)的如社會(huì)學(xué)、新聞與傳播學(xué)、教育學(xué)、法學(xué)、經(jīng)管類等實(shí)用性較強(qiáng)的社會(huì)學(xué)科更為適用。大數(shù)據(jù)時(shí)代讓一切看似不可能解決的問題有了解決的可能,在對(duì)哲學(xué)意義的追問中更為系統(tǒng)、形象。

(三)重構(gòu)研究實(shí)踐

第一,緩解定性和定量兩種不同取向的研究范式。在邏輯實(shí)證主義(Logical positivism)的鼎盛時(shí)期,艾耶爾(Ayer)認(rèn)為哲學(xué)應(yīng)該只關(guān)心語言和邏輯的事實(shí)在那個(gè)時(shí)期大部分的爭論一直圍繞著認(rèn)知狀態(tài)先驗(yàn)和后驗(yàn)方法,以及推理和依靠感覺經(jīng)驗(yàn)的方法。一直以來仍有學(xué)者堅(jiān)持觀念推理在哲學(xué)話語中起著重要的作用。例如,比勒(Bealer)認(rèn)為哲學(xué)中的先驗(yàn)直覺不僅獨(dú)立于科學(xué)中的經(jīng)驗(yàn)工作,而且具有更大的認(rèn)識(shí)價(jià)值但其他人強(qiáng)烈反對(duì)這種觀點(diǎn),因?yàn)樵诤艽蟪潭壬虾鲆暳硕垦芯糠椒ㄔ谔幚硐嚓P(guān)問題時(shí)的重要性。最近的一個(gè)例子是馬歇瑞(Machery),他認(rèn)為來自思維實(shí)驗(yàn)的先驗(yàn)直覺是不可靠的,因?yàn)樗季S實(shí)驗(yàn)得出的結(jié)論過于牽強(qiáng)和理想化。關(guān)于定性觀念理念和定量工具理念的爭論在語言哲學(xué)及其他領(lǐng)域持續(xù)了半個(gè)多世紀(jì)。

然而,目前的研究實(shí)踐表明,定性和定量分析是哲學(xué)研究方法中不同的研究方式。比如當(dāng)研究語言哲學(xué)中語言意義演變的進(jìn)化現(xiàn)象時(shí),用到動(dòng)態(tài)模型和計(jì)算機(jī)模擬,這種情況下需要定量處理;當(dāng)通過海量規(guī)模的樣本數(shù)據(jù),直接能夠發(fā)現(xiàn)語言規(guī)律或現(xiàn)象,既不用檢測變量又可避免樣本偏差時(shí),直接定性處理就可以。以大數(shù)據(jù)為背景的研究,可以說是使定性和定量研究范式發(fā)生了轉(zhuǎn)變,在兩者之間出現(xiàn)了交叉的地帶。大數(shù)據(jù)海量的數(shù)據(jù)規(guī)模和全新的數(shù)據(jù)特征使得定量研究與定性研究在資料獲得與分析方法方面逐步走向趨同,這在某種程度上緩解甚至重構(gòu)了定量研究與定性研究間的關(guān)系。

第二,大數(shù)據(jù)背景下的定量分析能夠優(yōu)化變量測量。定量分析方法的一個(gè)重要價(jià)值體現(xiàn)在與大數(shù)據(jù)的結(jié)合。以往利用小數(shù)據(jù)對(duì)變量進(jìn)行定量分析往往是管中窺豹缺乏說服力。在大數(shù)據(jù)驅(qū)動(dòng)下,可以極大范圍地鞏固語料庫,使語料庫的完備程度達(dá)到空前的高度,在這種情況下再進(jìn)行歷時(shí)和共時(shí)兩個(gè)維度的定量分析,使變量得以優(yōu)化,并能產(chǎn)生意想不到的效應(yīng)。

隨著觀測范圍的擴(kuò)大,重新利用定量測量方法對(duì)已有的研究進(jìn)行二次分析,比如某個(gè)研究對(duì)象的變化趨勢、形成的路徑等。雖然對(duì)于傳統(tǒng)研究進(jìn)行用這種方式回爐重造的不多,但是大數(shù)據(jù)背景下的定量分析為人文社科領(lǐng)域的研究提供新的維度。

第三,定量分析能夠使展示方式更加精確、生動(dòng)。面對(duì)海量數(shù)據(jù)構(gòu)成的結(jié)果,不同的人有不同的展示方法,如何簡單有效地展示也是一項(xiàng)務(wù)必要完成的工作。最為常用的是數(shù)據(jù)可視化技術(shù),其實(shí)是知識(shí)的一種再生產(chǎn)方式。研究者用定量分析的得出結(jié)論,以圖形、時(shí)間序列、地圖、流、矩陣、網(wǎng)絡(luò)、層次和信息圖形為基本元素,把要表達(dá)的內(nèi)容進(jìn)行匯集組合,進(jìn)而將較為宏大的理論或觀念簡潔明了地解釋出來。

五、余論

哲學(xué)在古代集中探討“世界是什么”,這種關(guān)于本體論的思考由于缺乏合適的認(rèn)識(shí)工具,跟不上自然科學(xué)的快速發(fā)展,所以哲學(xué)一直沒能夠有長足的進(jìn)步。后來自然科學(xué)找到了自己的科學(xué)語言工具,而哲學(xué)卻缺乏自己獨(dú)特的表述工具因而只能用多義的自然語言,因此,20世紀(jì)初的哲學(xué)家們終于找到了哲學(xué)停步不前的問題癥結(jié)是語言工具問題21世紀(jì)隨著信息技術(shù)的發(fā)展,出現(xiàn)了大數(shù)據(jù)和云計(jì)算,促進(jìn)了自然科學(xué)和人文社會(huì)科學(xué)的融合發(fā)展,傳統(tǒng)研究理念及方法受到巨大的沖擊。

定量分析法雖然在自然科學(xué)領(lǐng)域由來已久,但在語言哲學(xué)研究中尚未啟動(dòng),通過分析得知定量分析法在大數(shù)據(jù)背景下的語言哲學(xué)研究中具有很大潛力。以往的研究表明,語言哲學(xué)家根據(jù)實(shí)際需要有時(shí)會(huì)建立模型和分析數(shù)據(jù),語言哲學(xué)不應(yīng)該被視為一門完全依賴定性方法的學(xué)科。語言哲學(xué)可以從定量方法中獲益,實(shí)驗(yàn)和行為哲學(xué)為此提供了重要的見解。基于語料庫的方法在處理關(guān)于語言的哲學(xué)問題時(shí),可以繞過一些實(shí)驗(yàn)和行為協(xié)議固有的限制,數(shù)學(xué)和計(jì)算模型可以為研究具有哲學(xué)意義的進(jìn)化現(xiàn)象提供一個(gè)有價(jià)值的視角,如涉及語言行為的研究。但當(dāng)涉及到解決這些問題時(shí),應(yīng)該考慮使用定量和定性兼顧的方法。這些考慮不僅對(duì)語言哲學(xué)的方法論產(chǎn)生了影響,而且對(duì)哲學(xué)的其他幾個(gè)分支學(xué)科也會(huì)產(chǎn)生影響。

在移動(dòng)互聯(lián)網(wǎng)、超級(jí)計(jì)算、人工智能、腦科學(xué)等新理論及新技術(shù)大步向前的今天,大數(shù)據(jù)驅(qū)動(dòng)下的語言信息處理也在加速發(fā)展,深刻影響人類社會(huì)經(jīng)濟(jì)形勢和科技進(jìn)步。利用恰當(dāng)?shù)墓ぞ吆头椒ㄈシ治龊A繑?shù)據(jù)資源并從中受益,對(duì)于多學(xué)科多領(lǐng)域的學(xué)者來說充滿了挑戰(zhàn)和機(jī)遇。語言哲學(xué)的研究也將因此發(fā)生數(shù)據(jù)化的變革。

注釋:

①Agerri,R.,et al.Big data for Natural Language Processing:A streaming approach,Knowledge-Based Systems,2015,79(5).

②Iacus S M.,Big Data and Social Science-A Practical Guide to Methods and Tools,Journal of statistical software,2017,78(Book Review 2).

③陳波、江怡:《分析哲學(xué):回顧與反?。ㄉ暇恚罚袊嗣翊髮W(xué)出版社2018年版,第20頁。

④涂子沛:《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》,廣西師范大學(xué)出版社2013年版,第285頁。

⑤杜世洪:《大數(shù)據(jù)時(shí)代的語言哲學(xué)研究——從概念變化到范式轉(zhuǎn)變》,《外語學(xué)刊》2017年第6期。

⑥Liu H T,Lin Y N,University Z,et al,Methodology and Trends of Linguistic Research in the Era of Big Data,Journal of Xinjiang Normal University(Edition of Philosophy and Social Sciences),2018.

⑦Changqing JI,Yu LI,Qiu W,et al,Big Data Processing:Big Challenges And Opportunities,Journal of Interconnection Networks,2012,13.

⑧Weisberg M,Simulation and Similarity:Using Models to Understand the World,Oxford Studies in the Philosophy of Science,2013.

⑨參見Huttegger,S.M.,Skyrms,B.,Smead,R.,Zollman,K.J.,Evolutionary dynamics of Lewis signaling games:Signaling systems vs.partial pooling,Synthese,2010,172(1).

?羅剛、張子憲:《自然語言處理原理與技術(shù)實(shí)現(xiàn)》,電子工業(yè)出版社2016年版,第173~174頁。

?Devitt,M.,Linguistic Intuitions Are Not“The Voice Of Competence”,in Matthew Haug,eds.,Philosophical Methodology:The Armchair or the Laboratory?London:Routledge,2014,p.268.

?Weinberg,J.M.,Nichols,S.,Stich,S.,Normativity and epistemic intuitions,Philosophical Topics,2001,29(1/2).

?Stotz,K.,Griffiths,P.E.,Knight,R.,How biologists conceptualize genes:an empirical study,Studies in History and Philosophy of Science Part C:Studies in History and Philosophy of Biological and Biomedical Sciences,2004,35(4).

?Machery,E.,Mallon,R.,Nichols,S.,Stich,S.P.,Semantics,cross-cultural style,Cognition,2004,92(3).

?Arppe,A.,J?rvikivi,J.,Every method counts:Combining corpus-based and experimental evidence in the study of Synonymy,Corpus Linguistics and Linguistic Theory,2007,3(2).

?Devitt,M.,Testing theories of reference,in J.Haukioja(Ed.),Advances in experimental philosophy of language,London and New York:Bloomsburry,2015,pp.31~63.

?馬克思:《資本論》第1卷,人民出版社2004版,第21~22頁。

?維克托·邁爾-舍恩伯格,肯尼思·庫克耶:《大數(shù)據(jù)時(shí)代:生活,工作與思維的大變革》,盛楊燕,周濤譯,浙江人民出版社2013年版。

?Bresnan,J.,Linguistics:The Garden and the Bush.,Computational Linguistics,2016,42(4).

猜你喜歡
語料庫定量哲學(xué)
顯微定量法鑒別林下山參和園參
菱的哲學(xué)
文苑(2020年6期)2020-06-22 08:41:58
《語料庫翻譯文體學(xué)》評(píng)介
當(dāng)歸和歐當(dāng)歸的定性與定量鑒別
中成藥(2018年12期)2018-12-29 12:25:44
10 種中藥制劑中柴胡的定量測定
中成藥(2017年6期)2017-06-13 07:30:35
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
大健康觀的哲學(xué)思考
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
慢性HBV感染不同狀態(tài)下HBsAg定量的臨床意義
語料庫語言學(xué)未來發(fā)展趨勢
毕节市| 加查县| 黄龙县| 临夏市| 凤冈县| 尚志市| 镇巴县| 永吉县| 沅江市| 隆林| 绥芬河市| 阳信县| 资中县| 邛崃市| 东兰县| 犍为县| 高唐县| 怀宁县| 兴城市| 方城县| 葫芦岛市| 抚宁县| 西和县| 永登县| 马山县| 松江区| 茂名市| 中西区| 珲春市| 运城市| 宜城市| 宝坻区| 泗阳县| 邓州市| 桂平市| 洛隆县| 湟中县| 南和县| 青海省| 东兰县| 海门市|