唐佳梅,何子杰
(廣東外語外貿(mào)大學(xué) 新聞與傳播學(xué)院,廣東 廣州510006)
長期以來,語料庫方法作為語言學(xué)重要方法論之一,豐富了語言學(xué)的研究內(nèi)容,為其提供了新的研究視角。世界上第一個機(jī)讀英語語料庫(布朗語料庫,Brown Corpus)誕生于20世紀(jì)60年代初期的美國布朗大學(xué)。隨后美國和英國學(xué)者分別在70年代建立了美國英語書面語語料庫BROWN(Brown University Standard Corpus of Present—Day American English)和英國英語書面語語料庫LOB(The Lancaster-Oslo/Bergen Corpus of British English)。BROWN 和LOB語料庫的建立有助于將美國英語和英國英語進(jìn)行系統(tǒng)的比較研究[1]。但作為一種研究性工具,語料庫在新聞傳播研究領(lǐng)域出現(xiàn)的時(shí)間較晚。直到20世紀(jì)90年代,有學(xué)者在充分認(rèn)識到互聯(lián)網(wǎng)時(shí)代下的新聞?wù)Z言之后,依據(jù)語言學(xué)理論、統(tǒng)計(jì)學(xué)理論以及新聞學(xué)理論等對新聞類語言進(jìn)行了廣泛研究,并建立新聞類語言語料庫[2]。由此,語料庫方法在新聞傳播研究領(lǐng)域的應(yīng)用逐步開展起來。
在中國知網(wǎng)上搜索“語料庫”,有6 252篇文獻(xiàn),其中大部分集中在外國語言文學(xué)、中國語言文學(xué)以及計(jì)算機(jī)軟件與計(jì)算機(jī)應(yīng)用這三個學(xué)科方面。通過關(guān)鍵詞搜索“語料庫”并選擇“新聞與傳媒學(xué)科”,僅得文獻(xiàn)67篇,表明語料庫研究方法在本學(xué)科的研究基礎(chǔ)薄弱。
喻國明和李慧娟在《大數(shù)據(jù)時(shí)代傳播研究中語料庫分析方法的價(jià)值》中指出:大數(shù)據(jù)思維對當(dāng)下新聞與傳播研究造成強(qiáng)烈的沖擊,傳統(tǒng)的文本分析手段拘泥于有限的文本數(shù)量和定性研究的窠臼,無法滿足大數(shù)據(jù)時(shí)代對內(nèi)容深度和廣度的挖掘需求。在這種情況下,來源于應(yīng)用語言學(xué)的語料庫研究方法對于文本數(shù)據(jù)庫的建立成為一種可能[3]。筆者在上述67篇文獻(xiàn)中,剔除4篇與語料庫研究相關(guān)度不高的文獻(xiàn),將剩余的63篇文獻(xiàn)通過分析歸類,得出以下幾種類型:
第一,語料庫在應(yīng)用傳播研究領(lǐng)域的運(yùn)用。應(yīng)用傳播包括國家形象或城市區(qū)域形象傳播、健康傳播以及公共傳播等。齊佩在研究美國媒體對中國經(jīng)濟(jì)形象的構(gòu)建時(shí),通過選取2008年 9月 18日 至2010年12月 31日期間的美國三大報(bào)紙對中國經(jīng)濟(jì)報(bào)道的文本,自建有關(guān)中國經(jīng)濟(jì)形象的專用語料庫,從關(guān)鍵字索引、搭配和詞簇等方面入手,分析美國各大報(bào)的報(bào)道框架并進(jìn)一步研究外媒報(bào)道框架對中國經(jīng)濟(jì)形象的構(gòu)建及其影響[4]。除了通過媒介報(bào)道來呈現(xiàn)國家或區(qū)域城市形象外,趙凌則通過語料庫工具,挖掘個體傳播和國家形象傳播的互動關(guān)系,另辟蹊徑研究國家形象傳播[5]。
健康傳播是近20-30年來在中國逐漸興起的一項(xiàng)有關(guān)健康的傳播學(xué)科,但運(yùn)用語料庫作為健康傳播研究工具的文獻(xiàn)匱乏。中國知網(wǎng)論文數(shù)據(jù)庫僅有3篇健康傳播的文獻(xiàn)與語料庫有關(guān)聯(lián)性,且研究對象集中在太極拳以及中醫(yī)藥兩個方面。這三篇文獻(xiàn)通過運(yùn)用語料庫相關(guān)功能來分析太極拳和中醫(yī)藥在國外的傳播現(xiàn)狀及特點(diǎn),進(jìn)而得出我國該如何運(yùn)用民族文化精髓來提高對外傳播能力的結(jié)論。
公共傳播的研究主要涉及民生問題、公共基礎(chǔ)建設(shè)以及公益事業(yè)等。廖衛(wèi)民在“浙江省民生新聞傳播與社會幸福感評估”這一課題研究中就引入語料庫研究方法,從新視角(即媒體對民生新聞的報(bào)道反映人民的幸福指數(shù))切入分析[6]。該研究以《杭州日報(bào)》民生新聞報(bào)道作為語料庫來源,利用頻率詞分析媒介報(bào)道文本的呈現(xiàn)與人民幸福感的關(guān)系,指出民生新聞的不足與缺陷。谷羽在其博士論文《微博客平臺的企業(yè)公益?zhèn)鞑ァ分刑岬剑哼\(yùn)用語料庫分析軟件的統(tǒng)計(jì)功能對具體詞語的使用頻率,詞語搭配結(jié)構(gòu)等語言學(xué)特征進(jìn)行統(tǒng)計(jì),以此為基礎(chǔ)運(yùn)用詮釋型內(nèi)容分析法,通過精讀、理解并解釋文本內(nèi)容,從整體和更高層次上把握文本內(nèi)容的復(fù)雜背景和思想結(jié)構(gòu)[7]。由此可見,在新聞傳播學(xué)領(lǐng)域,語料庫作為一種具有定性研究方法特點(diǎn)的工具,其重要性越來越顯著。
第二,語料庫在新聞理論和實(shí)踐研究領(lǐng)域的應(yīng)用。新聞理論與新聞實(shí)踐隨著社會發(fā)展而不斷發(fā)展,但研究方法卻沒有取得突破性的創(chuàng)新。同質(zhì)化、低水平的研究泛濫,嚴(yán)重阻礙新聞與傳播學(xué)科的發(fā)展,而語料庫作為應(yīng)用語言學(xué)的研究工具,與新聞學(xué)研究中的內(nèi)容分析法有異曲同工之處。
值得一提的是,在基于語料庫對新聞理論和實(shí)踐研究的文獻(xiàn)中,多數(shù)研究者以外國語言學(xué)相關(guān)背景為主,運(yùn)用語料庫方法對外媒報(bào)道中國的文本進(jìn)行研究,進(jìn)而得出相關(guān)結(jié)論。當(dāng)然,也有少數(shù)新聞傳播領(lǐng)域里的學(xué)者在研究新聞實(shí)務(wù)的過程中引入語料庫研究方法,如喻國明運(yùn)用語料庫主題詞檢索的分析方法,預(yù)測互聯(lián)網(wǎng)時(shí)代數(shù)字報(bào)紙的發(fā)展前景及人民對其發(fā)展的信心度[8]。體育新聞寫作研究中也逐漸呈現(xiàn)引入語料庫這一研究工具的趨勢。鄭麗杰在分析網(wǎng)絡(luò)體育新聞標(biāo)題時(shí)指出:基于語料庫的體育新聞標(biāo)題研究能夠運(yùn)用計(jì)算機(jī)技術(shù)對大量文本進(jìn)行定量統(tǒng)計(jì)和定性描述,讓語言分析朝著更加縱深的方向發(fā)展[1]。該研究通過統(tǒng)計(jì)標(biāo)題中出現(xiàn)的主題詞頻率以及主題詞的搭配方式等,全面系統(tǒng)地剖析標(biāo)題的感情色彩以及標(biāo)題結(jié)構(gòu),為網(wǎng)絡(luò)標(biāo)題寫作研究提供理論層面的支撐。
第三,基于語料庫的輿論輿情研究?;ヂ?lián)網(wǎng)的廣泛使用促使輿情的不斷變化,大數(shù)據(jù)時(shí)代對輿情的研究不斷增長,語料庫方法作為一種能夠大規(guī)模運(yùn)作、分析以及統(tǒng)計(jì)文本詞條的研究方法,無疑與輿情研究有著天然的契合點(diǎn)。喻國明就語料庫對輿論研究的作用指出:通過語料庫研究方法可以檢測輿情的動態(tài)情況以及輿論熱詞的分析處理,通過建立相關(guān)的數(shù)據(jù)庫可以更好發(fā)現(xiàn)和建立輿論應(yīng)對模型,以預(yù)防和應(yīng)對輿論的發(fā)生。在一項(xiàng)對2011-2013年全國兩會輿情中心詞和關(guān)聯(lián)詞的分析中,他將語料庫和大數(shù)據(jù)選擇的研究方法相結(jié)合,將輿論熱詞切分成兩個維度進(jìn)行探索,為輿情研究提供了一種新思路[3]。
20世紀(jì)90年代,國外學(xué)者開始運(yùn)用語料庫對新聞實(shí)踐展開研究,其中路透社語料庫(Reuters Corpus)(第1版)在2000年已開發(fā)完成,收錄了路透社從1996年8月20日至1997年8月19日發(fā)布的新聞?wù)Z篇樣本 806 791篇,詞匯量達(dá)2億次[2],為英國通訊社語言的研究提供了重要的參考作用。此外,國外對語料庫的使用不局限于根據(jù)不同研究目的建立不同語料庫,而且對語料庫的實(shí)踐運(yùn)用,在方法論要求上具有不同特點(diǎn)。
第一,基于語料庫的研究對象廣泛。其一,在新聞報(bào)道文本的研究上,學(xué)者根據(jù)不同的研究目的而使用語料庫方法從不同方面對文本進(jìn)行解構(gòu),最終發(fā)現(xiàn)某種共性,進(jìn)而得出相應(yīng)的結(jié)論。這類研究以英國曼徹斯特大學(xué)學(xué)者Kyung Hye Kim關(guān)于美國媒體對韓國的報(bào)道研究為代表,通過研究新聞文本的詞頻、詞語感情色彩以及報(bào)道框架來分析媒體報(bào)道的相關(guān)特點(diǎn)[9]。這類研究以應(yīng)用型研究為主,通過探索研究對象在媒體上的呈現(xiàn)來評價(jià)其實(shí)際作用、傳播策略或傳播效果等。其二,對政府或企業(yè)的報(bào)告文本進(jìn)行研究。社會的激烈競爭使得人們越來越重視發(fā)展戰(zhàn)略的研究,語料庫作為一種文本分析工具也被大量引入到相關(guān)公文和報(bào)告的研究中。加拿大學(xué)者Francis Cornut等人就政府公共部門在發(fā)展戰(zhàn)略上的相關(guān)公文進(jìn)行了一系列研究,運(yùn)用語料庫分析方法對相關(guān)文本的類型、戰(zhàn)略關(guān)鍵詞的頻率以及戰(zhàn)略目標(biāo)的特點(diǎn)來進(jìn)行分析并評估預(yù)期的效果[10]。也有學(xué)者運(yùn)用語料庫研究方法通過企業(yè)發(fā)展報(bào)告來研究其商業(yè)傳播價(jià)值,如學(xué)者Brian A和Rutherford關(guān)于企業(yè)年度報(bào)告的體裁分析,等等。不管是政府或者是企業(yè),對這些文本的研究目的大多數(shù)在于完善傳播戰(zhàn)略,更好地促進(jìn)發(fā)展并進(jìn)行前景預(yù)測。其三,運(yùn)用語料庫方法分析特定語境下短信息以及書面話語的作用及特點(diǎn)。1999年至2017年的國外文獻(xiàn)中,關(guān)于語料庫在新聞傳播領(lǐng)域的研究對象呈現(xiàn)從文本—語段—詞條的趨勢,研究發(fā)展趨勢不局限于書面文本,維系人們?nèi)粘I畹目谡Z以及短信息逐漸進(jìn)入學(xué)者的視野當(dāng)中。學(xué)者Brian P.Jenssen等在網(wǎng)絡(luò)時(shí)代對青少年影響的一項(xiàng)研究中,采用SNS網(wǎng)頁留言板的記錄作為語料基礎(chǔ)。SNS網(wǎng)站是一個以青少年為目標(biāo)受眾的網(wǎng)絡(luò)社區(qū),青少年可在該社區(qū)上分享信息以及互動對話。研究者通過收集346名參與者瀏覽網(wǎng)站并互動所產(chǎn)生的147 432個單詞作為文本語料庫,以詞頻和關(guān)鍵詞關(guān)聯(lián)的方法來研究該網(wǎng)絡(luò)社區(qū)對青少年的影響[11]。
綜合國外對語料庫的使用情況來看,研究對象從以往的長篇文本逐漸發(fā)展到對某個核心詞的分析,研究不斷深入。在研究成果方面,國外的語料庫一般偏向應(yīng)用研究,通過對某一對象存在的問題進(jìn)行分析,發(fā)現(xiàn)問題的本質(zhì)并提出建議或者預(yù)測發(fā)展前景。
第二,將語料庫方法和批評性話語分析理論相結(jié)合。批評性話語分析通過分析言語特征及其生成的文化背景來挖掘出隱含于語言中的意識形態(tài),進(jìn)而揭示語言、權(quán)力以及意識形態(tài)之間的復(fù)雜關(guān)系。換而言之,批評性話語的基礎(chǔ)是文本,對文本的篩選、統(tǒng)計(jì)、解析和驗(yàn)證是批評性話語分析法的第一步。語料庫方法與批評性話語分析相結(jié)合的運(yùn)用使研究得出的數(shù)據(jù)和結(jié)論更為客觀、權(quán)威更具有深度。除了與批評性話語分析理論相結(jié)合外,國外的研究也開始嘗試將語料庫研究方法與其他分析理論結(jié)合起來,如馬丁的“評價(jià)理論”等。
從語料庫方法在國內(nèi)外新聞傳播領(lǐng)域內(nèi)的應(yīng)用來看,作為語言學(xué)的一種重要研究工具,語料庫已逐漸進(jìn)入新聞傳播的研究視野,拓寬了該領(lǐng)域的研究范圍創(chuàng)新了研究方法,但在使用語料庫作為研究方法和研究工具上仍存在一些局限。
一是國內(nèi)相關(guān)研究主要把語料庫作為大數(shù)據(jù)時(shí)代下一個大規(guī)模的文本分析工具,作為一個抓取關(guān)鍵詞以及頻率詞的統(tǒng)計(jì)工具,卻在詞匯詞性、短語結(jié)構(gòu)、詞語背后的感情色彩、詞語的隱喻等方面涉及較少。國內(nèi)新聞傳播學(xué)領(lǐng)域里仍有為使用語料庫研究而研究的現(xiàn)象,未能把語料庫研究方法與本學(xué)科的方法與理論相契合,因此,今后亟需深挖語料庫功能,對其應(yīng)用方法方式進(jìn)行突破創(chuàng)新。
二是有關(guān)新聞傳播領(lǐng)域大規(guī)模、權(quán)威型語料庫需要不斷構(gòu)建。我國第一個大型的基于新聞的現(xiàn)代漢語標(biāo)注語料庫是由北京大學(xué)計(jì)算語言學(xué)研究所和日本富士通公司合作完成的《人民日報(bào)》標(biāo)注語料庫[2]。相比國外的語料庫建設(shè),我國在新聞傳播學(xué)領(lǐng)域創(chuàng)建語料庫的時(shí)間較晚,選擇樣本的歷時(shí)較短。當(dāng)前運(yùn)用語料庫分析方法的前提是自行建立研究對象相關(guān)的語料庫,缺乏可以參照和對比的同類型權(quán)威語料庫,分析結(jié)果也局限于研究者自身抽樣的范圍,缺乏一個更系統(tǒng)規(guī)范的檢驗(yàn)標(biāo)準(zhǔn)。此外,在相關(guān)抽樣過程中的主觀性也是影響最終分析結(jié)果的一個重要因素,如何為自建語料庫抽樣提供更加客觀完善的標(biāo)準(zhǔn)?值得我們繼續(xù)思考。
三是在新聞傳播學(xué)領(lǐng)域內(nèi),語料庫的語料基礎(chǔ)比語言學(xué)領(lǐng)域更薄弱。對新聞傳播研究自建相關(guān)的語料庫,一般是選取一家或者幾家報(bào)紙的報(bào)道文本來作為樣本容量,雖然符合語料庫研究樣本數(shù)量的規(guī)定,但是由于新聞報(bào)道的偏向性。因此,報(bào)紙的立場或研究者自身的經(jīng)驗(yàn)等因素也會影響文本詞匯的使用,而且抽取的樣本歷時(shí)性局限也難以系統(tǒng)而全面地分析文本,得出的結(jié)果只能是某個階段的發(fā)現(xiàn),難以形成一個完整的研究體系。
本文對語料庫方法在國內(nèi)外新聞傳播研究領(lǐng)域中的應(yīng)用進(jìn)行了初步探索。通過對國內(nèi)和國外的相關(guān)應(yīng)用情況進(jìn)行分析和歸納總結(jié),發(fā)現(xiàn)語料庫作為研究工具在國內(nèi)國外新聞傳播領(lǐng)域的應(yīng)用中存在差異。大數(shù)據(jù)時(shí)代下,傳統(tǒng)定性定量研究方法已難以滿足新聞傳播學(xué)發(fā)展的需求,語料庫方法的應(yīng)用為該領(lǐng)域提供了一種全新的跨學(xué)科研究方法及路徑。國內(nèi)外的相關(guān)研究顯示語料庫方法在新聞傳播領(lǐng)域里未能充分發(fā)揮其應(yīng)有的作用,研究程度還不夠深入。進(jìn)一步探索語料庫的相關(guān)功能,構(gòu)建更多的新聞傳播類語料庫,拓寬其在新聞傳播研究領(lǐng)域內(nèi)的應(yīng)用范圍,結(jié)合語言學(xué)的視野進(jìn)行跨學(xué)科的研究,將是今后研究中亟待解決的問題。
[1]鄭麗杰.基于語料庫的網(wǎng)絡(luò)體育新聞標(biāo)題研究[D].北京:北京體育大學(xué),2009.
[2]黃艷軍.基于語料庫的國內(nèi)外主要新聞?wù)Z料庫綜述[J].讀與寫,2011(5):89-90.
[3]喻國明,李慧娟.大數(shù)據(jù)時(shí)代傳播研究中語料庫分析方法的價(jià)值[J].傳媒,2014(2):64-65.
[4]齊佩.從關(guān)系過程看美國大報(bào)中的中國經(jīng)濟(jì)形象[D].石家莊:河北師范大學(xué),2011.
[5]趙凌.個體傳播與國家形象傳播互動路徑探究——以姚明個體傳播為個案[J].當(dāng)代傳播.2012(6):49-52.
[6]廖衛(wèi)民.民生新聞傳播與社會幸福感評估——基于浙江省媒體語料庫的實(shí)證分析[J].當(dāng)代傳播,2012(3):21-25.
[7]谷羽.微博客平臺的企業(yè)公益?zhèn)鞑ィ跠].武漢:華中科技大學(xué),2013.
[8]喻國明,李慧娟.從“付費(fèi)門”到“付費(fèi)墻 2.0”:數(shù)字報(bào)紙盈利模式的景氣度研究[J].當(dāng)代傳播,2014(4):21-22.
[9]Kyung H K.Examining US news media discourses about North Korea:A corpus-based critical discourse analysis [J].Discourse&Society,2014(2):221-223.
[10]Francis C,Hélène G,Ann L.The strategic plan as a genre[J].Discourse&Communication,2012(1):21-24.
[11]Yoshiko O.A case study of US deaf teens’ text messaging:Their innovations and adoption of textisms[J].New Media&Society,2013(8):1224-1240.