張霄軍,周靜獅
(1. 西交利物浦大學(xué) 人文社科學(xué)院,江蘇 蘇州 215123;2. 廣東省安全智能新技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518055;3. 西交利物浦大學(xué) 智能工程學(xué)院,江蘇 蘇州 215123)
論辯挖掘(Argument Mining)的主要任務(wù)是從非結(jié)構(gòu)化文本文檔中自動(dòng)檢測(cè)、分類和提取論點(diǎn),以便為機(jī)器學(xué)習(xí)及深度學(xué)習(xí)模型提供結(jié)構(gòu)化數(shù)據(jù)[1]。它是計(jì)算論辯中一個(gè)重要的任務(wù),而計(jì)算論辯作為情感計(jì)算的子任務(wù), 在自然語(yǔ)言處理諸多下游任務(wù)中越來(lái)越受到重視。這是因?yàn)檎撧q挖掘以創(chuàng)新的方式處理來(lái)自網(wǎng)絡(luò)的信息,特別是來(lái)自社交媒體的信息,具有潛力非凡的應(yīng)用價(jià)值。論辯挖掘系統(tǒng)可以對(duì)專業(yè)報(bào)紙文章、政府報(bào)告、法庭判決記錄、在線社交網(wǎng)絡(luò)內(nèi)容中的論點(diǎn)、決策、評(píng)論等進(jìn)行大量的定性分析,為社會(huì)和政治科學(xué)領(lǐng)域的決策者和研究人員提供前所未有的自動(dòng)化工具,為企業(yè)市場(chǎng)營(yíng)銷創(chuàng)造新的前景。在林林總總的論辯挖掘應(yīng)用場(chǎng)景中,政治論辯挖掘關(guān)注的是政治話語(yǔ)和評(píng)論,但政治話語(yǔ)不同于法庭記錄和用戶評(píng)價(jià)的“直接”陳述事實(shí)、表述訴求或者發(fā)表褒貶,而是充斥著外交辭令、政治表達(dá)和演講修辭。這對(duì)論辯挖掘任務(wù)而言是一個(gè)挑戰(zhàn)——系統(tǒng)得兼顧語(yǔ)用(Pragmatics)而非單純語(yǔ)義(Semantics)去理解政治話語(yǔ)。
受制于訓(xùn)練語(yǔ)料資源稀缺,論辯挖掘在中文政治領(lǐng)域的實(shí)驗(yàn)研究仍屬于空白地帶。外交作為政治的窗口,外交文本中的外交辭令、外事問(wèn)答以及外宣公告都蘊(yùn)含著豐富而微妙的政治論辯技巧,在外交領(lǐng)域開(kāi)展政治論辯挖掘研究具有現(xiàn)實(shí)意義和應(yīng)用價(jià)值。“多語(yǔ)外交對(duì)話語(yǔ)料庫(kù)”是一個(gè)在建的基于中國(guó)外交部例行記者招待會(huì)和外交部新聞發(fā)言人表態(tài)和電話答問(wèn)的中外多語(yǔ)轉(zhuǎn)錄文本的多語(yǔ)問(wèn)答語(yǔ)料庫(kù),其例行記者招待會(huì)和新聞發(fā)言人電話答問(wèn)實(shí)錄文本是構(gòu)建對(duì)話式中文政治論辯挖掘任務(wù)數(shù)據(jù)集的理想數(shù)據(jù)來(lái)源,其新聞發(fā)言人表態(tài)文本則是構(gòu)建單篇式中文政治論辯挖掘任務(wù)數(shù)據(jù)集的理想數(shù)據(jù)來(lái)源。鑒于不同語(yǔ)言在表達(dá)政治觀點(diǎn)時(shí)的語(yǔ)用方式不同,如中文表達(dá)相對(duì)委婉謹(jǐn)慎,而英文表達(dá)相對(duì)直接大膽,雙語(yǔ)平行政治論辯語(yǔ)料將會(huì)有助于系統(tǒng)更好地理解原文,因此該語(yǔ)料庫(kù)又可以從跨語(yǔ)言論辯挖掘的角度提供新的中文政治論辯挖掘任務(wù)及數(shù)據(jù)集。
根據(jù)石岳峰等[2]的綜述,目前用于政治論辯的論辯挖掘任務(wù)數(shù)據(jù)集主要有三個(gè): USElecDeb60To16[3]、the UK 2015 Political Election Corpus[4]和The American Presidency Project[5]。也有研究者[6-8]自建小規(guī)模論辯語(yǔ)料庫(kù)從不同視角設(shè)計(jì)不同論辯挖掘任務(wù)進(jìn)行研究。
USElecDeb60To16數(shù)據(jù)來(lái)源為美國(guó)總統(tǒng)競(jìng)選辯論委員會(huì)網(wǎng)站(Commission on Presidential Debates(1)https://www.debates.org/,目前該網(wǎng)站數(shù)據(jù)已經(jīng)更新至2020年特朗普與拜登總統(tǒng)競(jìng)選辯論會(huì)。),包含自1960年肯尼迪與尼克松總統(tǒng)競(jìng)選辯論會(huì)至2016年克林頓與特朗普總統(tǒng)競(jìng)選辯論會(huì)全文轉(zhuǎn)寫,以及副總統(tǒng)競(jìng)選全文轉(zhuǎn)寫, 共計(jì)39篇轉(zhuǎn)寫文本。Haddadan等人[3]將其切分為6 601個(gè)話輪(Speech Turns)共計(jì)34 013個(gè)句子和676 227個(gè)詞例。人工標(biāo)注兩種論辯成分——“主張(Claims)”和“舉證(Premises)”,其中,標(biāo)注主張16 087項(xiàng),標(biāo)注舉證13 434項(xiàng),共計(jì)29 521項(xiàng)。他們將這些標(biāo)注好論辯成分的句子分成三個(gè)數(shù)據(jù)集: 訓(xùn)練集(含13 894個(gè)論辯標(biāo)記)、驗(yàn)證集(含6 577個(gè)論辯標(biāo)記)和測(cè)試集(含9 050個(gè)論辯標(biāo)記),設(shè)計(jì)了兩個(gè)分類的論辯挖掘任務(wù): 論辯句檢測(cè)和論辯成分識(shí)別。
Lippi和Torroni[4]選擇英國(guó)星空新聞?lì)l道(Sky News)2015年4月2日7位英國(guó)首相候選人的論辯節(jié)目,截取其中三位候選人(卡梅倫、克萊格和米利班德)的386個(gè)視頻片段(卡梅倫122段視頻、克萊格104段視頻、米利班德160段視頻)并將其轉(zhuǎn)寫為實(shí)錄文本,轉(zhuǎn)寫文本共9 666個(gè)詞例(卡梅倫3 469詞、克萊格2 849詞、米利班德3 348詞)。人工只標(biāo)注視頻片段是否包含主張,設(shè)計(jì)的論辯任務(wù)也只涉及待檢測(cè)論辯句是否包含主張。
Menini等人[5]的數(shù)據(jù)也是美國(guó)總統(tǒng)競(jìng)選辯論,但只選取1960年肯尼迪和尼克松的競(jìng)選辯論文本。數(shù)據(jù)集來(lái)源并非美國(guó)總統(tǒng)競(jìng)選辯論委員會(huì)網(wǎng)站,而是美國(guó)總統(tǒng)競(jìng)選項(xiàng)目(The American Presidency Project(2)https://www.presidency.ucsb.edu/)。該項(xiàng)目不僅收集歷屆美國(guó)總統(tǒng)的競(jìng)選辯論文本,還收集任何與總統(tǒng)競(jìng)選相關(guān)的可公開(kāi)獲取的政治文本,如白宮新聞中心發(fā)布的聲明、記者招待會(huì)實(shí)錄等文本。因此該數(shù)據(jù)集包含881篇文本逾160萬(wàn)詞例(肯尼迪約81.5萬(wàn)詞例、尼克松約83萬(wàn)詞例)。根據(jù)美國(guó)史專家的建議,他們將這些文本分為五個(gè)主題,“古巴(Cuba)”“裁軍(Disarmament)”“醫(yī)療健康(Health-Care)”“最低工資(Minimum Wage)”和“失業(yè)(Unemployment)”,抽取各個(gè)主題文本中的論辯對(duì)共計(jì)19 888對(duì)(“古巴”4 229對(duì)、“裁軍”2 508對(duì)、“醫(yī)療健康”3 945對(duì)、“最低工資”6 341對(duì)、“失業(yè)”2 865對(duì))。從中隨機(jī)抽取1 907組論辯對(duì),人工標(biāo)注每組論辯對(duì)的關(guān)系(“支持(Support)”“反對(duì)(Attack)”和“無(wú)關(guān)(No relation)”),論辯挖掘任務(wù)設(shè)定為論辯關(guān)系預(yù)測(cè)。
Duthie和Budzynska[6]的數(shù)據(jù)集來(lái)源于英國(guó)議會(huì)會(huì)議事錄(UK Hansard(3)http://hansard.millbanksystems.com/),他們抽取了撒切爾夫人主政時(shí)期(1979—1990)的90篇實(shí)錄文本,每篇文本均由一位英國(guó)議會(huì)議員發(fā)問(wèn)開(kāi)頭,然后是某位大臣的回答,接下來(lái)進(jìn)入辯論環(huán)節(jié)。論辯挖掘任務(wù)主要針對(duì)“聽(tīng)眾喜好判斷(Ethos Mining)”,即聽(tīng)眾對(duì)說(shuō)話者有一個(gè)先驗(yàn)的認(rèn)知,如果聽(tīng)眾認(rèn)為說(shuō)話人是個(gè)“好人”,那對(duì)說(shuō)話人的觀點(diǎn)會(huì)積極回應(yīng)并支持,反之,如果聽(tīng)眾認(rèn)為說(shuō)話人是個(gè)“壞人”, 那他對(duì)說(shuō)話人的觀點(diǎn)會(huì)進(jìn)行攻擊[7]。“聽(tīng)眾喜好判斷”就是根據(jù)聽(tīng)眾對(duì)說(shuō)話人的回應(yīng)表達(dá)(Ethotic Sentiment Expression, ESE)來(lái)預(yù)測(cè)該聽(tīng)眾對(duì)說(shuō)話人的觀點(diǎn)是支持還是反對(duì)。語(yǔ)料標(biāo)注內(nèi)容包括“說(shuō)話者(Speaker)”“目標(biāo)(Target)(4)即ESE所指的內(nèi)容或者觀點(diǎn)?!薄跋埠弥С?Ethotic Support, +ESE)”“喜好反對(duì)(Ethotic Attack,-ESE)”。他們選取60篇文本做訓(xùn)練集,剩余30篇文本做測(cè)試集。數(shù)據(jù)集共標(biāo)注638句ESE(反對(duì)的有469句,支持的有169句),涉及149位說(shuō)話者和188項(xiàng)ESE所指觀點(diǎn),共計(jì)90 991詞例。
Cano-Basave和He[8]將說(shuō)服性論辯(Persuasive Argumentation)識(shí)別應(yīng)用于政治論辯。該研究用到了兩種語(yǔ)料: 說(shuō)服性文本語(yǔ)料(Persuasive Essays, PE)和政治辯論語(yǔ)料(Political Debates, PD),前者用到了說(shuō)服性文本語(yǔ)料庫(kù)[9],后者用到了美國(guó)總統(tǒng)競(jìng)選項(xiàng)目語(yǔ)料庫(kù)。說(shuō)服性文本論辯識(shí)別任務(wù)數(shù)據(jù)集標(biāo)注項(xiàng)包括“主張(Claim)”“舉證(Premise)”“正向論辯(ForStance)”“負(fù)向論辯(AgainstStance)”“支持(SupportRel.)”和“反對(duì)(AttackRel.)”。他們應(yīng)用“語(yǔ)義框架網(wǎng)絡(luò)(FrameNet(5)https://framenet.icsi.berkeley.edu/fndrupal/)”來(lái)解析從兩個(gè)語(yǔ)料庫(kù)中選擇的90篇說(shuō)服性文本和20篇政治論辯文本的所有句子,得到每個(gè)句子各個(gè)成分的語(yǔ)義框架并將其投射到數(shù)據(jù)集各個(gè)標(biāo)注項(xiàng)。
Visser等人[10]選擇了美國(guó)總統(tǒng)競(jìng)選項(xiàng)目中有關(guān)2016年希拉里·克林頓和特朗普之間的電視論辯視頻內(nèi)容,包括期間共和黨、民主黨以及總統(tǒng)候選人之間的各種論辯視頻及其轉(zhuǎn)寫文本。他們也將短視頻平臺(tái)Reddit(6)https://www.reddit.com上那段時(shí)間發(fā)布的競(jìng)選短視頻評(píng)論文本納入其語(yǔ)料庫(kù)the US2016 Corpus中。這樣,整個(gè)語(yǔ)料庫(kù)就是由US2016tv和US2016reddit兩部分語(yǔ)料構(gòu)成,每一部分包括共和黨語(yǔ)料US2016R1(分為US2016R1tv和US2016R1reddit)、民主黨語(yǔ)料US2016D1(分為US2016D1tv和US2016D1reddit)和候選人語(yǔ)料US2016G1(分為US2016G1tv和US2016G1reddit),其中字母R、D和G分別指代“共和黨(the Republican primaries)”“民主黨(the Democratic primaries)”和“候選人(the General election)”,數(shù)字“1”指的是只收集了以上三種辯論的第一輪辯論內(nèi)容。該語(yǔ)料庫(kù)及其子語(yǔ)料庫(kù)均發(fā)布在AIFdb語(yǔ)料庫(kù)網(wǎng)站(7)www.corpora.aifdb.org[11]上,可以公開(kāi)獲取。整個(gè)語(yǔ)料庫(kù)共計(jì)97 999詞例(其中電視競(jìng)選辯論58 900詞例、短視頻評(píng)論文本39 099詞例)。在論辯內(nèi)容標(biāo)注上,他們選擇10.5%的電視競(jìng)選辯論文本和10%的短視頻評(píng)論文本作為標(biāo)注樣本,標(biāo)注項(xiàng)包括: “論辯單元(Locution)”“話輪轉(zhuǎn)換(Transition)”“言語(yǔ)行為(Illocution)”“觀點(diǎn)主張(Proposition)” “接受(Inferences)”“沖突(Conflicts)”和“重述(Rephrase)”。每項(xiàng)標(biāo)注均由5位標(biāo)注者在論辯標(biāo)注平臺(tái)OVA(8)www.ova.arg.tech上獨(dú)立完成,最后達(dá)成一致,最終在標(biāo)注樣本中產(chǎn)生了8 099個(gè)“觀點(diǎn)主張”標(biāo)記、2 754個(gè)“接受”標(biāo)記、823個(gè)“沖突”標(biāo)記和620個(gè)“重述”標(biāo)記。他們并未設(shè)定特定的論辯挖掘任務(wù),但是說(shuō)明了該數(shù)據(jù)集的潛在應(yīng)用場(chǎng)景,如為深度學(xué)習(xí)在論辯挖掘中的應(yīng)用提供資源、為實(shí)證的文本分析研究提供量化數(shù)據(jù)等。
Guo等人[12]的工作雖然并不是直接的論辯挖掘,但他們所使用的語(yǔ)料庫(kù)是解密的外交文本,是將政治論辯具體化為外交論點(diǎn)挖掘的有用資源。他們的工作是利用美國(guó)國(guó)家檔案局(The U.S. National Archives)解密的1973—1977年間外交文檔來(lái)完成外交事件抽取和預(yù)測(cè)。這些文檔每篇都有一個(gè)主題編碼(TAGS),如MNUC指的是“軍事與國(guó)防事務(wù)-核武器使用(Military and Defense Affairs-Military Nuclear Applications)”,VS指的是“南越(Vietnam (South))”等。這些主題編碼方便文檔按照主題分類,Menini等人[5]的政治論辯挖掘任務(wù)就是基于主題分類進(jìn)行的。
以上是對(duì)目前政治論辯挖掘領(lǐng)域所使用的數(shù)據(jù)集的一個(gè)綜述,可以看出來(lái),這些數(shù)據(jù)集和語(yǔ)料都是英語(yǔ)單語(yǔ)的,尚沒(méi)有發(fā)現(xiàn)其他語(yǔ)言的政治論辯挖掘任務(wù)中可以利用的數(shù)據(jù)資源,跨語(yǔ)言政治論辯挖掘研究也屬于學(xué)術(shù)空白。
“外交對(duì)話多語(yǔ)語(yǔ)料庫(kù)”建設(shè)的初衷其實(shí)并不是為了政治論辯挖掘任務(wù),而是為了面向國(guó)際關(guān)系研究、外交語(yǔ)言研究、外事翻譯研究以及對(duì)話機(jī)器翻譯研究的多語(yǔ)平行語(yǔ)料庫(kù)。在建設(shè)過(guò)程中,筆者越來(lái)越感覺(jué)到外交內(nèi)容挖掘的重要性,并論證了將該語(yǔ)料庫(kù)應(yīng)用于中文外交(政治)論辯挖掘任務(wù)的可行性,提出在該語(yǔ)料庫(kù)基礎(chǔ)上標(biāo)注中文政治論辯挖掘任務(wù)數(shù)據(jù)集的想法。
我國(guó)外交部自2011年起就將例行記者招待會(huì)實(shí)錄文本及其外文翻譯分別公開(kāi)發(fā)布在外交部中外文網(wǎng)站上。截至2022年10月1日,已有2 739篇中文、英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、阿拉伯語(yǔ)和俄語(yǔ)的例行記者招待會(huì)平行實(shí)錄文本公開(kāi)發(fā)布。數(shù)據(jù)規(guī)模相當(dāng)大,目前中文文本達(dá)到957萬(wàn)漢字,英語(yǔ)文本已經(jīng)達(dá)到627萬(wàn)英語(yǔ)詞例,法語(yǔ)文本達(dá)到793萬(wàn)詞例,西班牙語(yǔ)文本達(dá)到810萬(wàn)詞例,阿拉伯語(yǔ)文本和俄語(yǔ)文本規(guī)模也都在500萬(wàn)詞例以上。此外,外交部就某個(gè)特定外交事件的發(fā)言人表態(tài)和就某個(gè)重大外交事件的中外媒體吹風(fēng)會(huì)等實(shí)錄文本及其外文翻譯文本也在外交部網(wǎng)站公開(kāi)發(fā)布,語(yǔ)料庫(kù)數(shù)據(jù)規(guī)模仍在不斷增加。外文翻譯均由外交部翻譯司專業(yè)譯員完成,翻譯質(zhì)量可以保證,因此,這個(gè)語(yǔ)料庫(kù)首先是一個(gè)質(zhì)量上乘的大規(guī)模多語(yǔ)平行語(yǔ)料庫(kù),可以直接應(yīng)用于外事翻譯研究和面向特定領(lǐng)域的多語(yǔ)種機(jī)器翻譯使用。其次,外交部例行記者招待會(huì)充滿唇槍舌戰(zhàn),沒(méi)有充分的準(zhǔn)備和高超的話語(yǔ)技巧是很難勝任外交部發(fā)言人這個(gè)職位的,因此,該語(yǔ)料庫(kù)又是一個(gè)研究外交語(yǔ)言和外交話語(yǔ)策略的有力資源。還有,問(wèn)答內(nèi)容都是有關(guān)我國(guó)外交事務(wù)的,從彼此的一問(wèn)一答之中,可以窺見(jiàn)我國(guó)在地緣政治、國(guó)際沖突、國(guó)內(nèi)矛盾以及國(guó)際合作等事件中的態(tài)度和立場(chǎng),是研究國(guó)際關(guān)系的第一手素材。
記者招待會(huì)都是以問(wèn)答的形式進(jìn)行,即“記者提問(wèn)+新聞發(fā)言人回答”的模式,有時(shí)會(huì)有記者的追問(wèn),新聞發(fā)言人一般會(huì)有補(bǔ)充回答,總之,都是一問(wèn)一答。一般來(lái)說(shuō),一個(gè)問(wèn)答可以視為一個(gè)話輪,因?yàn)橄乱粋€(gè)問(wèn)答的內(nèi)容就是另外一個(gè)對(duì)話主題了,所以話輪分界比較明顯。目前,對(duì)于話輪主題的標(biāo)記集已經(jīng)制定完成,由“國(guó)際沖突(IC, International Conflict)”“國(guó)際合作(GC, Global Cooperation)”“地緣政治(GP, Geopolitics)”“國(guó)內(nèi)矛盾(DC, Domestic Contradiction)”“體育文化(PC, PE and Culture)”“民生經(jīng)濟(jì)(CE, Civilian Economy)”五個(gè)標(biāo)記集構(gòu)成,每個(gè)標(biāo)記集下面有若干子集,每個(gè)主題類型都賦予一個(gè)獨(dú)一無(wú)二的標(biāo)記。話輪的其余元語(yǔ)言標(biāo)記(問(wèn)答日期、提問(wèn)者、回答者等)均已標(biāo)注完成,話輪切分也已全部完成,其中中文文本共切分為22 344個(gè)話輪。
由于我國(guó)和英美國(guó)家的政治體制不同,在中文政治論辯挖掘領(lǐng)域沒(méi)有可以應(yīng)用的辯論文本,所以中文政治論辯挖掘研究尚沒(méi)有公開(kāi)發(fā)表的研究成果。盡管外交部例行記者招待會(huì)上的問(wèn)答實(shí)錄不能完全體現(xiàn)中文政治論辯的全部特征,但外交智慧就體現(xiàn)在一問(wèn)一答之間,外交立場(chǎng)就建立在唇槍舌戰(zhàn)之中,政治態(tài)度就蘊(yùn)含在每個(gè)話輪之中?;谶@樣的語(yǔ)料庫(kù),我們可以設(shè)計(jì)獨(dú)具特色的中文政治論辯挖掘任務(wù),并開(kāi)發(fā)相應(yīng)的任務(wù)數(shù)據(jù)集。
中文外交辭令中很少直接說(shuō)“不”或者“是”,這就很難給論點(diǎn)貼上“支持”或者“反對(duì)”的標(biāo)簽,這對(duì)于論辯挖掘任務(wù)而言就是一大挑戰(zhàn)了。例如,圖1的話輪中抽取到的問(wèn)話人“澳亞衛(wèi)視記者”的觀點(diǎn)是括號(hào)中的“在當(dāng)前世界經(jīng)濟(jì)放緩的背景下,中國(guó)不愿推出更多經(jīng)濟(jì)刺激措施,給美支持國(guó)際經(jīng)濟(jì)增長(zhǎng)帶來(lái)更大壓力”,但中國(guó)外交部發(fā)言人,即說(shuō)話者“趙立堅(jiān)”的話語(yǔ)中并不能直接抽取出對(duì)上述觀點(diǎn)持“支持”或者“反對(duì)”的舉證,甚至感覺(jué)有些“答非所問(wèn)”。實(shí)際上,“答非所問(wèn)”就是一種外交辭令,因?yàn)闊o(wú)論外交部發(fā)言人直接回復(fù)“是的,中方不愿意”或者“不,中方已經(jīng)推出了相關(guān)舉措”,都會(huì)給別有用心的外媒留下口實(shí)或者引發(fā)下一個(gè)追問(wèn)。實(shí)際上,澳亞衛(wèi)視記者的提問(wèn)“中方對(duì)此有何回應(yīng)?”預(yù)設(shè)了“中國(guó)不愿推出更多經(jīng)濟(jì)刺激措施”和“美國(guó)支持國(guó)際經(jīng)濟(jì)增長(zhǎng)”兩種觀點(diǎn)。此時(shí),發(fā)言人既需反駁前一種觀點(diǎn),又要駁斥后一種預(yù)設(shè)。所以,發(fā)言人在闡述了中國(guó)的負(fù)責(zé)任經(jīng)濟(jì)舉措之后,立即轉(zhuǎn)向“反觀美國(guó)”,對(duì)第二種預(yù)設(shè)予以充分且強(qiáng)有力的駁斥。
圖1 表示“主張”的論辯句標(biāo)注示例(中文)
鑒于不同語(yǔ)言在表達(dá)政治觀點(diǎn)時(shí)的語(yǔ)用方式不同,如中文表達(dá)相對(duì)委婉謹(jǐn)慎而英文表達(dá)相對(duì)直接大膽,雙語(yǔ)平行政治論辯語(yǔ)料將會(huì)有助于系統(tǒng)更好地理解原文,因此可以從跨語(yǔ)言論辯挖掘的角度提供新的中文政治論辯挖掘任務(wù)及數(shù)據(jù)集。Toledo-Ronen等人[13]已經(jīng)驗(yàn)證了多語(yǔ)言論辯挖掘的可操作性,但缺乏真實(shí)的對(duì)應(yīng)的多語(yǔ)文本,他們只能使用機(jī)器翻譯生成其他五種語(yǔ)言的“準(zhǔn)平行文本”來(lái)進(jìn)行訓(xùn)練和測(cè)試。Eger等人[14]也是采用機(jī)器翻譯的方法來(lái)完成跨語(yǔ)言論辯挖掘任務(wù)的。Liu等人[15]利用漢英雙語(yǔ)平行語(yǔ)料庫(kù)實(shí)現(xiàn)了雙語(yǔ)對(duì)話推薦系統(tǒng),此方法可以借鑒到雙語(yǔ)論辯挖掘任務(wù)中來(lái)。Shimizu等人[16]則是實(shí)現(xiàn)了利用英語(yǔ)標(biāo)注來(lái)提高日語(yǔ)圖片問(wèn)答系統(tǒng)性能的生成任務(wù),但該方法可否遷移到論辯挖掘任務(wù)中來(lái)還需要實(shí)驗(yàn)驗(yàn)證。無(wú)疑,“外交對(duì)話多語(yǔ)語(yǔ)料庫(kù)”中高質(zhì)量多語(yǔ)平行語(yǔ)料可以為跨語(yǔ)言對(duì)話式政治論辯挖掘任務(wù)提供數(shù)據(jù)支持。
論辯挖掘任務(wù)一般可以分為三種: 論辯對(duì)識(shí)別、論辯關(guān)系預(yù)測(cè)和論辯數(shù)據(jù)評(píng)估。為了方便順利開(kāi)展這些論辯挖掘任務(wù),一般需要對(duì)論辯數(shù)據(jù)集進(jìn)行加工標(biāo)注,最基本的標(biāo)注內(nèi)容就包括主張和舉證。我們從“多語(yǔ)外交對(duì)話語(yǔ)料庫(kù)”中隨機(jī)選擇200篇中文及其對(duì)應(yīng)的200篇英語(yǔ)例行記者會(huì)實(shí)錄文本進(jìn)行論辯標(biāo)注,這400篇實(shí)錄文本包含1 536個(gè)話輪。
我們定義“主張”為主觀性、詢問(wèn)式、結(jié)論性話語(yǔ),定義“舉證”為客觀性、陳述式、解釋性話語(yǔ)?!芭e證”話語(yǔ)是“主張”話語(yǔ)的證據(jù)和例示。圖1和圖2是我們的一些標(biāo)注示例: 圖1是“主張”的標(biāo)注示例,圖2是“舉證”的標(biāo)注實(shí)例,這兩個(gè)例子均出自同一個(gè)“話輪”——2022年9月22日外交部例行記者會(huì)話輪1(BiDAM-20220922-ZH/EN-T1-CE)。根據(jù)Visser等人[17]的論辯標(biāo)注體系(Annotating Argument Scheme),只要滿足有主語(yǔ)、有謂語(yǔ)就可以進(jìn)入論辯句標(biāo)注序列,間接引語(yǔ)和直接引語(yǔ)如果是句子,那就要納入到論辯句識(shí)別的范疇。當(dāng)援引某種說(shuō)法時(shí),這種說(shuō)法本身一般是結(jié)論性的,應(yīng)該標(biāo)注為“主張”,但援引本身又是例證,所以整個(gè)援引句又是“舉證”。值得注意的是: 句號(hào)不能作為漢語(yǔ)句子的句界標(biāo)記,因?yàn)榫涮?hào)句并不是一個(gè)漢語(yǔ)句子。實(shí)際漢語(yǔ)文本中句號(hào)的使用常常帶有隨意性,因此句號(hào)句不具備當(dāng)作基本語(yǔ)法單位的資格[18]。宋柔[19]認(rèn)為漢語(yǔ)句子的句界不會(huì)出現(xiàn)在標(biāo)點(diǎn)句的句內(nèi),只能出現(xiàn)在兩個(gè)標(biāo)點(diǎn)句之間。這會(huì)給漢語(yǔ)句子完全句法分析帶來(lái)困擾,同樣也會(huì)給漢語(yǔ)論辯句句界檢測(cè)帶來(lái)挑戰(zhàn)。
圖2 表示“舉證”的論辯句標(biāo)注示例(中文)
這1 536個(gè)話輪由3位標(biāo)注者共同標(biāo)注完成,但每個(gè)話輪都由至少兩位標(biāo)注者進(jìn)行獨(dú)立手工標(biāo)注,標(biāo)注質(zhì)量評(píng)估指標(biāo)為內(nèi)部標(biāo)注一致性(Inner-Annotation Agreement, IAA),一般用卡帕檢驗(yàn)(Kappa test)公式[20]進(jìn)行驗(yàn)證。我們?cè)诰渥訉佑^察到論辯句標(biāo)注一致性達(dá)到了85%,κ=0.63;在論辯構(gòu)件層觀察到的標(biāo)注一致性達(dá)到了67%,κ=0.51。這說(shuō)明在政治文本中標(biāo)注論辯句時(shí),有時(shí)候標(biāo)注者很難達(dá)到一致。在這個(gè)話輪中,一個(gè)爭(zhēng)論的焦點(diǎn)是英語(yǔ)文本中“The US, however, is another story.”該不該標(biāo)注為“主張”,兩位標(biāo)注者認(rèn)為不應(yīng)該標(biāo)注,一位標(biāo)注者認(rèn)為應(yīng)該標(biāo)注。經(jīng)過(guò)協(xié)商溝通最終達(dá)成一致——不標(biāo)注。因此,在這個(gè)話輪中總共標(biāo)注了7句表示“主張”的論辯句和9句表示“舉證”的論辯句,如表1所示。
表1 論辯句標(biāo)注示例話輪中的“主張”和“舉證”
我們標(biāo)注了每個(gè)話輪中各個(gè)論辯句之間的關(guān)系,發(fā)現(xiàn)在同一話輪之中,除了“主張”與“舉證”之間的“支持”“反對(duì)”與“無(wú)關(guān)聯(lián)”這三種關(guān)系外,提問(wèn)部分和回答部分的“主張”和“舉證”之間還存在“蘊(yùn)含”關(guān)系,如表1中的主張1和舉證1之間就是蘊(yùn)含關(guān)系;回答部分的“主張”有時(shí)與提問(wèn)部分的“主張”也存在“支持”或者“反對(duì)”的關(guān)系,如表1中回答部分的主張4及主張6就和提問(wèn)部分的主張1之間構(gòu)成“反對(duì)”關(guān)系。同時(shí),作為對(duì)提問(wèn)問(wèn)題的回應(yīng),回答部分的論辯句中的某些“主張”和/或“舉證”與提問(wèn)部分作為問(wèn)題的“主張”之間構(gòu)成“回應(yīng)”關(guān)系,如表1中的主張3~7都是對(duì)提問(wèn)部分主張2的“回應(yīng)”。這樣,我們就得到了示例中各個(gè)“主張”句及其“支持”“反對(duì)”“蘊(yùn)含”和“回應(yīng)”四種關(guān)系(“無(wú)關(guān)聯(lián)”關(guān)系不包括在內(nèi))的論辯關(guān)系表(表2)。
表2 示例話輪中 “主張”和“舉證”的關(guān)系
從表2可以看出,外交部發(fā)言人提出的第6條和第7條“主張”竟然獲得了與之劍拔弩張、針?shù)h相對(duì)的外媒提問(wèn)者的第一條舉證的“支持”。也就是說(shuō),發(fā)言人既通過(guò)舉證(舉證2~3)駁斥了提問(wèn)者對(duì)己方主張(主張3~4)的責(zé)難,又通過(guò)舉證(舉證 4~9)反駁了對(duì)方主張(主張1)中的謬誤,還通過(guò)己方的主張(主張6~7)獲得了對(duì)方舉證(舉證1)的支持,體現(xiàn)了高超的外交才能,展示了精妙的外交論辯口才。
在我們選擇的400篇外交部例行記者會(huì)實(shí)錄文本標(biāo)注中,共標(biāo)注了12 288個(gè)論辯句(5 376個(gè)“主張”論辯句和6 912個(gè)“舉證”論辯句)。Haddadan等人[3]指出在政治論辯文本中“主張”是多于“舉證”的,因?yàn)檗q論者在論辯時(shí)有時(shí)不舉證。但我們的數(shù)據(jù)集并非嚴(yán)格意義上的論辯題材,更像是政治問(wèn)答題材,所以“舉證”數(shù)目多于“主張”數(shù)目是可以理解的。我們將這些標(biāo)注好的語(yǔ)料提取出來(lái)作為中文政治論辯挖掘?qū)嶒?yàn)的數(shù)據(jù)集,命名為“中英雙語(yǔ)外交論辯挖掘數(shù)據(jù)集(Chinese-English Bilingual Diplomatic Argumentation Mining dataset, BiDAM)”。表3是該數(shù)據(jù)集的一些統(tǒng)計(jì)數(shù)據(jù),如話輪平均長(zhǎng)度和“主張”以及“舉證”的平均長(zhǎng)度等。
表3 “中英雙語(yǔ)外交論辯挖掘數(shù)據(jù)集”統(tǒng)計(jì)信息
鑒于外交部例行記者會(huì)問(wèn)答內(nèi)容大都涉及對(duì)國(guó)際國(guó)內(nèi)重大事件的態(tài)度和觀點(diǎn),論辯信息挖掘和情感態(tài)度分析這兩類計(jì)算問(wèn)題在這個(gè)領(lǐng)域就有了相輔相成的密切關(guān)聯(lián),因此我們對(duì)抽取出來(lái)的中英文論辯句均進(jìn)行了情感分析計(jì)算。中文情感分析器使用的是SnowNLP(9)https://github.com/isnowfy/snownlp,情感極性區(qū)間為[0,1],抽取語(yǔ)句情感極性均值為0.83,情感傾向整體以褒揚(yáng)為主;英語(yǔ)情感分析器使用的是TextBlob(10)https://github.com/sloria/TextBlob,情感極性區(qū)間為[-1, 1],抽取語(yǔ)句情感極性均值為0.67,情感傾向整體以中性偏褒揚(yáng)為主。歸一化處理之后,全部抽取出來(lái)的論辯句情感極性均值為0.75,整體情感傾向偏褒揚(yáng)。這與我們的外交語(yǔ)篇分析結(jié)果一致,我國(guó)外交發(fā)言人傾向于展示積極、正向的態(tài)度,很少直接提出反對(duì)觀點(diǎn)或者對(duì)提問(wèn)者的主張進(jìn)行直接抨擊,這也是我國(guó)外交話語(yǔ)區(qū)別于他國(guó)外國(guó)話語(yǔ)的一大特征。
接下來(lái)我們將利用BiDAM數(shù)據(jù)集進(jìn)行中文政治論辯挖掘任務(wù)[21-24]的實(shí)驗(yàn),以期驗(yàn)證該數(shù)據(jù)集的可用性,同時(shí)探索跨語(yǔ)言論辯挖掘的有效性。此外,在論辯挖掘領(lǐng)域用以訓(xùn)練有監(jiān)督學(xué)習(xí)算法的標(biāo)注語(yǔ)料庫(kù)嚴(yán)重匱乏,我們尚有大量未經(jīng)標(biāo)注的語(yǔ)料,可以利用BiDAM來(lái)訓(xùn)練有監(jiān)督學(xué)習(xí)算法,為自動(dòng)標(biāo)注論辯語(yǔ)料提供研究資源。我們?cè)诿嫦蛘撧q挖掘任務(wù)的同時(shí)考慮到情感計(jì)算方向與其緊密聯(lián)系,因此在面向論辯挖掘的同時(shí),數(shù)據(jù)集也可用作情感分類任務(wù)。