郭 維 韓 迪 汪勃澄
匯率波動影響一國國際收支平衡、金融安全與穩(wěn)定,也是貨幣政策選擇與實施所必須考慮的關(guān)鍵因素,其決定機制和影響因素一直是學(xué)術(shù)界和各國貨幣當局關(guān)注的焦點。在開放經(jīng)濟條件下,匯率波動受到復(fù)雜的國際、國內(nèi),政治、經(jīng)濟等因素的影響,然而在長期和短期中,其決定機制和影響因素存在差異。匯率的中長期趨勢主要受到一國經(jīng)濟的基本面和核心宏觀經(jīng)濟變量的影響;而匯率的短期波動的背后則有更復(fù)雜多元化的政治經(jīng)濟誘因,例如貨幣政策改變(Yosuke Kido,2016)、政治事件發(fā)生、國際關(guān)系轉(zhuǎn)向(Guo et al.,2021)等。近年來,學(xué)術(shù)界開始關(guān)注不同事件對人民幣短期波動的影響,筆者認為原因主要有兩方面,其一,關(guān)于匯率在長期中的決定機制,相關(guān)研究已經(jīng)形成較為成熟的理論體系,例如購買力平價學(xué)說、利率平價學(xué)說、國際收支說、資產(chǎn)市場說等匯率決定理論,從不同視角研究了匯率長期波動的決定因素,而對于短期波動的誘因,卻尚未形成完整的研究架構(gòu);其二,隨著人民幣國際化和市場化推進,人民幣匯率的市場化程度和波動彈性逐步提高,使其短期波動幅度擴大,且對外部事件的敏感度大大提升。
而新聞事件作為短期事件的典型別類,成為研究人民幣匯率短期波動的重要工具。匯率的資產(chǎn)屬性使其投資者易受非理性預(yù)期影響,對匯率具有潛在影響的事件通過新聞影響外匯市場參與者的市場預(yù)期,從而影響他們的投資決策,進而引起人民幣匯率的短期波動,構(gòu)成了各類事件影響人民幣匯率短期波動的自實現(xiàn)過程和傳導(dǎo)機制。二十世紀七十年代末,Mussa(1979)基于傳統(tǒng)匯率決定理論,結(jié)合理性預(yù)期假說,首次提出“新聞模型”。Frenkel(1981)對預(yù)期事件和未預(yù)期事件做了明確界定,分析得出影響匯率的關(guān)鍵因素是“新聞”,引起了學(xué)術(shù)界的廣泛關(guān)注。朱孟楠和閆帥(2018)通過構(gòu)建經(jīng)濟不確定性指數(shù),研究中美經(jīng)濟新聞對在岸和離岸人民幣匯率的影響,結(jié)論表明人民幣匯率主要受與中國貨幣因素有關(guān)的經(jīng)濟新聞變量的影響。丁劍平和劉璐(2020)研究中國貨幣政策不確定性和宏觀經(jīng)濟新聞的人民幣匯率波動效應(yīng),認為中國的宏觀經(jīng)濟新聞是影響人民幣匯率的關(guān)鍵變量。孫少龍等(2022)構(gòu)建了外匯新聞情感挖掘的匯率預(yù)測方法,發(fā)現(xiàn)外匯新聞情感極性和美元兌人民幣匯率之間存在格蘭杰因果關(guān)系和長期的協(xié)整關(guān)系。
關(guān)于中美貿(mào)易新聞對人民幣匯率短期波動的影響。2018年3月23日,中美貿(mào)易戰(zhàn)正式開始。人民幣匯率在國內(nèi)外壓力下大幅波動,學(xué)術(shù)界開始從多個角度探討中美貿(mào)易戰(zhàn)對人民幣短期波動的影響。例如,從中美貿(mào)易差額、中國對美國的直接投資和投資者避險情緒分析中美貿(mào)易戰(zhàn)對人民幣匯率的傳導(dǎo)渠道(鄂志寰,2018);從中國對美出口量持續(xù)高位運行、在商品上產(chǎn)生通縮效應(yīng)分析中美貿(mào)易戰(zhàn)背景下人民幣貶值原因(厲啟晗,2019);評估中美貿(mào)易戰(zhàn)事件與人民幣匯率之間的關(guān)系,探究不同類型事件對匯率波動的影響(Guo&Chen,2023)。此類文獻主要從國際貿(mào)易框架、大國政治經(jīng)濟博弈分析等理論視角分析中美貿(mào)易戰(zhàn)對人民幣匯率的影響。
在研究方法上,現(xiàn)有文獻主要用計量經(jīng)濟學(xué)方法和人工智能技術(shù)分別研究新聞事件對匯率的影響。在計量方法中,一部分運用事件研究法定義新聞的事件期和估計期,并根據(jù)成功事件標準將事件分為“反轉(zhuǎn)”、“平滑”和“放大”,以評估事件對匯率的影響是否存在、影響程度大小(劉濤和周繼忠,2011;郭維,2018);另一部分文獻通過構(gòu)建政治壓力指數(shù)(Liu&Pauwels,2012)、經(jīng)濟新聞指數(shù)(朱孟楠和閆帥,2018)測度新聞事件對人民幣匯率收益率的影響;此類研究中運用了RS-EGARCH-M(Ho et al.,2017)、ARMA和GARCH(Guo et al.,2021)等計量模型。隨著人工智能技術(shù)在經(jīng)濟學(xué)領(lǐng)域的廣泛應(yīng)用,自然語言處理(NLP)技術(shù)被廣泛用來研究財經(jīng)新聞、財經(jīng)評論、社交媒體等非結(jié)構(gòu)化文本數(shù)據(jù)的情感極性。新聞情感分析主要有兩大類方法,基于情感詞典的新聞情感分析方法(孫少龍等,2022;任仙玲和鄧磊,2019;Huang et al.,2022;Semiromi et al.,2020)和基于機器學(xué)習算法的新聞情感分析方法(張杰等,2021)。在此類研究中,計量經(jīng)濟學(xué)方法的劣勢是對于事件的分類、估計和情感標識,僅限于人工手段,不能達到智能化技術(shù)的準確性和高效性;而人工智能技術(shù)的不足則在于對新聞事件的處理不夠細化,擅長大樣本數(shù)據(jù)在預(yù)測中的應(yīng)用但未關(guān)注到不同類型事件對匯率短期波動的差異性,且當涉及到文本預(yù)處理、情感詞典構(gòu)建等復(fù)雜工作時,難以實現(xiàn)完全智能化。同時,以上兩種情感分析方法的準確性還依賴于詞庫的增量更新(韓迪等,2019),即如新聞出現(xiàn)詞典未收錄(更新)的詞匯,會導(dǎo)致情感分析的模型性能受到影響。
本文首次利用在目前大語言類模型(large language model,LLM)中性能先進且穩(wěn)定的GPT-3.5-turbo模型(截止2023年6月,OpenAI公司使用的ChatGPT正式發(fā)布版依然是GPT-3.5-turbo版本,本文中涉及ChatGPT以及GPT技術(shù)均指GPT-3.5-turbo模型),探索相關(guān)貿(mào)易新聞對人民幣匯率短期波動的影響。和以往處理外匯新聞情感不同的是,本文將ChatGPT技術(shù)運用到人民幣匯率波動的研究中,ChatGPT除了能夠?qū)崿F(xiàn)大量準確的自動化處理(新聞爬取、事件分類以及情感識別)等工作外,關(guān)鍵替代了過去研究中對新聞事件的文本預(yù)處理(如中文分詞、詞庫構(gòu)建、詞典維護)等操作。即在確保準度的情況下,工作量卻有著天壤之別。
同時,由于ChatGPT創(chuàng)造性地在其云語料庫中用標注好的人工偏好作為獎勵信號,促使訓(xùn)練模型越來越符合自然語言的認知理解模式,經(jīng)過知識輸入和在使用中持續(xù)調(diào)整策略,ChatGPT更靠近自然的語言表達方式。因此在本文研究貿(mào)易新聞的情感感知的問題上,ChatGPT表現(xiàn)出了比自然人或者主流算法更強的知識儲備以及上下文理解的特點。
具體來說,本文首先利用ChatGPT與BeautifulSoup爬蟲模型結(jié)合,收集2017年1月至2019年12月期間中美貿(mào)易相關(guān)新聞事件;其次運用ChatGPT引導(dǎo)式Prompt策略并結(jié)合事件研究法,實現(xiàn)對事件來源和類型進行準確分類,按照事件來源分為“中國”、“美國”與“中美”事件,按照事件類型分為“政策類”、“會議類”事件;再次利用訓(xùn)練后的ChatGPT模型,根據(jù)新聞事件對人民幣匯率短期波動可能產(chǎn)生的影響,為各類事件賦予“正面”或“負面”標簽;最后將ChatGPT賦予事件的標簽作為特征值輸入帶有時序的人工智能模型LSTM,驗證不同類型的貿(mào)易新聞事件對人民幣匯率短期波動影響的顯著性。
本文的邊際貢獻主要體現(xiàn)在以下幾點:第一,將ChatGPT技術(shù)與事件研究法相結(jié)合,運用到人民幣匯率波動的研究中,與過去研究中對新聞事件的文本預(yù)處理相比,實現(xiàn)了對新聞事件的自動化的批量處理(爬取、分類、感知等)。更重要的是該方法替代了過去研究工作中對情感數(shù)據(jù)庫的維護工作,無需事先建立數(shù)據(jù)庫或進行額外的數(shù)據(jù)處理。第二,通過在ChatGPT中構(gòu)建引導(dǎo)式Prompt策略,實現(xiàn)了對貿(mào)易新聞情感極性的自動判斷。該策略通過引入行業(yè)領(lǐng)域上下文,旨在修正LLM的學(xué)習感知偏差問題。優(yōu)化后的ChatGPT模型,對貿(mào)易新聞的情感極性分析較未經(jīng)調(diào)整的ChatGPT準確度大大提高,且可以通過追加Prompt策略適應(yīng)新的情境和領(lǐng)域。第三,將主流的機器學(xué)習方法(LSTM模型)與ChatGPT賦予的情感標簽相結(jié)合進行,驗證正面與負面、會談類與政策類、來自中國、美國與中美雙方的貿(mào)易新聞對人民幣匯率短期波動影響的顯著性。
2017年1月,特朗普就任美國總統(tǒng)后開始逆全球化地奉行保護主義及單邊主義,并多次啟動針對中國的貿(mào)易調(diào)查,使兩國經(jīng)貿(mào)關(guān)系持續(xù)陷入緊張局勢。2018年3月,特朗普宣布對美國進口的所有鋼鐵和鋁分別征收25%和10%的關(guān)稅,中美貿(mào)易戰(zhàn)正式開始。此后,中美貿(mào)易戰(zhàn)逐漸升級,兩國互相加征關(guān)稅、啟動貿(mào)易調(diào)查和對相關(guān)企業(yè)進行貿(mào)易制裁的事件頻發(fā)。2018年12月,中美雙方達成協(xié)議暫停中美貿(mào)易戰(zhàn),中美貿(mào)易關(guān)系有所緩和,在2019年兩國均放寬關(guān)稅加征政策,并在2020年1月簽署了第一階段經(jīng)貿(mào)協(xié)議。但從同年3月開始,美國又開始對中國商品加征關(guān)稅并對中國企業(yè)采取限制措施,中美貿(mào)易戰(zhàn)在兩國間政治經(jīng)濟領(lǐng)域多維度博弈中持續(xù)加劇。與此同時,伴隨著中美貿(mào)易戰(zhàn)的跌宕起伏,中美雙邊匯率波動幅度持續(xù)擴大。人民幣對美元匯率在2017年累計升值近6%,2018年3月中美貿(mào)易戰(zhàn)開始至12月累計貶值近10%,8月突破了“7”元大關(guān),2019年全年波動率接近4.44%。
中美貿(mào)易戰(zhàn)的演化過程為研究新聞事件對人民幣匯率短期波動的影響提供了生動素材。中美貿(mào)易新聞是否會對人民幣匯率短期波動構(gòu)成影響,將會構(gòu)成多大程度的影響,與兩方面因素有關(guān),一是人民幣匯率的市場化程度,該因素決定了人民幣匯率短期波動是否可能受到外部事件影響,是貿(mào)易新聞向人民幣匯率波動傳導(dǎo)的必要條件;二是中美貿(mào)易新聞事件對人民幣匯率的傳導(dǎo)機制,該因素決定了貿(mào)易新聞事件是否具備向人民幣匯率波動傳導(dǎo)的有效機制和路徑。
通過匯率制度改革,人民幣匯率基本實現(xiàn)了市場化目標,人民幣匯率完成了從記賬核算工具到宏觀經(jīng)濟調(diào)節(jié)工具的轉(zhuǎn)變,正在實現(xiàn)從宏觀經(jīng)濟金融管理自變量到因變量的轉(zhuǎn)變(丁志杰,2018)。人民幣的市場化程度在貿(mào)易新聞事件對人民幣匯率波動的傳導(dǎo)中有著重要意義,是其影響效應(yīng)發(fā)揮的必要條件。自2005年7月匯率制度改革以來,中國開始實行以市場供求為基礎(chǔ)、參考一籃子貨幣進行調(diào)節(jié)、有管理的浮動匯率制度,人民幣市場化和國際化進程也正式開啟。2010年6月央行提出“進一步推進人民幣匯率形成機制改革,增強人民幣匯率彈性”;同年,香港離岸人民幣市場正式形成并得到快速發(fā)展;2015年“811”匯改調(diào)整中間價形成機制,充分體現(xiàn)市場供求對匯率形成的決定性作用;2016年2月,人民幣兌美元匯率中間價形成機制更加明確,提高了匯率機制的規(guī)則性、透明度和市場化水平,人民幣成為與美元、歐元、英鎊和日元并列的第五種SDR籃子貨幣;2020年以來,人民幣對美元匯率年化波動率為4.5%,與國際主要貨幣基本相當,其彈性強度基本實現(xiàn)了市場化目標。匯率市場化水平的提高會產(chǎn)生“信號效應(yīng)”(宋科等,2022),當人民幣匯率具有充分的彈性時,其受到外部事件影響的可能性也相應(yīng)增大。人民幣匯率的市場化程度加強了貿(mào)易新聞對其短期波動產(chǎn)生影響的可能性。
匯率“新聞模型”提出,未預(yù)期到的新聞事件是引起匯率波動的重要因素。而新聞事件向匯率傳導(dǎo)的機制與非理性預(yù)期和外匯市場微觀結(jié)構(gòu)有著密切聯(lián)系。首先是非理性預(yù)期。匯率的資產(chǎn)屬性使其投資者易受非理性預(yù)期影響。非理性預(yù)期打破了有效市場假說關(guān)于匯率能夠完全體現(xiàn)宏觀基本面并反映所有市場信息的設(shè)定。受信息不對稱和有限關(guān)注等因素影響,投資者在構(gòu)建投資決策時,無法對全部信息進行關(guān)注,只能根據(jù)自己的學(xué)識、能力、經(jīng)驗等,選擇關(guān)注部分信息,形成非理性的、異質(zhì)性的投資決定。根據(jù)選擇性注意理論,受眾對外界信息具有主動選擇能力,投資者為了追求自身利益,主動選擇與自身需求相關(guān)性強的信息。從搜索成本理論角度來看,投資者在某項資產(chǎn)組合所投入的內(nèi)部和外部的搜索成本,追求該項資產(chǎn)信息中所包含的有價值的部分,并結(jié)合自身的認知和收集到的信息進行分析,最終做出相關(guān)的投資決策。其次,外匯市場微觀結(jié)構(gòu)變化。外匯市場微觀結(jié)構(gòu)主要基于市場參與者的行為和市場特征來研究(姜波克,2001)。在非理性預(yù)期的影響下,新聞事件通過向市場參與者進行信息傳遞,改變投資者預(yù)期從而引起外匯市場微觀結(jié)構(gòu)變化。具體地,外匯市場投資者對貿(mào)易新聞的認知會通過交易行為反饋到外匯市場中,引起市場微觀主體行為和市場預(yù)期的變化,并由市場參與者對某種方向的交易行為達成一致,最終導(dǎo)致匯率短期波動。對外匯市場投資者來說,人民幣作為金融資產(chǎn)的一種,投資者為其分配關(guān)注度后,接受信息形成判斷,買入或者賣出人民幣資產(chǎn),引起人民幣匯率的變動(Peltom?ki,2018;谷宇和郭蘇瑩,2020)。在中美貿(mào)易摩擦階段,相關(guān)貿(mào)易新聞通常會引起投資者的高度關(guān)注,進而從兩個方面對短期匯率波動產(chǎn)生影響。一方面,投資者關(guān)注并解讀貿(mào)易新聞事件后會改變自己對于市場預(yù)期,進而調(diào)整自身的投資組合從而引起匯率的短期波動;另一方面,外匯投資者對于不同類型的事件會形成樂觀關(guān)注或悲觀關(guān)注的投資者情緒,進而會通過采取不同方向的調(diào)整手段影響匯率。譬如,當正面事件發(fā)生時,投資者會將其視為利好信息,預(yù)判人民幣匯率對美元升值;當負面事件發(fā)生時,投資者會將其視為利空消息,預(yù)判人民幣匯率對美元貶值。如果上述邏輯成立,那么正面和負面貿(mào)易新聞將會引起人民幣匯率非同方向的波動,并實現(xiàn)預(yù)期的自我強化。
根據(jù)以上兩點,本文提出兩個假說。
假說1:貿(mào)易新聞事件會引起人民幣匯率短期波動。
假說2:在貿(mào)易新聞中,正面事件、負面事件,會談類事件、政策類事件,來自中國、美國、中美雙方的事件分別顯著引起匯率在不同程度上的短期波動。
人工智能技術(shù)歷經(jīng)了信息技術(shù)和數(shù)字技術(shù)發(fā)展的高級階段,隨著現(xiàn)階段信息數(shù)據(jù)的海量底蘊和高速增長態(tài)勢,使得人工智能的算法優(yōu)化和場景適配精度提升成為可能(鄧云峰和張年華,2023)。但人工智能技術(shù)的發(fā)展,一直存在智能能力突出而情感能力不足的問題。不足主要體現(xiàn)在不具備價值判斷能力以及不穩(wěn)定精準情感計算輸出等方面,即在算法和算力均不充分的情況下,模擬情感感知的工作顯得不夠精準。而LLM模型通過對自然語言思維方式和表達習慣的技術(shù)性模仿,逐漸具備可以識別一些接近現(xiàn)實生活的“特殊場景”的情感感知。但這種感知,依然不是“真的理解”。
目前,在線實時更新的NLP模型已越來越多地應(yīng)用于金融行業(yè)的自動化處理任務(wù)中,如文本分類、情感分析和自然語言生成。隨著transformer(Vaswani et al.,2017)架構(gòu)的提出,NLP正式進入大語言類模型(large languagemodel,LLM)時代,GPT發(fā)展歷程見圖1。
圖1 自然語言處理模型的發(fā)展歷程
ChatGPT是當下最先進的LLM模型,而已有的情感判斷(感知)模型工作繁瑣效率較低且技術(shù)門檻較高不宜推廣,因此本文嘗試將其應(yīng)用于金融領(lǐng)域的情感感知中①ChatGPT具有上下文理解能力,不僅僅可以做出情感判斷,并在整體語境中進行情感感知,識別出更準確的情感傾向。,在確保準度的情況下,進一步提高處理效率和降低操作難度。具體來說本文用到以下關(guān)鍵技術(shù)和架構(gòu):首先,本文選取ChatGPT而非其他模型,是因為其基于自注意力機制(Self-Attention)的深度神經(jīng)網(wǎng)絡(luò)(Transformer)的基本架構(gòu),該模型適合輿情分析與判斷(Alejandro and Tang,2023),和過往模型相比,在提供貿(mào)易新聞時能夠更準確地判斷情感感知結(jié)果。其次,在爬取的貿(mào)易數(shù)據(jù)方面,本文對數(shù)據(jù)的分類整理上使用了基于人類反饋的強化學(xué)習(Reinforcement Learning from Human Feedback,RLHF)技術(shù),該技術(shù)結(jié)合獎勵模型對文本生成模型的結(jié)果進行自動評估,并采用強化學(xué)習對文本生成模型進行優(yōu)化,使其最終生成符合本文預(yù)期的文本。上述環(huán)節(jié)是ChatGPT內(nèi)容生成能力提升的關(guān)鍵。然后針對行業(yè)使用了指示調(diào)諧(Instruction Tuning)技術(shù),基于指令描述,可以促使模型理解指令任務(wù),從而生成預(yù)期文本。例如,用戶輸入“判斷這句話的正負面情緒:中美迎來首次全面經(jīng)濟對話”,其中“判斷這句話的對錯”是指令描述,指令任務(wù)是對“中美迎來首次全面經(jīng)濟對話”進行情感判斷,從而生成預(yù)期的答案文本“該句話正面”。最后結(jié)合思維鏈(Chain of Thought)技術(shù),通過一系列前后關(guān)聯(lián)的指令,可以輔助ChatGPT完成復(fù)雜的推理任務(wù)。本文輸入的每條貿(mào)易新聞并不是孤立的數(shù)據(jù)個體,特別是前文判斷的經(jīng)驗也可以影響后面輸入的結(jié)果,而思維鏈技術(shù)可以有針對性地設(shè)計模型的指令輸入,促使模型將整體推理任務(wù)拆解為包含多個鏈式步驟的任務(wù)。
雖然ChatGPT技術(shù)運用在貿(mào)易新聞的情感感知中相較于其他NLP模型性能表現(xiàn)優(yōu)異,但在具體實施過程還存在以下問題:由于模型的訓(xùn)練數(shù)據(jù)來源于互聯(lián)網(wǎng)上的文本,這些數(shù)據(jù)可能會存在一定偏差,例如文本的主題、來源和質(zhì)量等,這可能會影響ChatGPT模型的性能。在本文研究數(shù)據(jù)中將中美貿(mào)易新聞數(shù)據(jù)輸入未經(jīng)調(diào)整的ChatGPT進行情感極性判斷與分類統(tǒng)計,發(fā)現(xiàn)整體準確度欠佳,未達到人工分類的準度,且輸出結(jié)果難以調(diào)用。通過統(tǒng)計人工分類與ChatGPT的輸出異常結(jié)果進行研究發(fā)現(xiàn)具體問題如下:
未經(jīng)調(diào)整的ChatGPT無法準確理解任務(wù)含義、無法分類統(tǒng)計邊界事件、輸出內(nèi)容非格式化、面對復(fù)雜分類問題時表現(xiàn)不穩(wěn)定。針對上述問題,本研究基于強化學(xué)習方法(RLHF)實現(xiàn)循環(huán)迭代ChatGPT的分類統(tǒng)計策略。該策略的核心是在ChatGPT模型中進行指示調(diào)諧,即增加行業(yè)領(lǐng)域的引導(dǎo)式Prompt策略,從而實現(xiàn)ChatGPT對上下文情感的準確感知,提升ChatGPT在外匯領(lǐng)域的表現(xiàn)。以下述策略構(gòu)建的分類統(tǒng)計算法如表1所示:
表1 基于ChatGPT的引導(dǎo)式prompt策略偽代碼
第一,初始化提示,賦予ChatGPT角色屬性。設(shè)置分隔符使ChatGPT準確理解任務(wù)并避免提示注入問題。
第二,檢查邊界事件特性,設(shè)置邊界事件的處理方式。給出限制條件(如生成文本的長度、格式或特定的詞語使用),可以影響模型生成的結(jié)果。
第三,設(shè)定行業(yè)領(lǐng)域的回答實例,要求ChatGPT根據(jù)實例輸出內(nèi)容并格式化輸出以備后續(xù)調(diào)用。該操作指導(dǎo)模型以對問題進行回答的方式生成響應(yīng),可以幫助模型更好地理解問題的意圖,并生成相關(guān)的回答。
第四,細化復(fù)雜的分類統(tǒng)計步驟,將分類統(tǒng)計任務(wù)拆分為數(shù)個子任務(wù),令ChatGPT按照設(shè)定的步驟基于RLHF方法思考并完成任務(wù)。
為了高效且準確地驗證上述假說,本文首次將ChatGPT技術(shù)應(yīng)用運用于金融領(lǐng)域的數(shù)據(jù)收集與數(shù)據(jù)挖掘中。首先,利用ChatGPT結(jié)合爬蟲算法代替以往人工操作以及單一爬蟲技術(shù),收集2017年1月至2019年12月期間中美貿(mào)易相關(guān)新聞事件;然后,結(jié)合事件研究法,運用ChatGPT對事件來源和類型進行分類,按照事件來源分為“中國”、“美國”與“中美”事件,按照事件類型分為“政策類”、“會議類”事件;最后,通過對ChatGPT增加行業(yè)領(lǐng)域的“引導(dǎo)式”策略訓(xùn)練,使得ChatGPT模型能夠根據(jù)新聞事件對人民幣匯率短期波動可能產(chǎn)生的影響,為各類事件賦予“正面”或“負面”標簽。
在此基礎(chǔ)上,將ChatGPT感知結(jié)果與LSTM時序模型結(jié)合,即將ChatGPT賦予事件的標簽作為特征值輸入時序模型LSTM,驗證兩個假說。
1.數(shù)據(jù)來源。(1)匯率數(shù)據(jù)。本文使用的人民幣匯率數(shù)據(jù)為美元兌人民幣匯率(USD/CNY即期匯率),從wind數(shù)據(jù)庫獲取。(2)事件數(shù)據(jù)。本文通過Python的OpenAI庫和BeautifulSoup庫共同實現(xiàn)ChatGPT的爬蟲模型,準確高效且自動化地收集中美貿(mào)易新聞事件,包括來自中美官方公開發(fā)布的政策類事件和會談類事件。政策類事件包括兩國出臺的中美貿(mào)易相關(guān)政策或報告;會談類事件包括兩國之間的會晤/交涉/經(jīng)濟對話/磋商/訪問/通話/溝通/聯(lián)合聲明等。事件數(shù)據(jù)來源基于美國貿(mào)易代表辦公室網(wǎng)站、中國財政部官網(wǎng)、中國商務(wù)部官網(wǎng)、CCTV網(wǎng)站、新華網(wǎng)、央視網(wǎng)、環(huán)球網(wǎng)、百度等渠道爬取,并調(diào)用OpenAI庫下的prompt參數(shù)進行精確篩選。
2.樣本區(qū)間。本文樣本區(qū)間為2017年1月1日至2019年12月31日。盡管中美貿(mào)易戰(zhàn)從2018年3月正式開啟,但本文考慮到自特朗普2017年1月上臺以來提出對中國展開貿(mào)易調(diào)查,中美貿(mào)易摩擦事件增加,使得中美經(jīng)貿(mào)關(guān)系開始變得不穩(wěn)定,同時人民幣匯率也從2017年初開始出現(xiàn)較大幅度波動,因此將2017年1月1日作為樣本期的起點。同時,為剔除疫情影響帶來的干擾,將2019年12月31日作為樣本終點。
本文基于事件研究法研究思路,使用ChatGPT對中美貿(mào)易新聞進行分類統(tǒng)計(表1中4~13行),以此研究中美經(jīng)貿(mào)關(guān)系對人民幣匯率的影響,具體研究思路如下:
1.定義事件。本文將事件定義為中美官方層面正式的、公開的經(jīng)貿(mào)事件,包括來源于中方、美方和中美雙方的貿(mào)易事件,事件類型進一步分為政策類和會談類。政策類事件包括美國對中國發(fā)起貿(mào)易調(diào)查、美國或中國對另一國加征關(guān)稅或減稅、美國或中國對另一國企業(yè)增加貿(mào)易限制或減少貿(mào)易限制等事件;會談類事件包括中美元首會晤、中美兩國高級別貿(mào)易磋商、中美對話、簽署貿(mào)易協(xié)議等。在2017年1月1日至2019年12月31日期間,收集到中美貿(mào)易新聞事件共116件。
2.定義事件窗口。該做法的目的是分析事件發(fā)生前后人民幣匯率的變化,因此事件窗口的長短成為研究特定事件對人民幣匯率的影響的關(guān)鍵因素。事件窗口過短可能會由于事件影響的時滯性而忽略部分事件的影響,過長則容易出現(xiàn)事件疊加現(xiàn)象,從而難以區(qū)分開不同的獨立新聞事件對匯率波動的影響。參考郭維(2017)對事件窗口的定義,使用事件前后2個交易日作為事件窗口長度,用來評估事件前后匯率的變化情況。
貿(mào)易新聞的發(fā)生是一個動態(tài)變化過程,投資者依據(jù)不同時點、不同類型、不同來源、不同色彩的新聞事件調(diào)整其投資行為,進而對人民幣匯率產(chǎn)生影響。上述傳導(dǎo)過程往往呈現(xiàn)為復(fù)雜的非線性關(guān)系。LSTM模型部署到了真實金融場景中,由于其相對于其他時間序列模型的優(yōu)勢而受到時間序列分類界的廣泛關(guān)注。在分類精度方面,LSTM都優(yōu)于幾種傳統(tǒng)的時間序列分類模型,同時對數(shù)據(jù)的預(yù)處理要求最少。此外,LSTM可以很容易地利用大量的時間序列數(shù)據(jù)進行擴展,即調(diào)整貿(mào)易新聞數(shù)據(jù)量模型無需特別更改。
因此,本研究使用能夠挖掘使用變量之間的深層次關(guān)系并調(diào)用大量潛在有價值的非線性序列數(shù)據(jù)的LSTM模型進行短期匯率預(yù)測,同時將ChatGPT分類統(tǒng)計的中美貿(mào)易摩擦事件的標簽作為特征值輸入LSTM模型(以2017年2月3日的數(shù)據(jù)為例,LSTM模型輸入數(shù)據(jù)的特征信息見表2)。為了提高模型擬合能力,進而提高匯率預(yù)測的穩(wěn)定性,本文使用Adam優(yōu)化器進行訓(xùn)練,采用tune框架對模型進行超參數(shù)調(diào)優(yōu),最終LSTM模型的超參數(shù)如表3所示。
表2 特征信息表
表3 LSTM模型超參數(shù)設(shè)定
本文對樣本期間116個事件,實現(xiàn)ChatGPT循環(huán)迭代分類統(tǒng)計策略后結(jié)果如圖2所示。116個事件中,包括正面事件52個,負面事件64個,政策類事件90個,會談類事件26個,中國來源事件25個,美國來源事件65個,中美雙方來源事件26個。
圖2 分類統(tǒng)計結(jié)果
同時根據(jù)事件窗口定義,本文需要對樣本期間116個事件進行合并整理,具體做法包括以下三點。
1.合并發(fā)生時間重合的新聞事件。新聞事件通常包括單日事件與持續(xù)數(shù)日的連續(xù)事件,如發(fā)起調(diào)查、加征關(guān)稅等通常為單日事件,中美對話(會議或洽談等)通常為連續(xù)事件,兩類事件都可能發(fā)生時間上的重復(fù),從而影響對同時期匯率波動估計的準確性。對此,本文的處理方法是,將這些事件進行合并,使之成為一個復(fù)合事件,而對于正面/負面影響的判斷,則以其中最關(guān)鍵的事件對中美經(jīng)貿(mào)關(guān)系的影響為準。例如“美國公布擬對中國加征關(guān)稅的商品清單”和“中國決定對美進口價值500億美元的103項商品加征關(guān)稅”兩個單日事件均發(fā)生在2018年4月4日,本文首先將兩個事件分別命名為“美對中加征關(guān)稅”和“中對美加征關(guān)稅”,再將兩個事件合并為一個事件期,影響為“負面”。
2.合并發(fā)生在節(jié)假日內(nèi)的多個新聞事件。節(jié)假日內(nèi)發(fā)生的事件,其發(fā)生時間雖然沒有重合,但是在評估時均是通過節(jié)假日前后的匯率數(shù)據(jù)來反映匯率的變化程度,評估單個事件與多個事件的效果一致,因此將節(jié)假日內(nèi)發(fā)生的事件合并為一個事件期。如2017年1月27日到2月2日是一段春節(jié)假期,假期里發(fā)生了“美國將對從中國進口的大型洗衣機征收高額反傾銷稅”與“美國商務(wù)部就對華不銹鋼板帶材反傾銷和反補貼調(diào)查作出終裁”兩個不同單日的事件,則將兩個事件合并為一個事件期。
3.合并細分類型的事件。本文進一步將正面新聞分為中美對話、中加大對美采購、美對中企業(yè)暫停限制、美對中放寬關(guān)稅政策、中對美放寬關(guān)稅政策五類;負面新聞分為美發(fā)起調(diào)查、美將中列為匯率操縱國、美指責中、美對中企業(yè)增加限制、美對中加征關(guān)稅、中對美加征關(guān)稅六類。
合并后得到事件期共110個,統(tǒng)計結(jié)果如表4所示。
表4 事件子類型統(tǒng)計表
1.評價指標。本文采用在機器學(xué)習領(lǐng)域中針對回歸問題常用的評價指標,具體包括平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、平均絕對誤差(Mean Absolute Error,MAE)和百分比誤差絕對值的標準差(Standard Deviation of Absolute Percentage Error,SDAPE)三個評價指標,對模型的預(yù)測精確度與穩(wěn)定性進行評價,進而驗證不同類型的新聞事件影響人民幣匯率波動的顯著性。其中,MAPE、MAE的值越小代表模型預(yù)測精度越高,SDAPE的值越小代表模型預(yù)測穩(wěn)定性越高。公式如下:
其中,n代表樣本總量,yt代表實際值代表預(yù)測值,t代表數(shù)據(jù)序列編號。
2.實證結(jié)果分析。為了驗證不同類型的新聞事件影響人民幣匯率波動的顯著性,本文分別將人民幣匯率數(shù)據(jù)(USDCNY)、人民幣匯率數(shù)據(jù)結(jié)合貿(mào)易新聞事件(USDCNY_trade)、人民幣匯率數(shù)據(jù)結(jié)合負面事件(USDCNY_neg)、人民幣匯率數(shù)據(jù)結(jié)合正面事件(USDCNY_pos)、人民幣匯率數(shù)據(jù)結(jié)合政策類事件(USDCNY_policy)、人民幣匯率數(shù)據(jù)結(jié)合會談類事件(USDCNY_talk)、人民幣匯率數(shù)據(jù)結(jié)合中國來源事件(USDCNY_CN)、人民幣匯率數(shù)據(jù)結(jié)合美國來源事件(USDCNY_US)、人民幣匯率數(shù)據(jù)結(jié)合中美雙方來源事件(USDCNY_CN-US)等作為特征值輸入LSTM模型,以精確性與穩(wěn)定性指標間接判斷不同新聞事件影響人民幣匯率波動的顯著性。
對于假說1而言,對比USDCNY與USDCNY_trade的結(jié)果(表5)可知,將貿(mào)易新聞事件加入原有匯率預(yù)測模型(即第二行USDCNY_trade)的匯率預(yù)測誤差要優(yōu)于僅使用匯率數(shù)據(jù)(即第一行USDCNY)的模型,三個指標分別從15.851%降低到13.785%、1.109%降低到0.962%與15.692%降低到13.648%,預(yù)測誤差減小,意味著加入貿(mào)易新聞事件作為離散變量標記匯率數(shù)據(jù)后,模型預(yù)測能力得到有效提高,即貿(mào)易新聞事件確定會引起人民幣匯率短期波動。
表5 基于貿(mào)易事件發(fā)生與否的LSTM匯率預(yù)測結(jié)果
對于假說2來講,對比USDCNY、USDCNY_neg與USDCNY_pos的結(jié)果(表6)可知,負面事件USDCNY_neg與正面事件USDCNY_pos的精確性與穩(wěn)定性也同時均優(yōu)于USDCNY模型,即對事件細分進一步提高模型的表現(xiàn)能力。值得一提的是,將負面事件USDCNY_neg和匯率數(shù)據(jù)作為特征值輸入模型,其預(yù)測精確性與穩(wěn)定性評價指標(13.022%、0.910%與12.893%)均優(yōu)于使用正面事件USDCNY_pos和匯率數(shù)據(jù)輸入模型(13.861%、0.969%與13.723%),即相較于使用正面事件標記匯率數(shù)據(jù),使用負面事件進行標記可以更準確得捕捉到人民幣匯率的短期波動,且負面事件比正面事件提升更明顯,在所有輸入的數(shù)據(jù)中模型表現(xiàn)次優(yōu)。
表6 基于事件影響的LSTM匯率預(yù)測結(jié)果
對比USDCNY_policy與USDCNY_talk的結(jié)果(表7)可知,政策類事件USDCNY_policy的MAPE、MAE和SDAPE值(12.956%、0.905%與12.827%)顯著低于會談類事件USDCNY_talk(14.829%、1.037%與14.681%),證明政策類事件對匯率波動的影響較會談類事件更為顯著。
表7 基于事件類型的LSTM匯率預(yù)測結(jié)果
對比人民幣匯率數(shù)據(jù)結(jié)合中國來源USDCNY_CN、美國來源USDCNY_US與中美雙方來源USDCNY_CN_US的結(jié)果(表8)可知,使用美國來源事件標記匯率數(shù)據(jù)能有效提高模型的匯率預(yù)測能力,其MAPE、MAE和SDAPE值分別為(13.430%、0.938%與13.296%),使用中國來源事件(15.241%、1.066%與15.090%)與中美雙方來源事件(14.846%、1.039%與14.698%)作為特征輸入模型,對模型的預(yù)測能力影響不大。
表8 基于事件來源的LSTM匯率預(yù)測結(jié)果
綜上所述,本文的兩個假說都是成立的。對于假說1,加入任何貿(mào)易新聞數(shù)據(jù)(除第一行外所有數(shù)據(jù))都比沒有加入新聞數(shù)據(jù)(第一行USDCNY)時預(yù)測性能更好。對于假說2,在假說1的基礎(chǔ)上,把貿(mào)易新聞不同特征標簽加入模型后,對影響匯率波動的顯著性影響由高到底排序為:USDCNY_policy政策類事件、USDCNY_neg負面事件、USDCNY_US美國來源事件、USDCNY_pos正面事件、USDCNY_talk會談類事件、USDCNY_CN_US中美雙方來源事件、USDCNY_CN中國來源事件。換言之,在匯率預(yù)測中加入政策類事件USDCNY_policy的預(yù)測性能表現(xiàn)最優(yōu),負面事件USDCNY_neg次之,正面事件、會談類事件、中美雙方來源事件與中國來源事件對匯率波動的影響并不顯著。
本文將ChatGPT技術(shù)應(yīng)用在貿(mào)易新聞事件對人民幣匯率短期波動影響的研究中。通過ChatGPT技術(shù)和爬蟲技術(shù)、事件研究法和LSTM模型的結(jié)合,實現(xiàn)了貿(mào)易新聞事件的爬取、分類以及情感感知,并通過將ChatGPT賦予事件的標簽作為特征值輸入時序人工智能模型LSTM中,驗證了本文提出的兩項研究假說,并進一步得到了以下結(jié)論。
第一,訓(xùn)練后的ChatGPT技術(shù)應(yīng)用在貿(mào)易新聞的情感感知中,與以往的人工處理或者通過新聞關(guān)鍵語句觸發(fā)數(shù)據(jù)庫提取情感判斷的方法相比有以下優(yōu)勢:一是自動化處理。ChatGPT可以快速處理大量的貿(mào)易新聞文章。相比人工處理,它可以在更短的時間內(nèi)分析和處理大量文本數(shù)據(jù)。二是上下文理解能力。ChatGPT可以理解上下文,并在整體語境中進行情感感知。它不僅僅依賴于關(guān)鍵語句,還可以綜合考慮文章的整體內(nèi)容,識別出更準確的情感傾向。三是強大的語言處理能力。ChatGPT是一個經(jīng)過大規(guī)模訓(xùn)練的語言模型,具有強大的語義理解和推理能力。它可以識別和理解貿(mào)易新聞中的復(fù)雜語言結(jié)構(gòu)和隱含信息,從而比自然人或者主流語言處理模型更準確地判斷情感。四是無需數(shù)據(jù)庫提取。傳統(tǒng)方法中,需要通過中文分詞提取關(guān)鍵語句并與數(shù)據(jù)庫進行匹配,以判斷情感,技術(shù)難度和工作量都比較大,而ChatGPT可以直接對整個文本進行情感感知,無需事先建立數(shù)據(jù)庫或進行額外的數(shù)據(jù)處理。五是適應(yīng)新的情境。ChatGPT可以通過追加訓(xùn)練的方式適應(yīng)新的情境和領(lǐng)域。一旦有了新的貿(mào)易新聞數(shù)據(jù),可以使用這些數(shù)據(jù)對ChatGPT進行進一步的訓(xùn)練,從而提高并擴展其在貿(mào)易新聞情感感知方面的準確性。此外,ChatGPT結(jié)合引導(dǎo)式Prompt技術(shù)不止應(yīng)用在貿(mào)易新聞的情感感知中,還可以應(yīng)用于其他金融領(lǐng)域的研究中。
第二,貿(mào)易新聞事件會引起人民幣匯率短期波動。隨著近年來人民幣匯率制度改革進程加速與人民幣國際化的逐步推進,人民幣匯率的市場化水平有所提升,使人民幣匯率的短期波動彈性增大,使之更易受到短期外部事件尤其是在中美貿(mào)易摩擦背景下的貿(mào)易新聞事件影響。此外,關(guān)于新聞事件對人民幣匯率的潛在傳導(dǎo)機制,投資者關(guān)注、非理性預(yù)期假說、“新聞模型”等理論已經(jīng)提供了一系列解釋,人民幣離岸市場和在岸市場的互動性增強、貿(mào)易渠道和投資渠道的傳導(dǎo)能力在資本項目逐步開放的背景下進一步擴大,這些因素都強化了貿(mào)易新聞事件對人民幣匯率短期波動的影響效應(yīng)。
第三,在貿(mào)易新聞事件中,負面新聞對人民幣匯率短期波動的影響較正面新聞而言更為顯著。由此可見,負面新聞大部分為導(dǎo)致中美貿(mào)易摩擦加劇的負面效應(yīng)極強的事件。相較而言,正面新聞中占比最大的中美會談事件則更偏向中性色彩,為中美貿(mào)易關(guān)系帶來可能的轉(zhuǎn)機但也存在一定的不確定性。因此,負面新聞對人民幣匯率波動的影響較正面新聞更強烈的研究結(jié)論,符合事件特征和理論預(yù)期。
第四,在貿(mào)易新聞事件中,政策類事件對人民幣匯率短期波動的影響效應(yīng)大大高于會談類事件;由美國引起的事件對人民幣匯率短期波動的影響效應(yīng)大大高于中美雙方來源事件與中國來源事件。政策類事件對匯率短期波動影響更顯著的結(jié)論表明外匯市場投資者更容易受到與實際政策相關(guān)的貿(mào)易新聞影響,從而改變匯率預(yù)期,而對會談類的貿(mào)易新聞則相對不敏感,一個可能的解釋是后者通常在發(fā)生前已有市場預(yù)判且每個事件持續(xù)時間較長,因此對匯率短期波動的影響相對不顯著。