張婕
摘 要:隨著大數(shù)據(jù)、人工智能、移動互聯(lián)等新一代信息技術(shù)的發(fā)展和應(yīng)用,金融與科技的全面融合正在提速,傳統(tǒng)金融服務(wù)面對龐大而復(fù)雜的數(shù)據(jù)必須做出相應(yīng)的改變,進(jìn)入新金融時代,數(shù)據(jù)科學(xué)的應(yīng)用為金融業(yè)帶來了諸多新的機(jī)遇,數(shù)據(jù)分析已經(jīng)從傳統(tǒng)的“BI數(shù)據(jù)可視化呈現(xiàn)”朝著“AI建模分析”方向演進(jìn),數(shù)據(jù)科學(xué)的發(fā)展成為現(xiàn)代金融工程發(fā)展的重要推動力之一,本文對數(shù)據(jù)科學(xué)在現(xiàn)代金融工程中的應(yīng)用、發(fā)展歷程及發(fā)展趨勢進(jìn)行了分析。
關(guān)鍵詞:數(shù)據(jù)科學(xué);金融工程;應(yīng)用價值;發(fā)展趨勢
一、引言
在新金融經(jīng)濟(jì)時代,根據(jù)海量數(shù)據(jù)預(yù)測未來結(jié)果,實(shí)時指導(dǎo)金融分析與決策,已成為重要趨勢。在此背景下,數(shù)據(jù)科學(xué)的重要性由此凸顯,金融行業(yè)作為最喜歡擁抱創(chuàng)新科技的行業(yè)之一,數(shù)據(jù)科學(xué)與金融工程的融合后的應(yīng)用價值呈現(xiàn)新的生機(jī)與活力。
二、數(shù)據(jù)科學(xué)與金融工程的融合應(yīng)用
(一)方法交融
數(shù)據(jù)科學(xué)家Rachel Schutt, Cathy ONeil在《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》[1]一書中認(rèn)為,一個數(shù)據(jù)科學(xué)團(tuán)隊(duì)也需要有既了解科學(xué)方法,又有需要哲學(xué)與倫理學(xué)背景的人,才能更好的理解問題。在金融投資中,模型、編程和業(yè)務(wù)實(shí)現(xiàn)真正的融合雖然離不開諸多理論模型協(xié)助預(yù)測和優(yōu)化,但在市場上實(shí)現(xiàn)持續(xù)且穩(wěn)定利潤的策略卻少之又少。歸根結(jié)底主要是市場其內(nèi)在規(guī)律,往往這些經(jīng)驗(yàn)也只有親身經(jīng)歷過才能真正理解,擁有豐富經(jīng)驗(yàn)的投資者通常都不是數(shù)據(jù)科學(xué)家。數(shù)據(jù)科學(xué)重點(diǎn)強(qiáng)調(diào)數(shù)據(jù)、算法和專業(yè)領(lǐng)域知識,從這個角度來說,數(shù)據(jù)科學(xué)的模型、編程和算法與金融業(yè)務(wù)乃至于投資理念的深度融合是價值所在。
(二)理解數(shù)據(jù)
數(shù)據(jù)科學(xué)是通過使用各種科學(xué)方法、算法和過程從大量數(shù)據(jù)中提取見解,整個過程的基礎(chǔ)就是數(shù)據(jù),這是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)區(qū)別的關(guān)鍵。金融投資基本上是以數(shù)據(jù)為基礎(chǔ)的,但金融市場數(shù)據(jù)越來越豐富,不僅包括交易、財(cái)務(wù)等結(jié)構(gòu)化的數(shù)據(jù),還包括公司公告、新聞媒體等非結(jié)構(gòu)化數(shù)據(jù),均被社會廣泛應(yīng)用。最重要的是反映規(guī)律的核心變量會因不同國家、不同市場、不同階段的異質(zhì)性而發(fā)生變化。因此,若想要充分了解數(shù)據(jù),特別是當(dāng)出現(xiàn)一些新現(xiàn)象或新規(guī)律時,需要有敏銳的數(shù)據(jù)或事件的敏感性。這也揭示了歷史數(shù)據(jù)和統(tǒng)計(jì)模型的缺陷。理解數(shù)據(jù)實(shí)際上最重要的是能力,單純依靠技術(shù)能夠解決的問題非常有限,通常情況下問題都是紛繁復(fù)雜,這時就需要專業(yè)分析來抽絲剝繭,選擇一個最有效或最擅長的工具解決。相信數(shù)據(jù)的價值的同時,不局限于某一特定的方法。數(shù)據(jù)科學(xué)在金融工程應(yīng)用背后的思維方式就是理解問題、相信數(shù)據(jù)、尊重需求。其中,理解數(shù)據(jù)是第一步。要想真正理解數(shù)據(jù)需要做到以下三方面,即數(shù)據(jù)的尺度問題,數(shù)據(jù)的業(yè)務(wù)背景,借助圖形協(xié)助數(shù)據(jù)的理解。
(三)構(gòu)建邏輯
鑒于金融業(yè)務(wù)和數(shù)據(jù)業(yè)務(wù)的學(xué)科知識屬性的差異,大部分使用數(shù)據(jù)科學(xué)的人通常都對業(yè)務(wù)不熟悉,沒有熟練掌握專業(yè)領(lǐng)域知識,因此,必須進(jìn)入一線對業(yè)務(wù)熟練掌握,形成數(shù)據(jù)的理解邏輯。此外,數(shù)據(jù)收集亦或是清洗均會存在偏差,而這些偏差會直接或者間接地影響模型中數(shù)據(jù)的輸入,從而帶來較大的風(fēng)險。針對這類問題計(jì)量中對理論基礎(chǔ)、因果邏輯的分析是關(guān)鍵,數(shù)據(jù)科學(xué)中還要求對業(yè)務(wù)數(shù)據(jù)和數(shù)據(jù)邏輯有深刻的理解。
三、數(shù)據(jù)科學(xué)在金融工程領(lǐng)域的發(fā)展歷程
通過文獻(xiàn)綜述研究,本文認(rèn)為金融發(fā)展離不開科技與金融的結(jié)合。隨著科技不斷發(fā)展,為現(xiàn)代金融業(yè)注入了新鮮血液,金融科技的歷史演進(jìn)大致分為三個階段。
四、數(shù)據(jù)科學(xué)在金融工程領(lǐng)域的發(fā)展趨勢
(一)從場景出發(fā)實(shí)現(xiàn)決策自動化
決策自動化是數(shù)據(jù)分析最理想的效果。若想在未來實(shí)現(xiàn)“千人千面”的個性化金融服務(wù)目標(biāo),數(shù)據(jù)處理的每個環(huán)節(jié),數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)探索、模型選擇、模型評估和模型輸出等都需要實(shí)現(xiàn)自動化。因此,數(shù)據(jù)分析正在逐步向高智能化方向邁進(jìn)?!翱萍贾挥新涞夭拍軐?shí)現(xiàn)價值”。因此,就金融應(yīng)用場景而言,數(shù)據(jù)科學(xué)技術(shù)的核心是人工智能和機(jī)器學(xué)習(xí),借助先進(jìn)的 AutoML 和 AutoDL 技術(shù)實(shí)現(xiàn)端到端的大數(shù)據(jù)解決方案。人工智能構(gòu)建門檻和智能數(shù)據(jù)應(yīng)用成本得到最大程度的降低,幫助金融業(yè)務(wù)實(shí)現(xiàn)人工智能應(yīng)用,增強(qiáng)行業(yè)競爭力?,F(xiàn)階段,數(shù)據(jù)科學(xué)在精準(zhǔn)營銷、信用風(fēng)險管理和量化投資研究等業(yè)務(wù)中得到了體現(xiàn),使金融業(yè)務(wù)對客戶在降低成本的同時提高其技術(shù)能力和服務(wù)價值。
(二)數(shù)據(jù)科學(xué)平臺輸出數(shù)據(jù)模型價值
在金融科技3.0階段,數(shù)據(jù)科學(xué)對金融的變革程度更加深遠(yuǎn)。以大數(shù)據(jù)、人工智能和區(qū)塊鏈等更為前沿的技術(shù)作為支撐,構(gòu)建以數(shù)據(jù)為核心且能夠適應(yīng)任何變化企業(yè)架構(gòu),金融企業(yè)才可以在激烈的市場競爭中賴以生存。數(shù)據(jù)科學(xué)平臺輸出的數(shù)據(jù)模型通??捎眯院涂山忉屝暂^強(qiáng),可用性主要是為了幫助客戶解決實(shí)際問題并投入到日常業(yè)務(wù)生產(chǎn)中??山忉屝灾饕菫榱藢⑺械臎Q策被解釋和說明,方便客戶理解。增強(qiáng)型分析、持續(xù)性智能和可解釋性人工智能勢必會成為未來數(shù)據(jù)分析技術(shù)領(lǐng)域的發(fā)展方向。
(三)數(shù)據(jù)科學(xué)團(tuán)隊(duì)的多層次發(fā)展
金融企業(yè)中的數(shù)據(jù)科學(xué)家更關(guān)注采用何種方法將技術(shù)應(yīng)用于金融場景之中,最終使得內(nèi)外部價值均實(shí)現(xiàn)最大化。從模型的角度出發(fā),金融企業(yè)的數(shù)據(jù)科學(xué)家更注重應(yīng)用級模型的構(gòu)建,與優(yōu)化學(xué)習(xí)算法相比,選擇特征和參數(shù)比最為重要。此外,數(shù)據(jù)準(zhǔn)備階段需要花費(fèi)大量的時間。金融企業(yè)的數(shù)據(jù)科學(xué)家更注重對行業(yè)的理解,而不是技術(shù)因素。如此,才可以真正對業(yè)務(wù)的困境和難點(diǎn)深入理解。企業(yè)級數(shù)據(jù)科學(xué)團(tuán)隊(duì)的組建,幫助金融公司向各級機(jī)構(gòu)提供多方位、多角度的數(shù)據(jù)科學(xué)服務(wù)。數(shù)據(jù)科學(xué)團(tuán)隊(duì)主要由三類人員構(gòu)成。第一類是業(yè)務(wù)分析和建模人員。他們同時兼顧傳統(tǒng)評分建模和業(yè)務(wù)分析模型設(shè)計(jì)能力,了解應(yīng)用場景,對業(yè)務(wù)需求有非常準(zhǔn)確的把握。第二類是擁有開發(fā)數(shù)據(jù)、執(zhí)行復(fù)雜網(wǎng)絡(luò)計(jì)算、實(shí)現(xiàn)數(shù)據(jù)產(chǎn)品和探索新算法能力的數(shù)據(jù)科學(xué)人士。第三類是具備全棧綜合能力的團(tuán)隊(duì)負(fù)責(zé)人,特別在大數(shù)據(jù)領(lǐng)域,可以同時具有橫向和縱向的研發(fā)與咨詢能力,對進(jìn)度和質(zhì)量進(jìn)行嚴(yán)格把控。
參考文獻(xiàn):
[1] Rachel Schutt, Cathy ONeil著,馮凌秉,王群鋒譯. 數(shù)據(jù)科學(xué)實(shí)戰(zhàn)[M].人民郵電出版社, 2015.
[2] 徐璐,盧小賓,盧瑤.金融科技產(chǎn)業(yè)創(chuàng)新發(fā)展與建議研究[J].中國軟科學(xué),2022(01):31-39.
[3] 貝勁松.金融基礎(chǔ)設(shè)施數(shù)據(jù)融合應(yīng)用實(shí)踐[J].中國金融,2021(03):54-55.
[4] 方陵生.新經(jīng)濟(jì)下的數(shù)據(jù)科學(xué)——第四次工業(yè)革命的數(shù)據(jù)科學(xué)人才戰(zhàn)爭[J].世界科學(xué),2020(04):41-43.56F4F5AB-917C-4A80-94D7-8D233EADB91E