楊凱森,付飛蚺
(1.浙江萬里學(xué)院 大數(shù)據(jù)與軟件工程學(xué)院,寧波 310000;2.長(zhǎng)春理工大學(xué) 人工智能學(xué)院,長(zhǎng)春 130022)
隨著互聯(lián)網(wǎng)、數(shù)字設(shè)備、物聯(lián)網(wǎng)和其他技術(shù)的發(fā)展,全球數(shù)據(jù)正在迅速增長(zhǎng)。大數(shù)據(jù)是更廣泛和深入的數(shù)字化,是整個(gè)社會(huì)內(nèi)部的數(shù)據(jù)互連。此外,大數(shù)據(jù)也被理解為解決問題的一種新方法,即通過收集,分類和分析與特定問題相關(guān)的海量數(shù)據(jù),通過實(shí)驗(yàn),算法和模型獲得有價(jià)值的信息,從而發(fā)現(xiàn)規(guī)律并從中獲利。大數(shù)據(jù)正在迅速發(fā)展為新一代的信息技術(shù)和服務(wù)格式,可以收集、存儲(chǔ)和分析大量分散來源和各種格式的數(shù)據(jù),并發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值并增強(qiáng)新功能。
金融業(yè)擁有最密集的數(shù)據(jù),包括客戶、運(yùn)營(yíng)、金融交易和監(jiān)管數(shù)據(jù),以及各種類型的衍生大數(shù)據(jù)[1]。據(jù)中國(guó)人民銀行統(tǒng)計(jì),僅2016年第三季度,全國(guó)銀行卡交易量3 303.40億筆,金額177.72萬億元,分別比上年增長(zhǎng)35.71%和2.65%[2]。同比銀行業(yè)金融機(jī)構(gòu)辦理電子支付交易364.88億筆,總金額519.69萬億元。非銀行支付機(jī)構(gòu)網(wǎng)上支付服務(wù)8 440.42億元,金額26.34萬億元。支付系統(tǒng)共處理交易額154.13億筆,交易總金額1 344.34萬億元。第三季度的業(yè)務(wù)量是全國(guó)GDP的 71 倍[3]。
因此,金融業(yè)具有實(shí)施大數(shù)據(jù)的基本條件。未來,金融大數(shù)據(jù)將應(yīng)用于精準(zhǔn)營(yíng)銷、客戶畫像、運(yùn)營(yíng)流程優(yōu)化、客戶關(guān)系管理、風(fēng)險(xiǎn)控制等領(lǐng)域。大數(shù)據(jù)時(shí)代將對(duì)整個(gè)科技產(chǎn)業(yè)乃至世界產(chǎn)生顛覆性影響,并將成為未來金融業(yè)的主導(dǎo)角色。但是,大數(shù)據(jù)技術(shù)及其應(yīng)用給金融監(jiān)管和金融安全帶來了嚴(yán)峻的挑戰(zhàn),對(duì)區(qū)域金融風(fēng)險(xiǎn)的監(jiān)測(cè)、預(yù)警和解決提出了更高的要求。
區(qū)域性金融風(fēng)險(xiǎn)是指在經(jīng)濟(jì)區(qū)域內(nèi),某些金融機(jī)構(gòu)或某些金融活動(dòng)在金融系統(tǒng)運(yùn)作中的不確定性造成的風(fēng)險(xiǎn)。它通過金融活動(dòng)中的經(jīng)濟(jì)實(shí)體傳播,導(dǎo)致區(qū)域金融環(huán)境的不穩(wěn)定或金融危機(jī)。區(qū)域性金融風(fēng)險(xiǎn)將擾亂該區(qū)域的經(jīng)濟(jì)和社會(huì)發(fā)展秩序,區(qū)域性金融風(fēng)險(xiǎn)的積累也將轉(zhuǎn)移到與經(jīng)貿(mào)關(guān)系密切的其他地區(qū),這將帶來國(guó)家金融風(fēng)險(xiǎn)并導(dǎo)致國(guó)家金融危機(jī),甚至世界金融危機(jī)。因此,建立科學(xué)可行的區(qū)域金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)是需要研究和探索的重要課題。
當(dāng)前,世界主要的區(qū)域金融預(yù)警系統(tǒng)如下:
(1)駱駝信用等級(jí)制度[4]。該系統(tǒng)主要評(píng)估銀行業(yè)務(wù)的整體運(yùn)營(yíng)狀況,例如銀行的運(yùn)營(yíng)和信用狀況,包括資本充足率、資產(chǎn)質(zhì)量、管理、收益、流動(dòng)性和市場(chǎng)風(fēng)險(xiǎn)敏感性,以及加權(quán)匯總后的整體評(píng)估??梢愿鶕?jù)駱駝等級(jí)直接了解銀行的風(fēng)險(xiǎn)狀況。
(2)金融部門評(píng)估計(jì)劃(FSAP)[5]。金融部門評(píng)估計(jì)劃主要用于評(píng)估各國(guó)金融體系的穩(wěn)定性,包括宏觀審慎指標(biāo)和綜合微觀審慎指標(biāo)。宏觀審慎指標(biāo)主要包括經(jīng)濟(jì)增長(zhǎng),通貨膨脹,利率等,綜合微觀審慎指標(biāo)包括資本充足率,盈利能力指數(shù),資產(chǎn)質(zhì)量指數(shù)等。作為評(píng)估項(xiàng)目的共同發(fā)起者,國(guó)際貨幣基金組織和世界銀行期望加強(qiáng)對(duì)成員國(guó)金融部門脆弱性的監(jiān)測(cè),減少發(fā)生金融危機(jī)的可能性。
(3)法國(guó)銀行業(yè)委員會(huì)的銀行分析支持系統(tǒng)[6](saaba)。Saaba通過匯總?cè)曛械膯蝹€(gè)潛在損失來獲得整個(gè)信貸組合的潛在總損失,并全面評(píng)估銀行體系的健康狀況。Saaba全面考慮了影響商業(yè)銀行運(yùn)作的所有方面,包括會(huì)計(jì)數(shù)據(jù),資產(chǎn)風(fēng)險(xiǎn)調(diào)查,股東質(zhì)量評(píng)估,企業(yè)信用等級(jí),銀行信用等級(jí),公司逃稅統(tǒng)計(jì)數(shù)據(jù),監(jiān)管數(shù)據(jù),國(guó)家風(fēng)險(xiǎn)等,希望能盡可能多地捕獲銀行運(yùn)營(yíng)的各種內(nèi)部和外部風(fēng)險(xiǎn)因素。
(4)荷蘭銀行(ABN AMRO)的風(fēng)險(xiǎn)分析支持工具[7](RAST)根據(jù)大小,中小型和大型的權(quán)重來評(píng)估銀行的各種風(fēng)險(xiǎn)和控制能力。將風(fēng)險(xiǎn)評(píng)估的結(jié)果與償付能力和獲利能力進(jìn)行比較,并將分析結(jié)果用于確定每個(gè)銀行的監(jiān)管實(shí)力。
國(guó)內(nèi)學(xué)者利用大數(shù)據(jù)來研究金融風(fēng)險(xiǎn),主要側(cè)重于統(tǒng)計(jì)結(jié)合計(jì)算機(jī)技術(shù)在金融行業(yè)的應(yīng)用。還有針對(duì)個(gè)別存貨案例的詳細(xì)指標(biāo)分析和預(yù)測(cè)模型的建立。更有影響力的研究證實(shí)了或有債權(quán)分析法[8](CCA)風(fēng)險(xiǎn)指數(shù)對(duì)我國(guó)系統(tǒng)性金融風(fēng)險(xiǎn)預(yù)警具有良好的適用性,為我國(guó)金融風(fēng)險(xiǎn)計(jì)量提供了良好的理論研究基礎(chǔ)。李志輝等人[9]基于風(fēng)險(xiǎn)依賴進(jìn)行了擴(kuò)展研究,實(shí)現(xiàn)了CCA方法的優(yōu)化。在金融風(fēng)險(xiǎn)預(yù)測(cè)方面,采用大數(shù)據(jù)技術(shù)建立預(yù)測(cè)模型,并通過股票市場(chǎng)歷史數(shù)據(jù)進(jìn)行實(shí)證分析。例如,本文討論了馬爾可夫鏈過程理論在證券市場(chǎng)中股票價(jià)格綜合指數(shù)的分析和預(yù)測(cè)模型中的應(yīng)用,討論了在大數(shù)據(jù)時(shí)代如何正確進(jìn)行股票投資,研究了由大數(shù)據(jù)時(shí)代產(chǎn)生的隨機(jī)變量。從大數(shù)據(jù),機(jī)器學(xué)習(xí)和行為金融的角度進(jìn)行股票投機(jī),并基于特定股票的歷史數(shù)據(jù)應(yīng)用相應(yīng)的算法實(shí)現(xiàn)預(yù)測(cè)功能。國(guó)內(nèi)也有一些學(xué)者研究用戶參與金融市場(chǎng)的影響。他們更傾向于研究投資者與金融新聞,在線論壇,微博和其他媒體之間的關(guān)系,表明它們可以在很大程度上影響證券市場(chǎng)。
在現(xiàn)有研究的基礎(chǔ)上,可以發(fā)現(xiàn)在研究股票宏觀市場(chǎng)趨勢(shì)以及基于國(guó)內(nèi)外大數(shù)據(jù)的相應(yīng)預(yù)測(cè)模型的生成方面取得了豐碩的成果。對(duì)于單個(gè)股票趨勢(shì)的分析和預(yù)測(cè)模型也進(jìn)行了微觀研究,而對(duì)相關(guān)參與者對(duì)金融市場(chǎng)影響的研究則較少。目前,大數(shù)據(jù)在中國(guó)各行各業(yè)的應(yīng)用已取得初步成果,某些領(lǐng)域的應(yīng)用已處于世界領(lǐng)先地位。其中,關(guān)于大數(shù)據(jù)與資本市場(chǎng)關(guān)系的研究也是金融市場(chǎng)的研究熱點(diǎn)。使用大數(shù)據(jù)建立用戶參與的預(yù)測(cè)模型對(duì)上市資本市場(chǎng)的總體影響基本上沒有影響。相關(guān)金融市場(chǎng)參與者的結(jié)構(gòu)分析(年齡,收入,教育背景),行為分析,交易量分析(網(wǎng)民和投資者),包括企業(yè)家,消費(fèi)者,互聯(lián)網(wǎng)用戶(包括移動(dòng)互聯(lián)網(wǎng)用戶,下同)和投資者等,本文以大數(shù)據(jù)源和用戶參與行為為觀察點(diǎn),基于用戶參與的角度以及大數(shù)據(jù)技術(shù)對(duì)財(cái)務(wù)風(fēng)險(xiǎn)的影響和預(yù)警系統(tǒng)的構(gòu)建,設(shè)計(jì)了用戶參與度評(píng)價(jià)系統(tǒng)和用戶參與度預(yù)測(cè)模型。預(yù)警系統(tǒng)可以有效降低金融風(fēng)險(xiǎn),防范金融風(fēng)險(xiǎn)。
(1)系統(tǒng)原則。區(qū)域金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)是用于監(jiān)視,預(yù)警和處置區(qū)域金融風(fēng)險(xiǎn)的系統(tǒng)。它必須涵蓋區(qū)域金融和經(jīng)濟(jì)活動(dòng)的所有方面,包括吸收和支付存款,發(fā)行和回收貸款,發(fā)行和轉(zhuǎn)讓證券,保險(xiǎn),信托,國(guó)內(nèi)和國(guó)際貨幣結(jié)算等;它應(yīng)該涵蓋所有類型的區(qū)域金融活動(dòng),包括銀行,保險(xiǎn),證券和信貸。它涵蓋區(qū)域金融活動(dòng)的所有參與者,包括中央銀行,金融機(jī)構(gòu),公司,企業(yè),公眾和監(jiān)管機(jī)構(gòu);它滲透到區(qū)域金融活動(dòng)的每個(gè)環(huán)節(jié),甚至基于金融的虛擬和信用性質(zhì),也必須考慮公眾輿論的趨勢(shì)。應(yīng)全面考慮國(guó)家和地區(qū)的宏觀經(jīng)濟(jì)運(yùn)行,經(jīng)濟(jì)社會(huì)發(fā)展和產(chǎn)業(yè)發(fā)展。
(2)及時(shí)性原則。區(qū)域金融活動(dòng)具有快速變化的特點(diǎn),區(qū)域金融風(fēng)險(xiǎn)變化非常快,要準(zhǔn)確可靠地進(jìn)行預(yù)警和保護(hù),就必須確保區(qū)域金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)具有良好的及時(shí)性,能夠及時(shí)識(shí)別和判斷風(fēng)險(xiǎn)因素。區(qū)域金融活動(dòng),預(yù)測(cè)和應(yīng)對(duì)區(qū)域金融風(fēng)險(xiǎn),并為監(jiān)管機(jī)構(gòu)提供控制區(qū)域金融風(fēng)險(xiǎn)的最有效方法。及時(shí)保留信息并留出足夠的時(shí)間和空間。
(3)可操作性原則。在數(shù)據(jù)收集和系統(tǒng)分析過程中,所選的社會(huì)經(jīng)濟(jì)指標(biāo),數(shù)據(jù)統(tǒng)計(jì)分析方法和系統(tǒng)建模過程應(yīng)易于操作和分析。
(4)靈活性原則。在預(yù)警系統(tǒng)的設(shè)計(jì)過程中,應(yīng)盡可能考慮量化指標(biāo),以利于后處理分析。應(yīng)建立一些定性指標(biāo),以反映定量指標(biāo)無法代表的區(qū)域金融運(yùn)作的潛在風(fēng)險(xiǎn)和不穩(wěn)定因素。對(duì)于定性指標(biāo),應(yīng)盡量減少人為因素的誤導(dǎo),對(duì)定性指標(biāo)進(jìn)行清晰的描述和明確的判斷標(biāo)準(zhǔn),以確保評(píng)價(jià)結(jié)果的客觀性和準(zhǔn)確性。同時(shí),在保證金融體系正常運(yùn)行的前提下,隨著時(shí)間的流逝以及社會(huì)經(jīng)濟(jì)的變化,預(yù)警系統(tǒng)不斷更新,完善和完善,以確保不同領(lǐng)域的獨(dú)立運(yùn)作。預(yù)警系統(tǒng)的模塊,以提高系統(tǒng)的穩(wěn)定性和可靠性。
在有效市場(chǎng)假設(shè)下,金融市場(chǎng)的風(fēng)險(xiǎn)信息反映在股價(jià)走勢(shì)中。股票價(jià)格變動(dòng)中包含的信息不僅有價(jià)值,而且及時(shí)準(zhǔn)確。因此,我們可以圍繞股票價(jià)格對(duì)區(qū)域金融和金融機(jī)構(gòu)進(jìn)行實(shí)證研究。本研究使用數(shù)據(jù)爬蟲技術(shù)收集數(shù)據(jù)源(Internet上的大數(shù)據(jù)),并使用全球GDP和增長(zhǎng)率,中國(guó)A股上證綜合指數(shù)(A本文借助SPSS分析了金融市場(chǎng)的相關(guān)參與者)并構(gòu)建金融風(fēng)險(xiǎn)預(yù)警系統(tǒng),在人類活動(dòng)中,往往是由人為因素引發(fā)的各種大事件,面對(duì)利益,尤其是風(fēng)險(xiǎn)資本,各種人類需求,思想,情感,游戲金融風(fēng)險(xiǎn)事件中有政府層面,經(jīng)濟(jì)狀況等因素,但公眾參與也是觸發(fā)系統(tǒng)風(fēng)險(xiǎn)的主要組成部分。資本市場(chǎng)交易,盡管已經(jīng)出現(xiàn)了自動(dòng)交易軟件,但核心仍然是人,因此,對(duì)用戶參與者評(píng)價(jià)系統(tǒng)的研究尚需時(shí)日圍繞網(wǎng)民,投資者,企業(yè)家,消費(fèi)者和其他方面。大數(shù)據(jù)對(duì)金融研究的影響通常是多方面的。二級(jí)用戶企業(yè)家,消費(fèi)者等相關(guān)指標(biāo)在一定程度上反映了金融市場(chǎng)的投資收益和風(fēng)險(xiǎn)預(yù)期。首先對(duì)相關(guān)影響因素進(jìn)行綜合分析,然后建立一定的評(píng)價(jià)體系,然后對(duì)指標(biāo)進(jìn)行加權(quán)。
(1)相關(guān)性分析:通過趨勢(shì),交易量,中國(guó)A股上證指數(shù)幅度變化與用戶規(guī)模,用戶結(jié)構(gòu),用戶行為相關(guān)性分析,多層次分析。
(2)評(píng)估指標(biāo)的確定:首先是用戶數(shù)和一個(gè),然后,根據(jù)用戶在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)上的橫向行為,例如搜索引擎,網(wǎng)絡(luò)新聞,微博,社交網(wǎng)站,網(wǎng)上炒股等,等等,并結(jié)合東方財(cái)富,通化順,和訊等中國(guó)權(quán)威金融網(wǎng)站,根據(jù)用戶在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)(例如搜索引擎)上的橫向行為來選擇影響資本市場(chǎng)交易的指標(biāo)。在線新聞,微博,社交網(wǎng)站,在線炒股等以人次和有效瀏覽時(shí)間等垂直行為為指標(biāo)建立的基礎(chǔ)。最后,根據(jù)網(wǎng)民和投資者的溝通,情感,預(yù)測(cè)和賭博心理,建立用戶風(fēng)險(xiǎn)指標(biāo)。詳細(xì)指標(biāo)如表1和圖1所示。
表1 用戶參與評(píng)價(jià)體系指標(biāo)
圖1 用戶行為圖
(3)數(shù)據(jù)的獲取和標(biāo)準(zhǔn)化:使用網(wǎng)絡(luò)爬蟲技術(shù)(詳細(xì)信息請(qǐng)參見下面的數(shù)據(jù)收集算法)收集用戶參與評(píng)價(jià)系統(tǒng)的各種指標(biāo)數(shù)據(jù)資料,互聯(lián)網(wǎng)用戶與投資者之間的統(tǒng)計(jì)差距以及統(tǒng)計(jì)方法的不一致等。,需要對(duì)其進(jìn)行更正以提供標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行分析,包括以下內(nèi)容:以日,周,月,季度等為單位的收集過程的統(tǒng)計(jì)周期。結(jié)果表明,開始和結(jié)束之間存在時(shí)間差。統(tǒng)計(jì)結(jié)束時(shí),部分采集的數(shù)據(jù)丟失,需要人工判斷統(tǒng)計(jì)結(jié)果的累加或平均值。
用戶權(quán)重,用戶結(jié)構(gòu)和用戶行為可以通過數(shù)據(jù)分析和統(tǒng)計(jì)軟件進(jìn)行初步確定,而溝通,情感,預(yù)測(cè),賭博心理等用戶風(fēng)險(xiǎn)指標(biāo)和其他用戶風(fēng)險(xiǎn)指標(biāo)難以通過統(tǒng)計(jì)數(shù)據(jù)確定,則權(quán)重由專家評(píng)分方法確定。具體工作過程如下。
通過方差(公式1)測(cè)試,包括水平方差(公式2)和組內(nèi)方差(公式2),根據(jù)數(shù)據(jù)的穩(wěn)定性篩選了不必要的分析指標(biāo),例如用戶的年齡變化趨勢(shì)。表達(dá)公式如下。
其中,n是統(tǒng)計(jì)數(shù)據(jù)的數(shù)量,μ是n個(gè)統(tǒng)計(jì)數(shù)據(jù)的平均值,σrow是級(jí)別或不同組之間的方差,σcol是同一級(jí)別或同一組內(nèi)的方差。根據(jù)三類指標(biāo)的數(shù)量與一類指標(biāo)的關(guān)系,根據(jù)2000年至2017年的數(shù)據(jù)計(jì)算單位間隔內(nèi)的頻次或數(shù)量,并不斷累加。根據(jù)數(shù)據(jù)分布圖(散點(diǎn)圖)和MATLAB軟件,推導(dǎo)了數(shù)據(jù)與指標(biāo)之間的函數(shù)關(guān)系。數(shù)據(jù)擬合后,將出現(xiàn)高階多項(xiàng)式函數(shù),但是該函數(shù)不利于圖檢驗(yàn),并且不容易確定數(shù)據(jù)是正相關(guān)還是負(fù)相關(guān)。因此,有必要將趨勢(shì)修改和模擬為低階和極項(xiàng)函數(shù)。具體操作步驟如下:
(1)Matlab的一階函數(shù):polyfit(xdata,ydata,1),xdata和ydata分別表示第三級(jí)和第一級(jí)指標(biāo)的數(shù)據(jù)(以數(shù)組的形式,它們按時(shí)間順序成對(duì)出現(xiàn))
(2)精度(P):擬合數(shù)據(jù)和原始數(shù)據(jù)對(duì)應(yīng)點(diǎn)的誤差的平方和。本研究假設(shè)誤差平方和的精度在0.1以內(nèi),其公式如下:
其中,yi是實(shí)際值,y?i是擬合后的函數(shù)值。P的值越接近0,則擬合函數(shù)的可行性越高,數(shù)據(jù)預(yù)測(cè)就越成功。
根據(jù)統(tǒng)計(jì)數(shù)據(jù),以用戶行為為中介變量,由用戶規(guī)模和用戶結(jié)構(gòu)構(gòu)成用戶行為的影響基礎(chǔ),用戶行為是用戶風(fēng)險(xiǎn)的最直接指標(biāo),從而建立影響力。用戶參與評(píng)估系統(tǒng)的路徑(如圖2所示)。用戶參與評(píng)估系統(tǒng)的影響路徑和用戶參與評(píng)估系統(tǒng)將作為構(gòu)建用戶參與模型的基礎(chǔ)。
圖2 用戶參與評(píng)價(jià)體系影響路徑分析
在用戶參與評(píng)價(jià)體系的基礎(chǔ)上,通過對(duì)用戶參與影響路徑的分析,建立了大數(shù)據(jù)用戶參與模型,以降低大背景下用戶不合理交流,情緒行為,不科學(xué)預(yù)測(cè)和賭博心理的風(fēng)險(xiǎn)。通過用戶數(shù)量的影響,用戶結(jié)構(gòu)和用戶群體行為的各種數(shù)據(jù)分析來進(jìn)行數(shù)據(jù)分析;另一方面,該模型使用機(jī)器。學(xué)習(xí)算法提供波動(dòng)預(yù)測(cè),趨勢(shì)預(yù)測(cè),行為預(yù)測(cè)等,以減少劇烈波動(dòng)的可能性。具體模型如圖3所示。
圖3 大數(shù)據(jù)用戶參與模型
衍射峰強(qiáng)金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)的功能包括數(shù)據(jù)采集系統(tǒng),數(shù)據(jù)庫(kù)系統(tǒng)和預(yù)警系統(tǒng)“數(shù)據(jù)對(duì)話”,利用數(shù)據(jù)挖掘技術(shù)建立有價(jià)值的數(shù)據(jù)庫(kù),然后通過機(jī)器學(xué)習(xí)算法設(shè)計(jì)預(yù)警跟蹤和偏差修正等。,整個(gè)過程以數(shù)據(jù)為中心,基于大數(shù)據(jù)的金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)的具體框架如圖4所示。
圖4 大數(shù)據(jù)下金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)框架
(1)采集系統(tǒng):由于金融風(fēng)險(xiǎn)預(yù)警系統(tǒng)的相關(guān)指標(biāo)數(shù)據(jù)包含非結(jié)構(gòu)化數(shù)據(jù),難以在Internet上進(jìn)行收集,清理和分析,并且往往需要人工干預(yù),因此需要將爬蟲技術(shù)和掃描監(jiān)控技術(shù)相結(jié)合。全面的數(shù)據(jù)收集和風(fēng)險(xiǎn)預(yù)測(cè)是全面的數(shù)據(jù)收集和風(fēng)險(xiǎn)預(yù)測(cè)的基礎(chǔ)。
(2)數(shù)據(jù)庫(kù)系統(tǒng):通過采集系統(tǒng)獲得的數(shù)據(jù)仍需要進(jìn)一步分析,不僅需要數(shù)據(jù)挖掘技術(shù)的支持,還需要大數(shù)據(jù)分析的手段。數(shù)據(jù)庫(kù)系統(tǒng)是預(yù)警系統(tǒng)的核心。預(yù)警模型相關(guān)指標(biāo)的分類和匯總在數(shù)據(jù)庫(kù)系統(tǒng)中完成。數(shù)據(jù)庫(kù)系統(tǒng)的完善直接影響機(jī)器學(xué)習(xí)的預(yù)測(cè)能力。
(3)預(yù)警系統(tǒng):預(yù)警報(bào)告主要以指標(biāo)臨界值和預(yù)警間隔的形式顯示。在確定風(fēng)險(xiǎn)分析和預(yù)測(cè)分析之后,形成預(yù)警報(bào)告。同時(shí),對(duì)預(yù)警系統(tǒng)是否與實(shí)際需求進(jìn)行實(shí)證跟蹤相結(jié)合,分析預(yù)測(cè)結(jié)果偏離的原因,并改進(jìn)相關(guān)算法,以提高機(jī)器學(xué)習(xí)系統(tǒng)的預(yù)測(cè)功能,縮小兩者之間的差距。隨后的預(yù)測(cè),并提高了預(yù)警系統(tǒng)的準(zhǔn)確性和科學(xué)性。
根據(jù)互聯(lián)網(wǎng)發(fā)展報(bào)告,中國(guó)互聯(lián)網(wǎng)用戶規(guī)模發(fā)展迅速,2018年已接近8億,互聯(lián)網(wǎng)普及率從不到3%增長(zhǎng)到近60%。同時(shí),由于智能手機(jī),3G和4G的發(fā)展,隨著通信技術(shù)的迅速發(fā)展,移動(dòng)互聯(lián)網(wǎng)用戶也從2006年的1 300萬(受統(tǒng)計(jì)數(shù)據(jù)限制,2006年之前沒有相關(guān)數(shù)據(jù))迅速增長(zhǎng)到7.5億(2017年12月),其中2007年至2012年的年增長(zhǎng)率超過100%。同時(shí),根據(jù)中登集團(tuán)發(fā)布的數(shù)據(jù),2000年參加A股股票的投資者數(shù)量為6 154萬(同年增加1 343萬)。2002年,由于大量的不定期清算,年底的投資者數(shù)量為6 841萬,到2018年已達(dá)到13 863萬(開戶數(shù)量已超過1.7億,部分分離的投資者無效)。
從投資者數(shù)量和互聯(lián)網(wǎng)用戶(包括移動(dòng)互聯(lián)網(wǎng)用戶)數(shù)量的角度來看,用戶參與的數(shù)量巨大,投資者和網(wǎng)民的行為將產(chǎn)生大量數(shù)據(jù),互聯(lián)網(wǎng)用戶的行為的訪問,轉(zhuǎn)載和傳播大大增加?;诖髷?shù)據(jù)的群體行為,例如用戶參與結(jié)構(gòu)分析,注意力,情緒反應(yīng)等,對(duì)股票的上海股票指數(shù)具有重大影響。
宏索引統(tǒng)計(jì)和分析算法。宏觀分析采用的是A股主板市場(chǎng)的滬市指數(shù)(因?yàn)閯?chuàng)業(yè)板還不成熟,漲跌幅度太大,容易產(chǎn)生偏見)。收集樣品。從1999年至2018年,A股上海股票指數(shù)獲得的分析信息包括收盤價(jià),最高價(jià),最低價(jià),開盤價(jià),前收盤價(jià),漲跌幅,漲跌幅,交易量,交易量等。A股(上證指數(shù))指數(shù)的統(tǒng)計(jì)過程如表3所示。統(tǒng)計(jì)期間為當(dāng)年首個(gè)交易日至當(dāng)年最后一個(gè)交易日(2018年除外),統(tǒng)計(jì)結(jié)果為如表2和表3所示。
根據(jù)不同指標(biāo)之間的定量關(guān)系,形成了大數(shù)據(jù)訓(xùn)練集。以A股(上證指數(shù))指數(shù)為ydata(不同的區(qū)間幅度和交易量),導(dǎo)入不同組的指數(shù)數(shù)據(jù)xdata(包括用戶量,用戶結(jié)構(gòu),用戶行為等),然后擬合計(jì)算每組指標(biāo),并提供數(shù)據(jù)規(guī)則以進(jìn)行基本分析。
表2 A股(上證指數(shù))指標(biāo)統(tǒng)計(jì)過程
表3 A股(上證指數(shù))指標(biāo)統(tǒng)計(jì)結(jié)果
用戶參與模型相關(guān)性分析測(cè)試。在用戶參與模型中,指標(biāo)之間的定量關(guān)系根據(jù)年度變化具有連續(xù)變量之間的相關(guān)性。因此,本研究使用乘積差異相關(guān)系數(shù)(也稱為皮爾遜系數(shù)),可以直接篩選出具有高相關(guān)性的指標(biāo),并進(jìn)一步從高相關(guān)性指標(biāo)中進(jìn)行分析,以驗(yàn)證模型的預(yù)測(cè)功能并計(jì)算公眾利益。
式中,x和y是用戶參與模型中的不同指標(biāo)。y與ydata相同。取A股(上證指數(shù))指數(shù)數(shù)據(jù)(區(qū)間波動(dòng)幅度和交易量不同),r為兩個(gè)指標(biāo)之間的相關(guān)性。指標(biāo)選擇的依據(jù)如表7所示。由于某些指標(biāo)缺乏數(shù)據(jù)收集,在年度統(tǒng)計(jì)中,使用相對(duì)完整的數(shù)據(jù)間隔進(jìn)行相關(guān)分析,并獲得高度相關(guān)的分析。
根據(jù)用戶年齡統(tǒng)計(jì),各個(gè)年齡段的趨勢(shì)變化不明顯,但30歲以下的網(wǎng)民和投資者不成熟的比例較大。這群人很容易受到網(wǎng)絡(luò)媒體等信息的影響,甚至被誤導(dǎo),然后傳播不當(dāng)?shù)男畔?,這更有可能導(dǎo)致信息偏差和市場(chǎng)動(dòng)蕩。
從教育背景的角度來看,不同學(xué)歷的比例是不穩(wěn)定的。投資者的文化程度往往較高,而低文化程度的比例正在下降。高等教育對(duì)股票市場(chǎng)的影響主要包括兩個(gè)方面:一是研究更深入,信息搜索更有效,投資更加謹(jǐn)慎。二是更加科學(xué)的投資手段,大數(shù)據(jù)和自動(dòng)交易軟件的應(yīng)用率正在提高。
從用戶行為分析結(jié)果看,金融事件與股市波動(dòng)性(幅度)具有很強(qiáng)的相關(guān)性,尤其是在負(fù)信息的下降趨勢(shì)中,其幅度將隨著金融事件的傳播而不斷增加,并產(chǎn)生搜索指標(biāo)通過用戶也將擴(kuò)大。
顯然,政治,金融,軍事,流行等事件在不同國(guó)家的感染程度不同,影響力的差異主要在于用戶參與事件傳播引起的風(fēng)險(xiǎn)傳染等主要因素。因此,在一定時(shí)間內(nèi)適當(dāng)引導(dǎo)各種金融事件引起用戶的關(guān)注,可以有效地控制和預(yù)防金融風(fēng)險(xiǎn)的發(fā)生和擴(kuò)大。