国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

P2P網(wǎng)貸出借人投資行為影響因素研究

2018-04-04 01:58:45金穎婕
關(guān)鍵詞:信用等級借款人決策樹

宋 華,金穎婕

(武漢理工大學(xué) 管理學(xué)院,湖北 武漢 430070)

P2P(peer to peer)網(wǎng)貸是一種以點對點形式進行的互聯(lián)網(wǎng)民間借貸模式。近年來,互聯(lián)網(wǎng)金融的發(fā)展勢頭越來越強勁,P2P憑借其低門檻、方便快捷的特性受到了人們的熱捧。在我國缺少資金實力的中小企業(yè)普遍存在融資難的問題,成為企業(yè)發(fā)展滯緩的主要因素之一,所以P2P信貸的產(chǎn)生從某種程度上來說是個人和中小企業(yè)的福音。對于這種金融脫媒的信貸渠道,很大程度上加快了金融資本的流動速度,緩解了企業(yè)融資壓力,從而促進了企業(yè)與國家經(jīng)濟的發(fā)展。然而,由于出借人與借款人之間存在的信息不對稱而產(chǎn)生逆向選擇,使得許多本可以成交的融資活動以失敗告終。筆者將探討影響出借人投資意愿的因素以期提高借貸成功率。另外,由于相關(guān)學(xué)術(shù)研究起步較晚,監(jiān)管體系不夠健全,因此對于P2P網(wǎng)絡(luò)借貸市場進行研究有著重要的意義。

1 文獻綜述

國外對于網(wǎng)絡(luò)信貸研究起步較早,網(wǎng)絡(luò)信貸行為影響因素的文獻也較多。FREEDMAN等[1]利用Prosper平臺上2006年6月至2008年7月的數(shù)據(jù)進行研究,發(fā)現(xiàn)隨著Prosper平臺的不斷發(fā)展和改善,要求借款人提供的信用信息更加詳細,出借人的逆向選擇程度有所減輕,從而促進借款成功率的提高。LIN等[2]研究表明借款人的信用等級、社交網(wǎng)絡(luò)影響著其借款成功率。IYER等[3]指出,出借人會根據(jù)借款人豐富的硬信息和軟信息評判借款人的信用表現(xiàn)。HERZENSTEIN等[4]通過對人口特征、經(jīng)濟實力和努力程度等變量的分析,發(fā)現(xiàn)種族、性別因素對于融資成功率的影響遠小于經(jīng)濟實力和努力程度的影響。POPE等[5]不僅分析出各影響因素及其不同取值產(chǎn)生的影響大小,還指出年齡與借款成功率成反比。由于國外擁有健全的征信系統(tǒng),出借人對于信用等級的信任程度遠大于國內(nèi)出借人,不同的金融市場背景也會對研究結(jié)果產(chǎn)生影響,因此國內(nèi)的研究對于筆者更具有參考價值。但國內(nèi)的研究起步較晚,早期研究主要是闡述P2P存在的風(fēng)險及監(jiān)管模式。近年來,已有較多學(xué)者對網(wǎng)絡(luò)信貸行為進行研究。如董梁等[6]利用社會網(wǎng)絡(luò)分析法對P2P網(wǎng)絡(luò)借貸領(lǐng)域的研究現(xiàn)狀和發(fā)展階段進行分析,認為P2P網(wǎng)貸研究已逐漸成為學(xué)術(shù)界關(guān)注的熱點。宋文[7]研究表明,網(wǎng)貸行為最重大的影響因素是P2P平臺的抵押擔(dān)保信息和借款人的信用信息,極大程度上影響了借款成功率和融資成本。王會娟等[8-9]認為線上與線下相結(jié)合的信用認證機制能夠提高融資成功率,降低借貸雙方的信息不對稱性;且不同的人格特征會對信貸行為產(chǎn)生不同程度的影響。從上述文獻可以發(fā)現(xiàn),以借款人詳細的個人信息作為影響因素進行研究是必要的。在借款人信息中,不同信息的影響強弱均有差別,同時在研究內(nèi)容上更趨向于精細化。

現(xiàn)有的研究中,主要使用計量模型對影響因素進行建模,而筆者采用數(shù)據(jù)挖掘的方法進行分析,避免了傳統(tǒng)量化研究中的先驗假設(shè),不需要理性人假設(shè)以及變量的優(yōu)先級,僅利用行為數(shù)據(jù)進行挖掘,這在研究不足的探索性問題上有更強的適用性[10]。

2 研究方法

2.1 樣本選擇與變量定義

筆者選擇人人貸網(wǎng)站的數(shù)據(jù)作為樣本。人人貸建立于2010年5月,是國內(nèi)P2P平臺的領(lǐng)軍者之一,并且人人貸的借貸人的信息披露較為完善,數(shù)據(jù)豐富。筆者隨機選取了不同時間段的散標(biāo)投資數(shù)據(jù),利用Gooseeker網(wǎng)絡(luò)爬蟲軟件,對網(wǎng)頁中的主要借貸數(shù)據(jù)進行采集。初始樣本為1 488個,剔除有缺失值的樣本數(shù)據(jù)后,最終樣本為1 440個。選取的變量主要可以分成兩大類:標(biāo)的信息和借款人信息。篩選后的具體變量如表1所示。

表1 變量定義

對數(shù)據(jù)進行了如下處理:對某些數(shù)值型變量的類型進行處理,將信用評分按照網(wǎng)站的信用評級機制進行處理,分為AA,A,B,C,D,E,HR 7個等級;對連續(xù)性變量進行分箱處理;對二分類型變量進行0-1化處理。將散標(biāo)狀態(tài)作為目標(biāo)變量,即“成交”變量,其中已流標(biāo)的樣本散標(biāo)狀態(tài)記為0,成交的記為1。選取65%的樣本數(shù)據(jù)作為訓(xùn)練集,35%作為測試集。

2.2 研究模型建立

由于所采集的樣本變量中含有許多分類變量,用一般的計量模型時需要對這些變量進行轉(zhuǎn)化,而決策樹算法、貝葉斯網(wǎng)絡(luò)可以直接對分類變量進行有效分析,因此作為首選模型。筆者嘗試利用C5.0決策樹算法、貝葉斯網(wǎng)絡(luò)得出的結(jié)果進行綜合分析,并得出最終結(jié)論。

2.2.1C5.0決策樹算法

C5.0決策樹算法用于建立多叉的分類樹,要求輸入變量為數(shù)值型或分類型,輸出變量為分類型。其原理是通過比較信息增益率大小,選擇信息增益率最大者作為最佳分組變量。

信息增益率是在信息增益的基礎(chǔ)上得到的,而信息增益又是通過信息熵進行計算的。信息熵表示信息量的期望值,是在信息未知情況下的平均不確定性,即先驗熵。其數(shù)學(xué)表達式為:

(1)

當(dāng)信宿收到vj后獲得的對信號U的信息度量值,即后驗熵。其數(shù)學(xué)表達式為:

Ent(U|V)=

(2)

其中,P(ui|vj)表示在已知vj信息的條件下,ui信號產(chǎn)生的概率。信息增益反映了收到信息后所消除的不確定性,記為Gains(U,V)。

Gains(U,V)=Ent(U)-Ent(U|V)

(3)

為消除類別數(shù)目所帶來的影響,C5.0引入信息增益率作為選擇標(biāo)準(zhǔn)。其數(shù)學(xué)表達式為:

GainsR(U,V)=Gains(U,V)/Ent(V)

(4)

因此,信息增益率最大說明增加此信息可以消除信宿對信源的不確定性最大,因此將該變量作為最佳分組變量,同時也說明該變量對信宿影響最大。對于數(shù)值型變量,通常是先進行分箱處理,再根據(jù)以上步驟進行判斷。同時,為了防止出現(xiàn)過度擬合的現(xiàn)象,對C5.0決策樹進行修剪,通過設(shè)置置信度來確定決策樹的深度。

2.2.2貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)利用概率的思想計算后驗概率,比較在不同已知條件下目標(biāo)變量發(fā)生的概率,從中選擇概率最大的作為最具影響力的變量。貝葉斯公式,則有:

P(y|x1,x2,…,xn)=

(5)

式中:x1,x2,…,xn為輸入變量X1,X2,…,Xn對應(yīng)的一個取值集合;y為輸出變量。另外,式(5)成立的前提為輸入變量之間有條件獨立,即:

(6)

將式(6)代入式(5)中,可得后驗概率為:

P(y|x1,x2,…,xn)=

(7)

在對測試集數(shù)據(jù)的輸出變量進行預(yù)測時,可利用訓(xùn)練集中的相關(guān)變量取值集的后驗概率大小來預(yù)測最終結(jié)果。然而,貝葉斯網(wǎng)絡(luò)的假設(shè)前提要求各輸入變量相互獨立,使其不適用于許多實際情況。由于輸入變量間可能存在依賴性,因此概率乘法公式為:

P(x1,x2,…,xn)=P(x1)P(x2|x1)·

P(x3|x1,x2)…P(xn|x1,x2,…,xn-1)

(8)

因為當(dāng)變量之間相互獨立時,P(xi|x1,x2,…,xi-1)=P(xi),所以,只要確定哪些變量之間有依賴性,即可將變量之間相互獨立的條件概率簡化。貝葉斯網(wǎng)絡(luò)圖能夠更直接地觀測各輸入變量之間的關(guān)聯(lián)性并簡化計算。馬爾科夫毯網(wǎng)絡(luò)是貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的一種,其構(gòu)建方式主要是利用條件獨立性檢驗,筆者采用條件對數(shù)似然率檢驗的方法。對數(shù)似然率檢驗的原假設(shè)(H0)為變量Xi和變量Xj獨立。采用的檢驗統(tǒng)計量為:

(9)

在原假設(shè)成立時,檢驗統(tǒng)計量服從(|Xi|-1)×(|Xj|-1)個自由度的卡方分布。若檢驗統(tǒng)計量對應(yīng)的概率小于指定的顯著性水平,則拒絕原假設(shè),并刪除對應(yīng)變量節(jié)點間的連接弧線。馬爾科夫毯網(wǎng)絡(luò)并不要求輸出變量必須是所有輸入變量的父節(jié)點,因此適合于筆者所研究的樣本情況。

3 實證研究與分析

3.1 實驗結(jié)果

利用SPSS Modeler軟件建立上述模型,從誤差和收益兩個方面對模型質(zhì)量進行評估。表2所示為C5.0決策樹模型和馬爾科夫毯網(wǎng)絡(luò)模型的誤差分析,分別記錄了訓(xùn)練樣本集和測試樣本集的正確率和錯誤率。

表2 C5.0決策樹模型和馬爾科夫毯網(wǎng)絡(luò)模型預(yù)測結(jié)果

從各模型預(yù)測結(jié)果的正確率來看,C5.0決策樹和馬爾科夫毯網(wǎng)絡(luò)所構(gòu)建模型的整體預(yù)測精度均較為理想。圖1所示為不同模型的收益圖,可以直觀地看出這兩個模型的累計散點圖十分接近最優(yōu)模型線。因此,筆者選擇通過C5.0決策樹與馬爾科夫毯網(wǎng)絡(luò)所得出的預(yù)測變量重要性的結(jié)果來分析出借人意愿的影響因素,可信度較高。

3.1.1C5.0決策樹結(jié)果分析

當(dāng)輸入輸出變量均為分類型時,利用卡方檢驗方法中的似然比卡方預(yù)測變量重要性;當(dāng)輸入變量為數(shù)值型、輸出變量為分類型時,利用方差分析法預(yù)測變量重要性,再自動計算對應(yīng)的1-p,在此基礎(chǔ)上進行轉(zhuǎn)換得到一個相對值,將第i個輸入變量的重要性定義為:

(10)

圖2所示為運用C5.0決策樹算法計算得出的各影響因素的重要性,可以看出保障方式、信用等級、利率是眾多變量中較為重要的影響借款成功的因素。其形成的決策樹如圖3所示,其中根結(jié)點“是”表示成交,“否”表示流標(biāo)。

圖1 C5.0決策樹模型與馬爾科夫毯網(wǎng)絡(luò)模型收益圖

圖2 C5.0決策樹得出的預(yù)測變量重要性

圖3 借款成功決策樹

3.1.2馬爾科夫毯網(wǎng)絡(luò)結(jié)果分析

運用馬爾科夫毯網(wǎng)絡(luò)分析各影響因素的重要性,如圖4所示。其中預(yù)測變量重要性的測度指標(biāo)是輸入、輸出變量獨立性檢驗的1-p,經(jīng)歸一化處理后的結(jié)果。

圖4 馬爾科夫毯網(wǎng)絡(luò)得出的預(yù)測變量重要性

從圖4可以得出,保障方式、利率和還款期限是所有解釋變量中最重要的。標(biāo)的信息的重要性更加凸顯,出借人對于標(biāo)的信息的偏好也更趨于一致性。另外,由于P2P網(wǎng)貸市場的開放性和低門檻性,出借人的背景、價值取向也是多種多樣的,因此不同價值取向的出借人表現(xiàn)出對借款人信息的不同偏好。

3.2 影響因素分析

出借人對于標(biāo)的信息的偏好更趨于一致性,但對借款人信息的信賴程度不同,整體上標(biāo)的信息比借款人信息對出借人的決策影響略強。筆者主要對重要性程度高的因素進行分析。

3.2.1標(biāo)的信息的影響

(1)保障方式。保障方式是所有因素中最能影響出借人出借意愿的。用戶利益保障機制是人人貸網(wǎng)站為保護出借人的共同利益而建立的信用風(fēng)險承擔(dān)機制,取代了以前的本金制度。與本金保障相比,用戶利益保障機制增加了合作機構(gòu)保障的內(nèi)容,對于信用等級較低的借款人保證金計提比例提高了0.5個百分比,這說明了用戶利益保障機制增強了保障力度。由此可見,人人貸網(wǎng)站保障力度的提高有助于借款成功率的提升,出借人對于保障力度強的借款出借意愿更強。

(2)利率。出借人傾向于選擇利率介于10%~13%之間的散標(biāo),過低或過高的利率都更容易流標(biāo)。由此可見,大多數(shù)出借人是較為理性的,對于風(fēng)險的把握較為穩(wěn)妥。

(3)還款期限。出借人更傾向于還款期限較長的散標(biāo),對于期限為3個月、6個月的這種短期借款出借意愿不強。

3.2.2借款人信息的影響

(1)成功借款數(shù)。出借人也十分重視借款人的歷史成功借款記錄,成功借款次數(shù)越多,所獲得的借款成功的概率就越大。

(2)信用等級。信用等級與成交狀態(tài)散點圖分布如圖5所示(為避免樣本重疊,筆者設(shè)置圖形顯示方式為點散開),可以看出信用等級與借貸成功率并不完全呈正相關(guān)關(guān)系,反映出出借人對于信用等級高的借款人的認可度不一,但信用等級低普遍會給出借人帶來不好的印象。這與國外許多文獻中認為的信用等級越高,其借款成功率越高的結(jié)論不符。主要原因在于國外的征信系統(tǒng)十分完善,投資者對于信用等級的真實性較為相信,而中國征信系統(tǒng)尚不完善并且筆者研究的信用等級是網(wǎng)站根據(jù)借款人在該網(wǎng)站上的信息進行評分得出的,并不能全面真實地反映借款人的信用情況,因此,出借人對其認可度不一。根據(jù)信任理論,信賴度的提升能夠降低交易成本,保證交易過程的順利進展[11],因此提高信用等級的信賴度對于提高借款成功率很有幫助。

圖5 信用等級與成交狀態(tài)散點圖分布

(3)學(xué)歷。學(xué)歷與借款成功率呈正相關(guān)關(guān)系,研究生或以上、本科、大專、高中或以下4類借貸人的成交率分別為88.9%、82.5%、80.0%、56.6%,學(xué)歷為高中及以下的人群成交率最低。

4 結(jié)論

筆者利用數(shù)據(jù)挖掘技術(shù)從標(biāo)的信息和借款人信息兩個方面研究了P2P網(wǎng)貸出借人行為的影響因素,最終得出結(jié)論,認為出借人對于標(biāo)的信息的偏好更趨于一致,其中保障方式、利率、還款期限對于投資者出借意愿的影響較大。出借人更偏好保障度高、利率適中、還款期限較長的借款。在借款人信息中,信用等級、歷史借款信息、學(xué)歷、收入等因素都會影響出借人的出借行為,但年齡、婚姻對于出借人影響不顯著。高學(xué)歷、歷史成功借款數(shù)多的借款人更容易獲得借款,信用等級高的不一定借款成功率高,但信用等級低的借款成功率普遍低??傮w而言,出借人會綜合考慮標(biāo)的信息和借款人信息來進行投資。

根據(jù)上述結(jié)論,對目前的P2P市場及相關(guān)角色提出了一些建議。首先,從P2P平臺角度考慮,為出借人提供更多樣化的投資保障能在一定程度上提高出借人的投資熱情;同時,P2P平臺可以針對不同風(fēng)險的借款制定利率上下限,這樣一方面可以避免利率過高帶來的違約率的提高,一方面又能防止利率過低而無法吸引出借人的投資熱情;另外,P2P平臺應(yīng)加強對借款人身份的核實,增強信用等級的認可度,對借款人信息的真實性進行把關(guān)。其次,借款人可以通過完善個人信息以及保持良好的歷史履約記錄來降低融資成本。最后,監(jiān)管部門應(yīng)加大力度建設(shè)完善個人征信系統(tǒng),規(guī)范違約懲處措施,提高信用等級評判的準(zhǔn)確性,從而提高投資者對其的信賴度。個人征信系統(tǒng)的完善使借款人更重視違約后果的嚴重性,從而有效降低P2P市場的道德風(fēng)險,信用評級可信度的提升也將很大程度地降低出借人的逆向選擇問題,從而促使P2P市場的發(fā)展走向成熟。

參考文獻:

[1]FREEDMAN S M, JIN G Z. Learning by doing with asymmetric information: evidence from prosper.com[R]. Cambridge, MA: National Bureau of Economic Research,2011.

[2]LIN M.F, PRABHALA N R, VISWANGTHAN S. Can social networks help mitigate information asymmetry in online markets[R]. Phoenix: Thirtieth International Conference on Information Systems,2009.

[3]IYER R, KHWAJA A I, LUTTMER E F P, et al. Screening in new credit markets can individual lenders infer borrower credit worthiness in peer-to-peer lending management[R]. Cambridge, MA: Harvard Kennedy School of Government,2010.

[4]HERZENSTEIN M, ANDREWS R L, DHOLAKIA U M, et al. The democratization of personal consumer loans? determinants of success in online peer-to-peer lending communities[J]. Bulletin of the University of Delaware, 2008,15(3):274-277.

[5]POPE D G, SYDNOR J R. What′s in a picture: evidence of discrimination from prosper. com[J]. Journal of Human Resources,2011,46(1):53-92.

[6]董梁,胡明雅.基于社會網(wǎng)絡(luò)分析法的P2P網(wǎng)絡(luò)信貸研究評述[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2016,38(4):508-511.

[7]宋文.P2P網(wǎng)絡(luò)借貸行為的實證研究[D].上海:上海交通大學(xué),2013.

[8]王會娟,廖理.中國P2P網(wǎng)絡(luò)借貸平臺信用認證機制研究:來自“人人貸”的經(jīng)驗證據(jù)[J].中國工業(yè)經(jīng)濟,2014(4):136-147.

[9]王會娟,何琳.借款描述對P2P網(wǎng)絡(luò)借貸行為影響的實證研究[J].金融經(jīng)濟學(xué)究,2015,30(1):77-85.

[10]盛浙湘,尹優(yōu)平,盛輝.中國P2P信貸市場中的借貸行為監(jiān)管研究:基于前景理論的PPDai數(shù)據(jù)挖掘[J].公司金融研究,2015(2):1-23.

[11]SUH B, HAN I. The impact of customer trust and perception of security control on the acceptance of electronic commerce[J]. International Journal of Electronic Commerce,2003,7(3):135-161.

猜你喜歡
信用等級借款人決策樹
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
鄉(xiāng)城流動借款人信用風(fēng)險與空間收入差異決定
決策樹和隨機森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
協(xié)會圓滿完成武器裝備科研生產(chǎn)單位信用等級評價擴大試點工作
小微企業(yè)借款人
基于決策樹的出租車乘客出行目的識別
商業(yè)銀行對借貸人貸后監(jiān)控與風(fēng)險治理
住房抵押信貸信用等級的灰色評價方案研究
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
门头沟区| 台湾省| 万年县| 长顺县| 梁山县| 汝南县| 乌什县| 武平县| 邛崃市| 西青区| 五寨县| 奈曼旗| 山阴县| 大连市| 屏东县| 鄯善县| 吉木萨尔县| 泰兴市| 涡阳县| 七台河市| 阳城县| 华坪县| 贵溪市| 阿拉善右旗| 灵寿县| 商水县| 阿克| 海安县| 沾益县| 武乡县| 射阳县| 醴陵市| 邢台县| 永修县| 邵东县| 龙里县| 通江县| 肇庆市| 旌德县| 安吉县| 巩留县|