郇鈺 趙琬迪
摘 要:知情交易概率PIN模型的極大似然估計(jì),由于似然函數(shù)形式復(fù)雜,在最優(yōu)化過程中很容易出現(xiàn)計(jì)算溢出的問題。本文提出了PIN模型的廣義矩估計(jì),并通過數(shù)值模擬比較了這一新方法和以往文獻(xiàn)提出的原始極大似然估計(jì)、改進(jìn)極大似然估計(jì)在不同情況下的估計(jì)精度。模擬結(jié)果表明,在某些情況下,廣義矩估計(jì)比極大似然估計(jì)更容易計(jì)算得出也更具有精度優(yōu)勢(shì)。本文還提出了用bootstrap方法對(duì)廣義矩估計(jì)結(jié)果進(jìn)行誤差修正,進(jìn)一步提高了廣義矩估計(jì)方法對(duì)于知情交易概率PIN的估計(jì)精度。
關(guān)鍵詞:知情交易概率;極大似然估計(jì);廣義矩估計(jì);bootstrap誤差修正
中圖分類號(hào):F830.91 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-2265(2018)04-0064-08
DOI:10.19647/j.cnki.37-1462/f.2018.04.010
在市場(chǎng)微觀結(jié)構(gòu)理論中,由Easley等(1996)提出的知情交易概率的測(cè)度PIN模型(簡(jiǎn)稱EKOP模型)有十分重要的意義。這是第一個(gè)直接對(duì)知情交易程度進(jìn)行衡量的指標(biāo),也是目前最具代表性、被研究者使用最廣泛的一類模型測(cè)度。知情交易概率(Probability of Informed Trading,簡(jiǎn)稱PIN)是指一次交易來自擁有私人信息的知情交易者的概率,也即,某資產(chǎn)來自知情交易者的交易占該資產(chǎn)全部交易的比重。可以認(rèn)為,PIN值越低,知情交易概率越低,說明該資產(chǎn)的信息不對(duì)稱程度越低。PIN理論一經(jīng)提出就受到了廣泛關(guān)注,常與金融實(shí)證領(lǐng)域的研究相結(jié)合。例如Easley等(1996)發(fā)現(xiàn)交易頻繁的股票和交易不頻繁股票之間買賣價(jià)差的差異可以用PIN來解釋。Easley等(2002)把PIN作為第四個(gè)定價(jià)因子加入Fama和French(1993)的三因子模型中進(jìn)行回歸,發(fā)現(xiàn)知情交易概率與價(jià)格顯著正相關(guān),這說明知情交易概率越高,所要求的風(fēng)險(xiǎn)補(bǔ)償也越高,因此他們認(rèn)為PIN可以作為一種風(fēng)險(xiǎn)因子被定價(jià)。Duarte和Young(2009)檢驗(yàn)了PIN是否被信息不對(duì)稱或者流動(dòng)性因素定價(jià)等等。
同時(shí),也有一些學(xué)者關(guān)注PIN模型本身的估計(jì)問題。Boehmer等 (2007)發(fā)現(xiàn)交易數(shù)據(jù)的買賣方向分類不準(zhǔn)確會(huì)造成PIN的低估。Easley等(2010)提出一種改進(jìn)的PIN 參數(shù)的似然函數(shù),用來提高最優(yōu)化似然函數(shù)時(shí)的計(jì)算效率。Lin和Ke (2011)發(fā)現(xiàn)在數(shù)值計(jì)算PIN的極大似然估計(jì)時(shí)可能遇到非常嚴(yán)重的計(jì)算溢出問題,尤其是當(dāng)訂單數(shù)量特別大的時(shí)候,利用近幾年股票市場(chǎng)數(shù)據(jù),他們發(fā)現(xiàn)大約有44%的PIN估計(jì)結(jié)果受到計(jì)算問題的影響。Yan和Zhang(2012)認(rèn)為在數(shù)值求解極大似然估計(jì)的時(shí)候,邊界解會(huì)造成PIN的估計(jì)偏差,并且認(rèn)為Easley 等(2010)提出的估計(jì)有系統(tǒng)性偏誤問題。
盡管有很多學(xué)者先后提出了改善上述PIN的極大似然估計(jì)計(jì)算問題的方法,但這些改進(jìn)思路仍然局限在極大似然估計(jì)的框架之下,無法根本解決因似然函數(shù)復(fù)雜性引起的問題。因此,本文提出采用另一種經(jīng)典計(jì)量方法—廣義矩估計(jì)來計(jì)算PIN的估值。從統(tǒng)計(jì)推斷的角度來說,廣義矩估計(jì)和極大似然估計(jì)都能得到一致的相合估計(jì),盡管廣義矩估計(jì)只采用了分布的矩信息,但是在樣本足夠大的情況下,同樣是一致漸近正態(tài)的廣義矩估計(jì)也可以作為極大似然估計(jì)結(jié)果的有效補(bǔ)充。另外,在計(jì)算過程方面,廣義矩估計(jì)的計(jì)算過程更加簡(jiǎn)便快捷,無論在何種數(shù)據(jù)條件下,廣義矩估計(jì)方法都能得到估計(jì)結(jié)果,不會(huì)出現(xiàn)計(jì)算溢出問題,并且通過本文的數(shù)值模擬研究可以看出,在某些情況下,廣義矩估計(jì)的精度要明顯優(yōu)于極大似然估計(jì)的精度。另外,根據(jù)廣義矩估計(jì)的模擬性質(zhì),本文還提出用bootstrap誤差修正方法進(jìn)一步提升廣義矩估計(jì)的估計(jì)精度。
一、EKOP模型及極大似然估計(jì)
(一)EKOP模型及知情交易概率PIN理論回顧
Easley等(1996)在Glosten和Milgrom(1985)的市場(chǎng)微觀結(jié)構(gòu)理論模型基礎(chǔ)上進(jìn)行擴(kuò)展,開創(chuàng)性地提出了度量知情交易概率PIN的EKOP模型。該模型認(rèn)為在滿足某些假設(shè)條件的交易機(jī)制下,根據(jù)每個(gè)交易日買方發(fā)起的訂單數(shù)量和賣方發(fā)起的訂單數(shù)量,可以直接估計(jì)知情交易者提出交易的概率。
在市場(chǎng)微觀結(jié)構(gòu)中,EKOP模型考慮了一種簡(jiǎn)單的序貫結(jié)構(gòu)的交易模型。定義[i=1,…,I]為I個(gè)交易日,每個(gè)交易日被認(rèn)為是獨(dú)立重復(fù)地進(jìn)行交易過程,[t∈[0,T]]代表每個(gè)交易日內(nèi)的連續(xù)時(shí)刻。模型假設(shè)市場(chǎng)中存在潛在的知情交易者,他們和非知情交易者都與一個(gè)風(fēng)險(xiǎn)中性且具有競(jìng)爭(zhēng)性的做市商進(jìn)行股票和資金的交易。對(duì)于任意一只股票來說,在每個(gè)交易日開始前,是否有決定資產(chǎn)價(jià)值的新消息產(chǎn)生是由概率[α]決定的。假設(shè)一天至多只有一個(gè)新消息產(chǎn)生,如果有新消息,該消息是利空消息的概率為[δ],是利好消息的概率為1-[δ]。知情交易者可以提前知道消息,而非知情交易者和做市商只能觀察到股票價(jià)格。在有消息的交易日,當(dāng)知情交易者捕捉到利好消息時(shí),他們會(huì)買進(jìn);當(dāng)他們發(fā)現(xiàn)是利空消息時(shí),便會(huì)賣出。假設(shè)非知情交易者發(fā)起的買方訂單和賣方訂單,以及知情交易者發(fā)起的買賣訂單,均服從相互獨(dú)立的泊松過程。非知情交易者提交買方訂單的速率均為[εb],提交賣方訂單的速率為[εs]。而知情交易者在有利好消息時(shí)提交買方訂單的速率和有利空消息時(shí)提交賣方訂單的速率均為[μ]。根據(jù)Easley等(2002)的研究,參數(shù)[εb]、[εs]和[μ]是日度速率。
圖1的樹形圖展示了任意股票在任意一天的交易過程。樹形圖的第一個(gè)節(jié)點(diǎn)代表是否有消息發(fā)生。如果有消息發(fā)生,第二個(gè)節(jié)點(diǎn)代表是利好消息或是利空消息。在任意一天,虛線前的三個(gè)節(jié)點(diǎn)(利好消息、利空消息和沒有消息)發(fā)生的概率分別為[α(1-δ)]、 [αδ]和 [1-α]。為交易日選定某一個(gè)節(jié)點(diǎn)后,買賣訂單的到達(dá)分別服從相應(yīng)的泊松分布。在有利好消息的交易日,買方訂單的到達(dá)速率為[εb+μ]而賣方訂單的到達(dá)速率為[εs];在有利空消息的交易日,買方訂單的到達(dá)速率為[εb]而賣方訂單的到達(dá)速率為[εs+μ];在沒有信息的交易日,知情交易者無利可圖,不會(huì)參與到市場(chǎng)中,此時(shí)只有非知情交易者進(jìn)行交易,所以買賣訂單到達(dá)速率分別為[εb]和[εs]。
從而,知情交易概率PIN定義為
[PIN=αμαμ+εb+εs] (1)
式(1)中,[αμ+εb+εs]可以理解為全部訂單到達(dá)速率,[αμ]為知情交易訂單到達(dá)速率,因此PIN也可以理解成所有訂單中來自知情交易者的訂單所占的比率。
(二)PIN的極大似然估計(jì)
EKOP模型用一種二維混合泊松結(jié)構(gòu)的模型來表達(dá)上述交易機(jī)制,而在這個(gè)模型中,可以用每日買賣交易筆數(shù)數(shù)據(jù)對(duì)參數(shù)[θ=(α, δ, εb, εs, μ)]進(jìn)行估計(jì),進(jìn)而通過式(1)得到PIN的估計(jì)。
如圖1,每一天買賣訂單的到來都只能服從三種二維泊松分布(利空消息、利好消息或者沒有消息)中的一種。雖然做市商和非知情交易者不知道當(dāng)天的交易情況具體是服從哪一種泊松分布,但是可以通過一天的交易數(shù)據(jù)挖掘出市場(chǎng)隱含的信息結(jié)構(gòu)。例如當(dāng)天如果買方發(fā)起交易越多,越有可能是有利好消息發(fā)生;而賣方發(fā)起交易越多,則越有可能是利空消息。反之,如果當(dāng)天沒有新消息,那么市場(chǎng)上不會(huì)有知情交易者參與,這一天的訂單量可能相對(duì)較少。如果用一個(gè)由三組二維泊松分布構(gòu)成的混合模型來描述這個(gè)過程,那么每種情況發(fā)生的概率應(yīng)該由混合模型中的權(quán)重系數(shù)來決定,因而可以在此基礎(chǔ)上構(gòu)造這個(gè)混合模型。
首先,假設(shè)在已知第i個(gè)交易日的信息情況下,構(gòu)造似然函數(shù)。如果這個(gè)交易日在開始前有利空消息放出,那么賣方發(fā)起訂單的到達(dá)速率為[εs+μ],說明知情交易者和不知情交易者都會(huì)賣出;而買方發(fā)起訂單的速率為[εb],因?yàn)橹挥胁恢榻灰渍卟艜?huì)買入。因此,在單位時(shí)間內(nèi),觀測(cè)到了第i個(gè)交易日共有[Bi]筆買方發(fā)起訂單,[Si]筆賣方發(fā)起訂單,([Bi],[Si])的似然函數(shù)為:
[e-εbεbBiBi!e-(εs+μ)(εs+μ)SiSi!] (2)
同理,如果是有利好消息的交易日,觀測(cè)到第i個(gè)交易日共有[Bi]筆買方發(fā)起訂單,[Si]筆賣方發(fā)起訂單的信息后,([Bi],[Si])的似然函數(shù)為:
[e-(εb+μ)(εb+μ)BiBi!e-εsεsSiSi!] (3)
如果這一天沒有消息,([Bi],[Si])的似然函數(shù)為:
[e-εbεbBiBi!e-εsεsSiSi!] (4)
實(shí)際上,交易日類型(利空消息、利好消息或者沒有消息)并不可知,因此可以將式(2)、(3)和(4)加權(quán)平均作為該交易日的似然函數(shù),權(quán)重就是發(fā)生三種情況(利空消息、利好消息或者沒有消息)的相應(yīng)概率[(αδ,α1-δ,1-α)]。也就是說,在第i個(gè)交易日觀測(cè)到的交易數(shù)據(jù)([Bi],[Si])的似然函數(shù)為:
[fBi,Si|θ=α1-δe-εb+εs+μ*εb+μBi*εsSiBi!Si!+αδe-εb+εs+μ*εbBi*εs+μSiBi!Si!+(1-α)e-εb+εs*εbBi*εsSiBi!Si!] (5)
因?yàn)榻灰兹罩g是獨(dú)立的,假設(shè)觀測(cè)到I天的交易數(shù)據(jù) [B=BiIi=1]和[S=SiIi=1],則(B,S)的似然函數(shù)為:
[L(B,S|θ)=i=1If(Bi,Si|θ)] (6)
Easley等(2002)首先對(duì)參數(shù)[α]和[δ]進(jìn)行邏輯變換,對(duì)參數(shù) [εb]、[εs]和[μ]進(jìn)行對(duì)數(shù)變換,從而使得所有參數(shù)在實(shí)數(shù)域上沒有限制, 接著使用quadratic hill-climbing算法來最大化似然函數(shù)(6)以求得參數(shù)[θ]的估計(jì)值,進(jìn)而得到PIN的估計(jì)值。本文將這種方法稱為原始的MLE方法。
正如前文提到的極大似然估計(jì)存在計(jì)算溢出問題,原始的MLE估計(jì)非常容易出現(xiàn)計(jì)算上溢或者下溢的錯(cuò)誤,特別是當(dāng)買賣訂單數(shù)量非常大的時(shí)候。為了緩解這個(gè)問題,Easley等(2010)提出了一種改進(jìn)的對(duì)數(shù)似然函數(shù),用于提高計(jì)算效率,降低計(jì)算問題出現(xiàn)的可能性。將式(6)取對(duì)數(shù)后,去掉常數(shù)項(xiàng)并進(jìn)行重排,得到對(duì)數(shù)似然函數(shù),即:
[l(B,S|θ)=i=1I-εb-εs+Milnxb+lnxs+Bilnεb+μ+Silnεs+μ +i=1Iln [α1-δe-μx-MibxSi-Mis+αδe-μxBi-Mibx-Mis +(1-α)xBi-MibxSi-Mis]] (7)
其中,[Mi=min(Bi,Si)+max (Bi,Si)/2],[xb=εb/(εb+μ)]
以及[xs=εs/(εs+μ)]。本文把極大化式(7)的方法稱為改進(jìn)的MLE方法。
然而,這種改進(jìn)對(duì)于運(yùn)算效率的提高,尤其對(duì)交易頻繁股票的運(yùn)算效率提高,是非常有限的。實(shí)際計(jì)算中仍然有很多情況無法得到參數(shù)[θ]的估計(jì)值,例如Lin和Ke(2011)發(fā)現(xiàn)即便是使用改進(jìn)的MLE方法,PIN的參數(shù)估計(jì)仍然會(huì)遇到計(jì)算溢出問題,同時(shí)在他們使用的股票數(shù)據(jù)中,大約有44%的PIN估計(jì)值存在低估的偏差,并且這種現(xiàn)象在交易活躍的股票樣本中更加明顯。Yan和Zhang(2012)發(fā)現(xiàn)改進(jìn)的MLE估計(jì)方法經(jīng)常得到參數(shù)的邊界解,也就是說,[α]被估計(jì)為0或者1,這也會(huì)造成PIN估計(jì)值的巨大偏差。
二、廣義矩估計(jì)
為了避免前文提到的極大似然估計(jì)存在的各種問題,本文提出了用廣義矩估計(jì)方法來測(cè)度知情交易概率PIN。
按照EKOP模型的理論,單位時(shí)間內(nèi)累計(jì)買方發(fā)起訂單量B和賣方發(fā)起訂單量S的聯(lián)合分布(B,S)為混合的二維泊松分布:
[f(B=k,S=l)=α1-δe-εb+εs+μ*εb+μk*εslk!l!+αδe-εb+εs+μ*εbk*εs+μlk!l!+(1-α)e-εb+εs*εbk*εslk!l!] (8)
從而,B和S的邊際分布分別為混合的一維泊松分布:
[fB=k=l=0∞fB=k,S=l=1-α1-δ?εkbk!e-εb+α1-δ?εb+μkk!e-εb+μ] (9)
以及
[fS=l=l=0∞fB=k,S=l=1-αδ?εlsl!e-εs+αδ?εs+μll!e-εl+μ] (10)
進(jìn)而可以推出B和S的各階矩如下:
[EB+S=εb+εs+αμ] (11)
[VarB=εb+α1-δ[μ+(1-α1-δ)μ2]] (12)
[VarS=εs+αδ[μ+(1-αδ)μ2]] (13)
[CovB,S=-α2δ(1-δ)μ2] (14)
另外,還可以考慮
[EB2S=εb2+εbεb+αδμ+α1-δμεs(1+2εb+μ)]
(15)
[EBS2=εs2+εsεb+α(1-δ)μ+αδμεb(1+2εs+μ)]
(16)
利用式(11)—(16)這6個(gè)總體矩條件,可以對(duì)5個(gè)參數(shù)[θ=(α,δ,εb,εs,μ)]做廣義矩估計(jì)。用樣本矩代替總體矩,則樣本矩條件為:
[1Ii=1Ig(Bi,Si;θ)=1Ii=1IBi+Si-(εb+εs+αμ)(Bi-B)2-εb-α1-δ[μ+(1-α1-δ)μ2](Si-S)2-εs-αδ[μ+(1-αδ)μ2]Bi-BSi-S+α2δ(1-δ)μ2Bi2Si-εb2+εbεb+αδμ-α1-δμεs(1+2εb+μ)BiSi2-εs2+εsεb+α1-δμ-αδμεb(1+2εs+μ)=0]
(17)
其中[B=1Ii=IBi],[S=1Ii=ISi]為樣本均值。
由此,可以得到參數(shù)[θ=(α,δ,εb,εs,μ)]的廣義矩估計(jì):
[θGMM=argminθ1Ii=1IgBi,Si;θ'W1Ii=1IgBi,Si;θ] (18)
其中[W]為權(quán)重矩陣。根據(jù)廣義矩估計(jì)的大樣本理論,選擇最優(yōu)權(quán)重矩陣[W] =[Ω-1],能使廣義矩估計(jì)量[θGMM]最有效,這里[Ω]是樣本矩[I[1Ii=1IgBi,Si;θ]]的漸近協(xié)方差矩陣。
考慮到樣本矩條件[gBi,Si;θ]之間存在序列相關(guān)性,本文采用Newey和West(1987)提供的算法來估計(jì)[Ω],具體為:[ΩNW=Ω0+k=1MT(1-k/(MT+1))(Ωk+Ω'k)],是采用Bartlett核函數(shù),窗寬[MT=[T1/3]]的Newey-West協(xié)方差矩陣估計(jì),這里T為樣本容量,[Ωk],k=0,…,[MT]為第k階樣本自協(xié)方差矩陣。
三、數(shù)值模擬
本文通過數(shù)值模擬的方法比較了原始的極大似然估計(jì)(簡(jiǎn)記為MLE1)、改進(jìn)的極大似然估計(jì)(簡(jiǎn)記為MLE2)和廣義矩估計(jì)(GMM)三種方法對(duì)PIN的估計(jì)效果。首先考慮上述三種PIN模型估計(jì)方法在不同樣本量、不同參數(shù)設(shè)置下的均方根誤差。其次,進(jìn)一步給出了三種估計(jì)的均方根誤差和偏差隨著知情交易者提交訂單的速率[μ]及非知情交易者提交訂單的速率[ε]變化的表現(xiàn)(這里,不失一般性地,令[εb=εs=ε],該假設(shè)亦符合Easley等(1998)提供的實(shí)證結(jié)果)。
(一)估計(jì)誤差的比較
本節(jié)的模擬設(shè)置如下:在一次模擬過程中,為了產(chǎn)生每個(gè)交易日買賣訂單量([Bi],[Si])的數(shù)據(jù),需設(shè)定參數(shù)真值[θ=(α, δ, ε, μ)],其中,[α]=0.37和[δ]=0.70為均勻分布產(chǎn)生的隨機(jī)數(shù),[ε]分別取區(qū)間[0,1]、[10,100]、[100,200]和[200,300]內(nèi)的均勻分布隨機(jī)數(shù),而[μ]/[ε]分別設(shè)為0.5、1和1.5,由式(1)計(jì)算,得到真實(shí)值PIN。而([Bi],[Si])服從式(5)的二維混合泊松分布,由此分布模擬生成連續(xù)I個(gè)交易日的交易數(shù)據(jù)[B=BiIi=1]和[S=SiIi=1],其中樣本量I的取值分別為21、63、126和252,分別代表一個(gè)月、一季度、半年和一年的交易天數(shù)。本文的模擬次數(shù)N=1000次。
根據(jù)模擬生成的數(shù)據(jù)集([B],[S]),可以計(jì)算得到PIN模型的三種估計(jì)(MLE1,MLE2和GMM)。 表1給出了三種估計(jì)在不同參數(shù)設(shè)置和不同樣本量大小下的均方根誤差比較,Panel A—D分別代表隨機(jī)抽取的參數(shù)[ε]=0.5751、22.304、172和281的模擬結(jié)果??傮w來看,隨著[ε]的逐漸增大或者樣本量I的變大,三種估計(jì)方法的均方根誤差幾乎呈現(xiàn)減小的趨勢(shì),只是在不同的參數(shù)設(shè)定場(chǎng)景下,三種方法誤差減小的程度不盡相同。而對(duì)每一行,隨著[μ]/[ε]比值設(shè)定逐步擴(kuò)大,Panel A的情況是三個(gè)方法均方根誤差均逐漸減小,Panel B的情況是先降后升,而Panel C和Panel D的情況是幾乎逐步增大。對(duì)表1進(jìn)一步分析可以發(fā)現(xiàn),在[ε]取值較小時(shí)(0.5751和22.304),MLE1估計(jì)和MLE2估計(jì)的均方根誤差區(qū)別不大,而此時(shí)GMM估計(jì)的誤差略高于其他兩種方法。而當(dāng)[ε]取值較大時(shí)(172和281),MLE1估計(jì)誤差明顯高于MLE2估計(jì),并且隨著[μ]/[ε]增加,樣本量I增加,二者之間的差別愈發(fā)明顯。例如[μ]/[ε]=0.5、I=21時(shí),MLE1的均方根誤差僅比MLE2的高1.8%,而在[μ]/[ε]=1.5、I=252情況下,MLE1的均方根誤差比MLE2的高約6倍,同時(shí)在[ε]取值較大時(shí),GMM估計(jì)的優(yōu)勢(shì)逐漸顯現(xiàn)出來,尤其是樣本量I逐漸增大,或者固定[ε],[μ]/[ε]逐步增大,GMM的估計(jì)精度明顯優(yōu)于MLE1的精度。
(二)估計(jì)誤差隨[ε]及[μ]的變化
表1中的結(jié)果表明,三種方法的估計(jì)效果可能和[μ]與[ε]的相對(duì)大小以及樣本量I均有關(guān)系。為了更加直觀地比較并展示三種PIN估計(jì)的性質(zhì),圖2給出了在不同樣本量I的設(shè)定下,當(dāng)[μ]/[ε=0.2,0.4,…,2]時(shí),三種估計(jì)的均方根誤差隨著[μ]/[ε]變化的情形。而圖3則是在不同樣本量I的設(shè)定下三種估計(jì)的偏差隨著[μ]/[ε]變化的情形。這里,其他的參數(shù)真值分別設(shè)為[α]=0.37,[δ]=0.70,[ε]=281。
從圖2中可以看出,無論樣本量I如何選定,平均而言,當(dāng)[μ]相對(duì)于[ε]很小的時(shí)候,MLE1的均方根誤差近似MLE2的均方根誤差,二者都優(yōu)于GMM的誤差;隨著[μ]的增加,MLE1 估計(jì)的精度逐漸變差,而GMM估計(jì)的誤差呈下降趨勢(shì),尤其是在[μ]/[ε]>1后,MLE1的估計(jì)誤差上升趨勢(shì)明顯增大,且大于GMM的估計(jì)誤差,說明此時(shí)MLE1估計(jì)不再具有優(yōu)勢(shì),而GMM 的估計(jì)誤差逐漸回落,接近MLE2的值。另外,隨著樣本量I的設(shè)定增大,GMM估計(jì)均方根誤差會(huì)更迅速且更緊密地靠近MLE2估計(jì)的均方根誤差,當(dāng)I=126時(shí),GMM的均方根誤差除了在[μ]/[ε]=0.2時(shí)顯著大于MLE2的均方根誤差外,其他情況下都非常接近MLE2的結(jié)果;而當(dāng)I=252時(shí),GMM的均方根誤差幾乎從一開始就已經(jīng)非常近似于MLE2的均方根誤差。
圖3給出的信息同樣能夠得到同圖2類似的結(jié)論。首先,MLE2估計(jì)的偏差基本在0水平線附近,波動(dòng)很小,可以認(rèn)為MLE2估計(jì)此時(shí)比較理想。而MLE1估計(jì)的偏差,在[μ]相比于[ε]比較小時(shí),與MLE2的偏差很接近,但隨著[μ]增大,MLE1估計(jì)會(huì)出現(xiàn)非常嚴(yán)重的負(fù)向偏差(I=21時(shí),MLE1的負(fù)向走勢(shì)大約從[μ]/[ε]=0.6開始;而當(dāng)I=252時(shí),MLE1的負(fù)向走勢(shì)推遲到從[μ]/[ε]=1.2開始),說明MLE1存在低估問題,尤其是在樣本量I比較小或者[μ]/[ε]較大時(shí)。GMM估計(jì)在[μ]/[ε]很小且I也較小時(shí),會(huì)有較明顯的正向偏差,但是在[μ]/[ε]>0.4或者I=252后,GMM估計(jì)的偏差幾乎為0,GMM與MLE2的偏差曲線幾乎重疊。
四、采用bootstrap誤差修正的廣義矩估計(jì)
從圖2和圖3中可以看出,在[μ]/[ε]取值較小時(shí),GMM估計(jì)結(jié)果的均方根誤差以及偏差都相對(duì)較大,盡管這個(gè)現(xiàn)象隨著樣本量I的增加有明顯緩解,但考慮到實(shí)證分析中,案例時(shí)間窗口的長(zhǎng)度要根據(jù)具體問題加以選擇,并不一定能保證I等于或者超過252天,因此本文進(jìn)一步提出了在廣義矩估計(jì)的基礎(chǔ)上使用bootstrap方法對(duì)模型進(jìn)行誤差修正,以期得到更加精確的結(jié)果。
用bootstrap方法對(duì)廣義矩估計(jì)結(jié)果進(jìn)行偏差修正在學(xué)術(shù)界已有廣泛的應(yīng)用,例如Efron和Gong(1983)、Ramalho(2006)的研究。本文提供的思路是在得到廣義矩估計(jì)結(jié)果[θGMM]和[PINGMM]后,以參數(shù)的估計(jì)值[θGMM]為真值,使用蒙特卡洛方法再次生成K組模擬數(shù)據(jù)[(Bk,Sk)],k=1,…,K,對(duì)每組模擬數(shù)據(jù)[(Bk,Sk)]再使用廣義矩估計(jì)算法得到PIN的估計(jì)值[PINk],從而可以得到偏差的估計(jì)值[bias=1Kk=1KPINk-PINGMM]。以此對(duì)原本的廣義矩估計(jì)[PINGMM]進(jìn)行偏差修正,得到誤差修正后的GMM估計(jì)值:
[PINadjGMM=PINGMM-bias=2PINGMM-1Kk=1KPINk] (19)
然而,因?yàn)橹榻灰赘怕蔖IN[∈[0,1]],式(19)有可能得到超出[0,1]范圍的估計(jì)結(jié)果,對(duì)于這種情況,則保留原有的GMM估計(jì)結(jié)果[PINGMM]。
表2展示了使用上述bootstrap方法進(jìn)行誤差修正前后的GMM估計(jì)結(jié)果的對(duì)比。本節(jié)仍采用模擬研究的方法,對(duì)比兩種估計(jì)的均方根誤差和偏差。這里,真實(shí)的參數(shù)設(shè)定為[α=0.37],[δ=0.70],[εb=εs=ε=281],
[μ]/[ε]依次取值0.5、1、1.5和2,Panel A—D分別代表樣本量I=21、63、126和252的模擬結(jié)果。而bootstrap步驟中自抽樣次數(shù)設(shè)為K=100次。
根據(jù)表2展示的結(jié)果,除了Panel A的第一列(I=21,[μ]/[ε]=0.5)情況以外,隨著[μ]/[ε]擴(kuò)大,修正前后的GMM估計(jì)均方根誤差都逐漸增大,而偏差通常也是在[μ]/[ε=0.5]的時(shí)候最低(Panel A除外)。但無論總體的變化趨勢(shì)如何,誤差修正后的GMM估計(jì)的絕對(duì)偏差和均方根誤差都始終比沒有誤差修正的GMM估計(jì)要小,可見bootstrap誤差修正方法的確能夠改善GMM估計(jì)的精度。
五、結(jié)論
本文提出了關(guān)于EKOP模型知情交易概率PIN的廣義矩估計(jì)方法,并且通過隨機(jī)模擬的結(jié)果說明在交易天數(shù)I較大,買賣訂單數(shù)(B,S)較大(即訂單到達(dá)速率參數(shù)[ε]和[μ]較大),以及知情交易者提交訂單的速率[μ]相比于非知情交易者提交訂單的速率[ε]較大時(shí),廣義矩估計(jì)比極大似然估計(jì)更容易計(jì)算得出,也更具有精度優(yōu)勢(shì)。同時(shí),本文提出用bootstrap方法對(duì)廣義矩估計(jì)結(jié)果進(jìn)行誤差修正,通過數(shù)值模擬結(jié)果說明,修正后的GMM在均方根誤差和偏差兩方面都有明顯的改善,進(jìn)一步提高了廣義矩估計(jì)方法對(duì)于知情交易概率PIN的估計(jì)精度。本文的方法和結(jié)論對(duì)于知情交易概率PIN的測(cè)度提供了有效的方法補(bǔ)充,當(dāng)PIN的極大似然估計(jì)受到計(jì)算溢出問題影響時(shí),bootstrap誤差修正后的廣義矩估計(jì)是一種便捷快速、不受數(shù)據(jù)量大小限制的估計(jì)方式,對(duì)后續(xù)金融實(shí)證研究有非常重要的幫助作用。
參考文獻(xiàn):
[1]Boehmer E,Grammig J,Theissen E. 2007. Estimating the probability of informed trading—does trade misclassification matter?[J].Journal of Financial Markets,10(1).
[2]Duarte J,Young L. 2009. Why is PIN priced?[J].Journal of Financial Economics,91(2).
[3]Easley D,Hvidkjaer S,O'Hara M. 2002. Is Information Risk a Determinant of Asset Returns?[J].The Journal of Finance,57(5).
[4]Easley D, Hvidkjaer S,OHara M. 2010. Factoring Information into Returns[J].Journal of Financial and Quantitative Analysis,45(2).
[5]Easley D, Kiefer N M, O'Hara M et al. 1996. Liquidity,Information, and Infrequently Traded Stocks[J]. The Journal of Finance,51(4).
[6]Easley D,O'Hara M,Paperman J. 1998. Financial analysts and information-based trade[J].Journal of Financial Markets,1(2).
[7]Efron B,Gong G. 1983. A Leisurely Look at the Bootstrap,the Jackknife,and Cross-Validation[J].The American Statistician,37(1).
[8]Fama E F,F(xiàn)rench K R. 1993. Common risk factors in the returns on stocks and bonds[J].Journal of Financial Economics,33(1).
[9]Glosten L R,Milgrom P R. 1985. Bid,ask and transaction prices in a specialist market with heterogeneously informed traders[J].Journal of Financial Economics,14(1).
[10]Newey W K,West K D. 1987. A Simple, Positive Semi-Definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix[J].Econometrica,55(3).
[11]Ramalho J J S. 2006. Bootstrap bias-adjusted GMM estimators[J].Economics Letters,92(1).
[12]William Lin H-W, Ke W-C. 2011. A computing bias in estimating the probability of informed trading[J]. Journal of Financial Markets,14(4).
[13]Yan Y,Zhang S. 2012. An improved estimation method and empirical properties of the probability of informed trading[J].Journal of Banking & Finance,36(2).