范 超
(1.國家統(tǒng)計(jì)局 國際統(tǒng)計(jì)信息中心,北京 100826; 2.中國人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100872)
?
統(tǒng)計(jì)模型應(yīng)用的學(xué)術(shù)規(guī)范研究
范超1,2
(1.國家統(tǒng)計(jì)局 國際統(tǒng)計(jì)信息中心,北京 100826; 2.中國人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100872)
在中國社會(huì)科學(xué)領(lǐng)域研究中,統(tǒng)計(jì)模型泛化過程中的誤用、濫用現(xiàn)象日益嚴(yán)重,模型應(yīng)用中的種種失范行為違背了學(xué)術(shù)精神。統(tǒng)計(jì)模型應(yīng)遵守的學(xué)術(shù)規(guī)范包括:模型的建立和調(diào)整要有理論依據(jù),合理的模型是主觀與客觀的統(tǒng)一;實(shí)證分析中應(yīng)重視數(shù)據(jù)質(zhì)量以免錯(cuò)用濫用統(tǒng)計(jì)數(shù)據(jù),建模中要避免命題不可證偽,陷入“數(shù)字游戲”誤區(qū)等。通過學(xué)術(shù)規(guī)范彰顯的學(xué)術(shù)精神應(yīng)體現(xiàn)在對(duì)模型方法做出有價(jià)值有意義的創(chuàng)新或是根據(jù)模型結(jié)果論證新的命題。當(dāng)前,中國應(yīng)制定有關(guān)統(tǒng)計(jì)學(xué)的學(xué)術(shù)規(guī)范,并完善期刊的審稿制度來解決統(tǒng)計(jì)模型的學(xué)術(shù)失范問題。
統(tǒng)計(jì)模型;學(xué)術(shù)規(guī)范;學(xué)術(shù)精神
近年來,統(tǒng)計(jì)模型在中國社會(huì)科學(xué)領(lǐng)域的應(yīng)用日益廣泛,在研究事物的數(shù)量特征方面,它無疑是一種有用的工具,但在模型泛化過程中也出現(xiàn)了大量誤用、濫用現(xiàn)象,受到學(xué)術(shù)界種種質(zhì)疑和批評(píng),例如在研究中牽強(qiáng)使用模型、用模型點(diǎn)綴論文、將簡單問題復(fù)雜化等[1]。這些現(xiàn)象呈現(xiàn)的是中國學(xué)者種種學(xué)術(shù)失范行為,不僅使統(tǒng)計(jì)模型失去了應(yīng)有的作用和意義,更是對(duì)“獨(dú)立之精神,自由之思想”學(xué)術(shù)精神的褻瀆,違背了科學(xué)求真精神,不利于開展學(xué)術(shù)對(duì)話。
本文主要根據(jù)統(tǒng)計(jì)模型的內(nèi)容,以建模過程為主線,從模型建立、假設(shè)條件、數(shù)據(jù)質(zhì)量、模型結(jié)果、模型調(diào)整等方面,結(jié)合學(xué)術(shù)創(chuàng)新與學(xué)術(shù)精神,分析當(dāng)前中國社科領(lǐng)域研究中在應(yīng)用統(tǒng)計(jì)模型方面常見的失范行為,研究應(yīng)遵守的學(xué)術(shù)規(guī)范,提出規(guī)范模型使用的政策建議。
目前,學(xué)術(shù)界關(guān)于統(tǒng)計(jì)模型學(xué)術(shù)規(guī)范的綜合性研究相對(duì)較少。國外一些專業(yè)學(xué)會(huì)針對(duì)本學(xué)科統(tǒng)計(jì)模型的使用做出了具體規(guī)定,最具代表性的是美國心理協(xié)會(huì)(APA)的學(xué)術(shù)規(guī)范著作《美國心理學(xué)會(huì)出版發(fā)表手冊(cè)》*國內(nèi)將該手冊(cè)的第六版譯為《APA格式》。,從公式、統(tǒng)計(jì)內(nèi)容表述、符號(hào)等方面對(duì)統(tǒng)計(jì)方法的使用做出了明確規(guī)定[2]。如果說該手冊(cè)是側(cè)重于形式上的規(guī)范,那么APA的科學(xué)事務(wù)委員會(huì)1999年專門發(fā)文,進(jìn)一步從內(nèi)容上指導(dǎo)統(tǒng)計(jì)模型的使用。該文從方法、度量、結(jié)果、分析及討論等五個(gè)方面闡述了統(tǒng)計(jì)模型應(yīng)遵守的原則[3],但APA的規(guī)范僅是針對(duì)心理學(xué)領(lǐng)域中常用的模型,“不是對(duì)研究方法的總體評(píng)論,而在一個(gè)領(lǐng)域適用的原則可能在另一領(lǐng)域并不適用”[2]。此外,亦有學(xué)者針對(duì)某個(gè)具體問題來分析因模型使用不當(dāng)所帶來的問題,如Paul所闡述的由于參數(shù)的穩(wěn)健性所帶來的“變色龍”效應(yīng)[4]。
國內(nèi)與此相關(guān)聯(lián)的研究主要有兩類:一類是討論在經(jīng)濟(jì)學(xué)研究中是否應(yīng)大量使用模型,例如趙凌云認(rèn)為當(dāng)代經(jīng)濟(jì)學(xué)廣泛使用模型工具有利于提高經(jīng)濟(jì)學(xué)的工作效率,但如果過于數(shù)學(xué)化也會(huì)使經(jīng)濟(jì)學(xué)失去社會(huì)科學(xué)的應(yīng)有特征[5];李金華進(jìn)一步分析了經(jīng)濟(jì)學(xué)論文模型泛化的表現(xiàn)及成因,認(rèn)為模型的濫用和錯(cuò)用不在于模型本身,而在于模型的應(yīng)用者或設(shè)計(jì)者[1]。這類研究主要是從宏觀層面上討論,其結(jié)論普遍認(rèn)為在研究中關(guān)鍵是要能夠正確合理使用模型,但并沒有具體論述如何合理使用模型。另一類研究是從微觀技術(shù)層面討論模型在使用中的一些注意事項(xiàng),如于曉華從數(shù)據(jù)、模型和參數(shù)三個(gè)角度出發(fā),具體討論了數(shù)據(jù)來源、變量外生性、偽回歸等計(jì)量經(jīng)濟(jì)模型中需要注意的問題[6]。孫秋碧等從數(shù)量分析方法中的多解現(xiàn)象展開研究,分析了多解存在的原因:結(jié)論的語境、隨機(jī)成分和錯(cuò)誤的模型, 并針對(duì)數(shù)量分析方法誤用展開進(jìn)一步討論[7]。這類研究對(duì)于某些模型的具體使用具有指導(dǎo)性,但討論的內(nèi)容相對(duì)零碎,過于細(xì)節(jié)化,缺少明確的主線。
雖然國內(nèi)對(duì)統(tǒng)計(jì)模型這一專業(yè)領(lǐng)域的學(xué)術(shù)規(guī)范研究較少,但對(duì)一般意義上的學(xué)術(shù)規(guī)范早有討論,其中有兩點(diǎn)值得注意:一是學(xué)術(shù)規(guī)范不僅包括諸如引文、格式等形式上的規(guī)范,也包括內(nèi)容上的規(guī)范,如陳學(xué)飛認(rèn)為學(xué)術(shù)規(guī)范可分為技術(shù)、內(nèi)容和道德三個(gè)層次[8];二是學(xué)術(shù)規(guī)范與學(xué)術(shù)創(chuàng)新、學(xué)術(shù)精神是緊密相連的,如孫利天認(rèn)為學(xué)術(shù)規(guī)范的內(nèi)在支撐是學(xué)術(shù)精神[9];葉繼元認(rèn)為 “學(xué)術(shù)規(guī)范的目的或精髓是要求學(xué)術(shù)積累和學(xué)術(shù)創(chuàng)新”[10]。而學(xué)術(shù)泰斗陳寅恪提出的“獨(dú)立之精神,自由之思想” 是對(duì)學(xué)術(shù)精神的精辟概括,是學(xué)術(shù)研究中應(yīng)恪守的普世原則。
綜上所述,當(dāng)前缺少能夠全面具體論述中國社科領(lǐng)域研究中使用模型時(shí)應(yīng)遵守的學(xué)術(shù)規(guī)范;對(duì)統(tǒng)計(jì)模型學(xué)術(shù)規(guī)范的研究應(yīng)包含對(duì)學(xué)術(shù)精神與學(xué)術(shù)創(chuàng)新的討論??紤]到學(xué)術(shù)界對(duì)論文中有關(guān)引文、符號(hào)、格式等已有明確的規(guī)定,如《APA格式》、《芝加哥手冊(cè)》、《哈佛格式》等,因此本文對(duì)該部分內(nèi)容不再累述,而是側(cè)重于研究統(tǒng)計(jì)模型內(nèi)容方面的規(guī)范,并且結(jié)合建模中應(yīng)彰顯的學(xué)術(shù)精神進(jìn)行討論。
學(xué)術(shù)界尚未對(duì)統(tǒng)計(jì)模型的學(xué)術(shù)規(guī)范做出統(tǒng)一明確的規(guī)定。在應(yīng)用統(tǒng)計(jì)模型的過程中,主要包括根據(jù)研究問題選擇建立合適的模型,提出必要的假設(shè)條件,根據(jù)實(shí)際數(shù)據(jù)計(jì)算求解模型,對(duì)模型進(jìn)行調(diào)整等步驟。建模中,研究者根據(jù)問題的需要,也可能對(duì)模型做出推廣改進(jìn)等創(chuàng)新。根據(jù)上述建模步驟和內(nèi)容,本文將統(tǒng)計(jì)模型應(yīng)用的學(xué)術(shù)規(guī)范定義為:學(xué)術(shù)共同體根據(jù)學(xué)術(shù)求真的本質(zhì)和學(xué)術(shù)創(chuàng)新的要求,在模型建立、假設(shè)條件、數(shù)據(jù)使用、模型調(diào)整等應(yīng)用統(tǒng)計(jì)模型各個(gè)環(huán)節(jié)中應(yīng)遵守的準(zhǔn)則。這些準(zhǔn)則應(yīng)具體包括:模型的建立和調(diào)整要有理論依據(jù),避免牽強(qiáng)設(shè)計(jì)模型;合理的模型是主觀與客觀的統(tǒng)一,應(yīng)重視對(duì)模型適用條件的討論與檢驗(yàn);實(shí)證分析中不可忽視數(shù)據(jù)質(zhì)量問題,以免錯(cuò)用濫用統(tǒng)計(jì)數(shù)據(jù);建模中要避免命題不可證偽,陷入“數(shù)字游戲”誤區(qū);通過學(xué)術(shù)規(guī)范彰顯的學(xué)術(shù)精神應(yīng)體現(xiàn)在對(duì)模型方法做出有價(jià)值有意義的創(chuàng)新或是根據(jù)模型結(jié)果論證新的命題等。本文中的模型應(yīng)用是廣義上的應(yīng)用,不僅包括對(duì)現(xiàn)有模型的直接使用,也包括根據(jù)實(shí)際問題的需要對(duì)現(xiàn)有模型的推廣與改進(jìn)等。
模型應(yīng)用中的種種失范行為存在于上述學(xué)術(shù)規(guī)模定義的各個(gè)環(huán)節(jié)中,因此本文根據(jù)建模的各環(huán)節(jié)步驟對(duì)失范行為進(jìn)行劃分歸類,即討論在模型建立、假設(shè)條件、數(shù)據(jù)使用、模型調(diào)整等環(huán)節(jié)中的失范行為。由于學(xué)術(shù)規(guī)范的本質(zhì)是為了有利于學(xué)術(shù)創(chuàng)新,因而還需要討論在創(chuàng)新方面的相關(guān)失范行為。考慮到當(dāng)前失范行為瑣碎繁多,受篇幅所限,下文討論的是一些典型或者帶有一定隱蔽性的失范行為,并研究應(yīng)遵守的規(guī)范。
(一)模型的建立和選擇缺乏理論依據(jù)
在研究事物的客觀規(guī)律方面,統(tǒng)計(jì)模型是一種有用的定量分析工具,但并不是所有研究問題都適合使用模型。有些問題通過描述統(tǒng)計(jì)或者簡單的統(tǒng)計(jì)方法就可以解釋清楚,若仍使用復(fù)雜的模型,則是一種把簡單問題復(fù)雜化的失范表現(xiàn)。在決定使用模型后,應(yīng)充分考慮模型建立選取的依據(jù)。在分析問題背景后,首先要依據(jù)相應(yīng)專業(yè)理論建立研究問題的概念框架,然后據(jù)此來確定模型形式及變量,這樣研究對(duì)象與所建立的模型之間有較強(qiáng)的對(duì)應(yīng)關(guān)系,避免學(xué)術(shù)界所詬病的牽強(qiáng)設(shè)計(jì)使用模型。學(xué)術(shù)界中被廣泛認(rèn)可的模型大多有著堅(jiān)實(shí)的專業(yè)理論基礎(chǔ),實(shí)質(zhì)上這些模型是將專業(yè)領(lǐng)域的理論用統(tǒng)計(jì)模型的語言表示出來。例如,在匯率理論中,國家產(chǎn)品虛擬(CountryProductDummy,CPD)模型是計(jì)算購買力平價(jià)常用的模型[11]。表面上,該模型是一個(gè)僅具有兩個(gè)截距項(xiàng)的固定效應(yīng)面板數(shù)據(jù)模型,實(shí)際上,它是將國際貿(mào)易理論中“一價(jià)定律”*簡單地講,一價(jià)定律是指在不存在貿(mào)易壁壘及交易成本的條件下,各國可貿(mào)易的同質(zhì)產(chǎn)品的價(jià)格水平相同,即“同一商品,同一價(jià)格”。的核心內(nèi)容轉(zhuǎn)化為固定效應(yīng)模型形式,兩個(gè)截距項(xiàng)也具有明確的經(jīng)濟(jì)學(xué)含義*兩個(gè)截距項(xiàng)分別表示各國的購買力平價(jià)及商品的國際平均價(jià)格水平。。又如,在生產(chǎn)率分析中,隨機(jī)前沿分析(StochasticFrontierAnalysis,SFA)模型是一種常用的參數(shù)模型[12],形式上它只是在線性回歸分析中增加了一個(gè)誤差項(xiàng),實(shí)際上它是根據(jù)微觀經(jīng)濟(jì)學(xué)中的生產(chǎn)理論,在生產(chǎn)函數(shù)和距離函數(shù)概念的基礎(chǔ)上演繹出來的。與之相比,當(dāng)前中國很多研究中,建立模型時(shí)表現(xiàn)為缺乏相應(yīng)的專業(yè)理論依據(jù),通常直接將模型設(shè)定為某種形式,即模型形式的確定及變量的選取依據(jù)并不充分,這常導(dǎo)致建模時(shí)忽視模型的適用條件,沒有根據(jù)研究對(duì)象的特征建立合適的模型,而是為了在研究中能夠使用某個(gè)特定模型而建模,這種為了建模而建模的行為有用模型來點(diǎn)綴文章之嫌。例如,有的研究通過簡單線性回歸分析即可解決問題,但研究者將模型直接設(shè)定為更為復(fù)雜的狀態(tài)空間模型,且文中未說明隱變量所表示的具體指代,也未給出隱變量服從自回歸的依據(jù)。在研究現(xiàn)實(shí)問題的論文中,模型是作為一種解決問題的工具,它應(yīng)服從研究問題及專業(yè)理論的需要,因此學(xué)術(shù)求真的精神要求模型的建立和選擇要有充足的理論依據(jù),不能作為一種提升論文“含金量”的工具。
(二)缺少對(duì)模型適用條件的討論與檢驗(yàn)
任何模型都有適用條件,而模型的基本假設(shè)與現(xiàn)實(shí)相符的程度是判斷模型應(yīng)用是否恰當(dāng)?shù)闹匾獦?biāo)準(zhǔn)。若研究對(duì)象與模型的前提假定存在較大偏差,那么通過模型得出的結(jié)論就可能有誤。當(dāng)前的研究普遍缺乏對(duì)模型適用條件的討論與檢驗(yàn)。例如,很多統(tǒng)計(jì)模型都要求隨機(jī)誤差項(xiàng)要符合高斯—馬爾科夫假設(shè),但當(dāng)前的研究鮮有文章去深入討論數(shù)據(jù)是否符合這些假設(shè)條件。又如,諸多通過時(shí)間序列數(shù)據(jù)研究中國經(jīng)濟(jì)的論文中,研究者往往在向量自回歸(VectorAuto-Regression,VAR)模型的基礎(chǔ)上計(jì)算脈沖響應(yīng)函數(shù),以分析誤差變動(dòng)對(duì)自身及其他內(nèi)生變量的影響,但計(jì)算脈沖響應(yīng)必須要保證系統(tǒng)是穩(wěn)定的,所有外生變量保持不變,如果不滿足這些條件,所得到的結(jié)果就會(huì)失去意義。而中國經(jīng)濟(jì)在過去數(shù)十年處于快速發(fā)展中,即系統(tǒng)并不是穩(wěn)定的,在這種情況下仍去計(jì)算脈沖響應(yīng)就值得商榷。忽視前提假設(shè)也易造成模型使用的過度一般化,產(chǎn)生該模型具有普適性的假象。因此,研究者應(yīng)重視模型適用條件是否與研究對(duì)象相符的分析。在建模中,研究者通常也要提出新的假設(shè),若這些假設(shè)僅僅是為了模型建立求解的方便則難以令人信服。例如,貝葉斯分析的難點(diǎn)之一是如何求出后驗(yàn)分布,有的研究者在缺乏對(duì)先驗(yàn)信息的考察下,為了計(jì)算后驗(yàn)概率分布的方便而直接假定先驗(yàn)分布為共軛先驗(yàn)分布。模型是對(duì)客觀世界的一種簡化和抽象,是研究者根據(jù)自身的知識(shí)結(jié)構(gòu)等對(duì)研究對(duì)象的重構(gòu)和再現(xiàn),其主觀性很大程度上就體現(xiàn)在模型建立和假設(shè)條件上。因此,合理的模型與經(jīng)驗(yàn)事實(shí)及專業(yè)理論相一致,是主觀與客觀的統(tǒng)一,這些取決于研究者對(duì)問題本質(zhì)的認(rèn)識(shí)、對(duì)模型的理解及對(duì)數(shù)據(jù)的分析。學(xué)術(shù)求真的精神要求研究對(duì)象的主要特征能夠與模型的前提假定、適用條件相符。
(三)實(shí)證分析中錯(cuò)用濫用統(tǒng)計(jì)數(shù)據(jù)
當(dāng)模型選定后,數(shù)據(jù)就決定了模型結(jié)果,在某種意義上數(shù)據(jù)比模型方法更重要。就實(shí)際數(shù)據(jù)本身而言,數(shù)據(jù)質(zhì)量是屬于數(shù)據(jù)生產(chǎn)過程中的問題,不是模型應(yīng)用中產(chǎn)生的問題,但研究者不能忽視數(shù)據(jù)在生產(chǎn)加工過程中可能存在的問題,否則易造成誤用濫用統(tǒng)計(jì)數(shù)據(jù),導(dǎo)致模型結(jié)果產(chǎn)生偏差甚至失去意義。中國的社會(huì)經(jīng)濟(jì)數(shù)據(jù)尤其是宏觀數(shù)據(jù),常在內(nèi)涵外延、一致性、可比性、調(diào)查方法等方面存在問題。有些指標(biāo)的名稱與實(shí)際的內(nèi)涵外延并不一致,不能僅從指標(biāo)名稱來判定是否符合模型要求。例如,一些宏觀經(jīng)濟(jì)模型中要用到生產(chǎn)法GDP,研究者往往直接使用《中國統(tǒng)計(jì)年鑒》中公布的生產(chǎn)法GDP數(shù)據(jù),而實(shí)際上該指標(biāo)是根據(jù)生產(chǎn)法和收入法混合編制的[13]。數(shù)據(jù)的一致性和可比性同樣是需要重點(diǎn)關(guān)注的問題。在使用時(shí)間序列數(shù)據(jù)建模時(shí),有些指標(biāo)的名稱雖未隨時(shí)間發(fā)生變化,但其統(tǒng)計(jì)口徑已發(fā)生了很大變化,在時(shí)間維度上不具有一致性,如中國的固定資產(chǎn)投資數(shù)據(jù)*1992年前,固定資產(chǎn)投資數(shù)據(jù)的統(tǒng)計(jì)范圍是全民所有制范圍,1993-2003年是國有及其他經(jīng)濟(jì)類型單位投資,2004年以后是城鎮(zhèn)規(guī)模以上投資項(xiàng)目。,如果直接代入時(shí)序模型以研究其增速,其結(jié)果就混雜了由于統(tǒng)計(jì)調(diào)查范圍的變化所帶來的影響。在截面數(shù)據(jù)中,當(dāng)模型要用到不同國家的數(shù)據(jù)時(shí),各國可能對(duì)同一指標(biāo)因定義不同而不具可比性,如國外的工資統(tǒng)計(jì)通常會(huì)包含實(shí)物性收入及虛擬社會(huì)繳款,但中國的工資統(tǒng)計(jì)未包括這些,亦不可直接代入模型使用。應(yīng)當(dāng)指出的是,統(tǒng)計(jì)數(shù)據(jù)在生產(chǎn)加工過程中難免存在各種問題,但不意味著該數(shù)據(jù)完全不可在模型中使用。例如,有的指標(biāo)數(shù)據(jù)在絕對(duì)量上可能存在系統(tǒng)偏差,但其同比或環(huán)比的相對(duì)量可以消除這種偏差,此時(shí)建立表示相對(duì)量的模型比使用絕對(duì)量的模型更適合。通過對(duì)數(shù)據(jù)做適當(dāng)?shù)霓D(zhuǎn)換、調(diào)整,或者根據(jù)數(shù)據(jù)質(zhì)量選擇合適的模型,可在某種程度上解決數(shù)據(jù)質(zhì)量問題。因此,研究者對(duì)數(shù)據(jù)的分析不僅包括變量分布特征的描述統(tǒng)計(jì),還需要關(guān)注數(shù)據(jù)質(zhì)量,避免學(xué)術(shù)界所詬病的“垃圾進(jìn),垃圾出”。
(四)模型調(diào)整使研究的命題不可證偽,陷入“數(shù)字游戲”誤區(qū)
實(shí)證分析中,當(dāng)模型結(jié)果不理想時(shí),如參數(shù)未通過顯著性檢驗(yàn)、結(jié)果與預(yù)期不符等,研究者通常會(huì)調(diào)整模型。常見的做法是通過各種技術(shù)方法上的嘗試,調(diào)整出符合要求的模型結(jié)果。例如,在結(jié)構(gòu)方程模型中,當(dāng)模型的擬合效果不甚理想時(shí),研究者直接根據(jù)結(jié)果中的修正指數(shù)來增減變量間的相關(guān)性及因果關(guān)系,以提高模型的擬合優(yōu)度。實(shí)際上,對(duì)于模型使用熟練的研究者,通過技術(shù)手段調(diào)整出理想的結(jié)果并不難,但這種做法會(huì)使所研究的命題不可證偽,而科學(xué)研究應(yīng)是既可證實(shí)也可證偽[14]59-94。在上例中,如果研究者不能通過新的獨(dú)立樣本來驗(yàn)證調(diào)整后的模型,則會(huì)使研究不可證偽。通過技術(shù)手段直接調(diào)整模型的方式也易陷入玩統(tǒng)計(jì)“數(shù)字游戲”的誤區(qū),使得結(jié)果失去意義。例如,有的重要解釋變量未通過顯著性檢驗(yàn),研究者為了使其在數(shù)值上顯著,不斷嘗試換取不同時(shí)間段的變量,直到檢驗(yàn)的P值小于0.05為止。就本例而言,這種做法是混淆了統(tǒng)計(jì)推斷和探索性分析[15]514,表面上變量通過了統(tǒng)計(jì)檢驗(yàn),但該檢驗(yàn)已失去了意義。產(chǎn)生這種失范行為的重要原因是研究者在實(shí)證前已對(duì)模型結(jié)果設(shè)定了目標(biāo)。我們可以對(duì)實(shí)證結(jié)果有理論預(yù)期,但不能把理論預(yù)期等同于模型必須要得到的結(jié)果,否則這種研究前就已設(shè)定結(jié)論的方式使得研究的命題不可證偽,從而使研究失去意義。當(dāng)需要對(duì)模型調(diào)整時(shí),如果所研究的命題是根據(jù)有關(guān)專業(yè)理論構(gòu)建的,那么調(diào)整的起點(diǎn)應(yīng)該從概念框架進(jìn)行調(diào)整,找出支持做這種修改調(diào)整的理論依據(jù),重新提出假設(shè),重新建模。模型結(jié)果不會(huì)總令人滿意,但先有結(jié)論后進(jìn)行研究的方式違背了科學(xué)研究的原則,學(xué)術(shù)求真的精神要求客觀對(duì)待模型結(jié)果,保持價(jià)值中立,模型調(diào)整同樣需要理論依據(jù)。
(五)將模型應(yīng)用的簡單重復(fù)當(dāng)作研究的創(chuàng)新
通過模型能夠論證新的命題是實(shí)證分析的創(chuàng)新所在。然而,在一些研究現(xiàn)實(shí)問題的論文中,作者認(rèn)為本文的創(chuàng)新之處是在該問題上根據(jù)某模型首次進(jìn)行了定量分析。實(shí)際上,文中所用模型在該問題所屬領(lǐng)域早已廣泛應(yīng)用,其“創(chuàng)新”僅是在模型中換了一批數(shù)據(jù)一個(gè)具體問題而已。這種創(chuàng)新是把文章的原創(chuàng)性與論文數(shù)據(jù)的新穎性混為一談了。數(shù)據(jù)或題材的新穎固然是研究中具有新意的表現(xiàn),但學(xué)術(shù)精神中的“獨(dú)立之精神”則要求論文能夠提出并論證新的命題,即命題上的創(chuàng)新是文章獨(dú)創(chuàng)性的體現(xiàn)。如果文章僅止于數(shù)據(jù)的新穎而未根據(jù)模型結(jié)果論證新的命題,這只是模型的一般應(yīng)用而已,其一典型之例是數(shù)據(jù)包絡(luò)分析(DEA)的濫用。DEA是一種測(cè)度效率的非參數(shù)方法,由于它具有適用條件寬松、能夠處理多產(chǎn)出等優(yōu)點(diǎn),因而研究者常選取該模型測(cè)算各個(gè)領(lǐng)域的效率。從中國期刊網(wǎng)主題搜索DEA,多達(dá)1萬余條結(jié)果。但諸多文章只是對(duì)DEA的一般應(yīng)用,作者稱該文的創(chuàng)新之處是首次在該地區(qū)、該行業(yè)或該領(lǐng)域使用DEA測(cè)算了相應(yīng)的效率,研究方式幾乎都是確定投入產(chǎn)出數(shù)據(jù)后,代入模型計(jì)算出效率值再加以評(píng)論。如果該文的目的僅是為了測(cè)算出相應(yīng)的效率值,這種工作是有意義的。但如果從學(xué)術(shù)精神高度考慮,這只是DEA在實(shí)際問題中的不同應(yīng)用而已。模型是對(duì)一般規(guī)律的刻畫,具有投入產(chǎn)出關(guān)系的問題大都可以應(yīng)用DEA測(cè)度效率,真正的創(chuàng)新應(yīng)該是能夠針對(duì)投入產(chǎn)出變量的選取或模型結(jié)果發(fā)現(xiàn)新的問題,從而提出有關(guān)效率度量新的觀點(diǎn),彌補(bǔ)現(xiàn)有研究的不足,對(duì)效率測(cè)度有實(shí)質(zhì)性的推進(jìn)。此外,有一些實(shí)證研究認(rèn)為其創(chuàng)新之處是使用了學(xué)術(shù)界中的某個(gè)新模型,但在該研究中只是將原有的國外數(shù)據(jù)換成了中國數(shù)據(jù)而已。如果這種研究未通過新模型發(fā)現(xiàn)出新的問題進(jìn)而論證新的命題,或者論證的是眾所周知的命題,則也是模型的一般應(yīng)用而已。例如,有的研究通過復(fù)雜的二維動(dòng)力系統(tǒng)來分析科技進(jìn)步與經(jīng)濟(jì)增長間的關(guān)系,得出的結(jié)論卻是常識(shí)性的命題:科技進(jìn)步是經(jīng)濟(jì)長期增長的關(guān)鍵因素。因此,無論是使用了新數(shù)據(jù)或是新模型,如果與已有的研究相比,并未得出新的命題,那么它就不是真正的創(chuàng)新。造成這種模型應(yīng)用上的簡單重復(fù)的重要原因是缺乏學(xué)術(shù)積累,“沒有同現(xiàn)存的研究進(jìn)行任何理論層次的對(duì)話”[16]。
(六)模型創(chuàng)新缺少學(xué)術(shù)意義或?qū)嶋H應(yīng)用價(jià)值
研究者根據(jù)問題的需要也常對(duì)現(xiàn)有模型做出推廣改進(jìn)或提出新的模型。若參照評(píng)判理論優(yōu)劣的標(biāo)準(zhǔn)[17]22,模型創(chuàng)新可從以下三方面入手:一是擴(kuò)大原模型的使用范圍。新模型是對(duì)原模型的推廣,或放寬了原有的假設(shè)條件,或原模型可看作是新模型的特殊情況,在某種條件下(如新模型中的參數(shù)取某值時(shí)),新模型可轉(zhuǎn)化為原模型。具體是使用新模型或是原模型,可通過假設(shè)檢驗(yàn)等方法來確定。模型推廣是建模中較為常見的一種創(chuàng)新形式,有助于解決更復(fù)雜的問題,發(fā)現(xiàn)本質(zhì)規(guī)律。例如,Hansen提出的門限回歸模型可看作是線性回歸分析在分段回歸問題上的推廣[18],是否需要使用該模型可通過檢驗(yàn)?zāi)P椭械拈T限變量來判斷。二是改進(jìn)現(xiàn)有模型的缺陷。與上述模型推廣相比,這類創(chuàng)新的特點(diǎn)是提高了模型的解釋能力或預(yù)測(cè)精度,常表現(xiàn)為調(diào)整模型的某些條件或改進(jìn)模型的內(nèi)部結(jié)構(gòu),使得改進(jìn)后的模型與研究對(duì)象的特征更吻合,因而更合理更符合實(shí)際。例如,在DEA模型家族中,BCC模型對(duì)CCR模型的改進(jìn)就屬于這種情況。在測(cè)度效率中,CCR模型假定各企業(yè)的生產(chǎn)情況是規(guī)模報(bào)酬不變,但BCC模型將該假設(shè)調(diào)整為規(guī)模報(bào)酬可變,通過改變CCR模型中的約束條件得以實(shí)現(xiàn)[19]。三是提出了具有實(shí)用或?qū)W術(shù)價(jià)值的新模型。這類模型創(chuàng)新的特點(diǎn)是可獲得顯著的經(jīng)濟(jì)社會(huì)效益,或是模型中蘊(yùn)含了新的思想,有益于開辟新的研究領(lǐng)域,發(fā)現(xiàn)新的理論、方法。例如,LASSO模型的提出就具有很高的學(xué)術(shù)價(jià)值[20],它成為高維領(lǐng)域中變量選擇的經(jīng)典模型,開辟了新的模型家族,之后諸多統(tǒng)計(jì)模型都是在該模型基礎(chǔ)上提出的*變量選擇模型中的Elastic Net、Group Lasso、Adaptive Lasso、Fused Lasso等模型都是在Lasso模型基礎(chǔ)上提出的。,成為近十年來統(tǒng)計(jì)學(xué)界的熱點(diǎn)前沿問題。需要明確的是,創(chuàng)新應(yīng)是有價(jià)值有意義的,不能簡單理解為與現(xiàn)有模型有所不同就是創(chuàng)新。有些研究表面上是“創(chuàng)新”出更復(fù)雜更一般化的模型,但實(shí)際上是對(duì)現(xiàn)有模型的機(jī)械拼湊、陳舊方法的相互套用,此類“創(chuàng)新”只能看作是對(duì)現(xiàn)有模型的模仿復(fù)制。有些“創(chuàng)新”后的模型假設(shè)條件繁多苛刻,結(jié)論卻很單薄,這種“創(chuàng)新”只是在做一些數(shù)學(xué)推導(dǎo)而已,也不符合數(shù)學(xué)美。模型創(chuàng)新應(yīng)著重解決學(xué)術(shù)界共同關(guān)注的問題,新的模型也應(yīng)是對(duì)某一類問題都適用,而不是僅能解決個(gè)別問題。真正的創(chuàng)新需要研究者在知識(shí)的廣度和深度上具備較高修養(yǎng),深諳學(xué)術(shù)界的前沿?zé)狳c(diǎn)問題。模型創(chuàng)新失范的直接原因是學(xué)術(shù)積累不足,更根本的原因是對(duì)學(xué)術(shù)的急功近利,為了體現(xiàn)研究的價(jià)值,在不具備模型創(chuàng)新的條件下也要“創(chuàng)新”,這同樣是對(duì)學(xué)術(shù)精神的違背。
(一)有關(guān)部門應(yīng)制定統(tǒng)計(jì)學(xué)的學(xué)術(shù)規(guī)范文本
為了更全面規(guī)范學(xué)術(shù)共同體對(duì)統(tǒng)計(jì)模型的應(yīng)用,建議中國教育主管部門組織有關(guān)專家制定、出臺(tái)權(quán)威的學(xué)術(shù)規(guī)范文本,并有一定的強(qiáng)制性和約束力。迄今,中國有關(guān)部門僅制定了一些各學(xué)科通用的學(xué)術(shù)規(guī)范準(zhǔn)則,如《高等學(xué)校科學(xué)技術(shù)學(xué)術(shù)規(guī)范指南》、《高校人文社會(huì)科學(xué)學(xué)術(shù)規(guī)范指南》等。這些規(guī)范指南更多地是從形式做出規(guī)定,如引文、注釋的規(guī)范等,而中國的學(xué)術(shù)界普遍缺乏對(duì)專業(yè)學(xué)科領(lǐng)域的學(xué)術(shù)規(guī)范,作為一級(jí)學(xué)科的統(tǒng)計(jì)學(xué)亦不例外。而在國外,除了一般性的學(xué)術(shù)規(guī)范準(zhǔn)則,亦有專業(yè)學(xué)科領(lǐng)域的學(xué)術(shù)規(guī)范,如前文所述的《美國心理學(xué)會(huì)出版發(fā)表手冊(cè)》等。統(tǒng)計(jì)模型是統(tǒng)計(jì)學(xué)的重要組成部分,考慮到出臺(tái)學(xué)術(shù)規(guī)范的可行性,首先應(yīng)該由專家學(xué)者通力編制統(tǒng)計(jì)學(xué)的學(xué)術(shù)規(guī)范準(zhǔn)則,不僅在體例規(guī)則上,而且能在內(nèi)容、技術(shù)層面對(duì)統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)模型部分做出規(guī)范,以使學(xué)者有章可循,“盡管規(guī)范中難免存在例外,但遇到疑問時(shí)也能有所參考”[2]。
(二)完善學(xué)術(shù)論文的審稿制度
統(tǒng)計(jì)模型的規(guī)范使用與期刊的審稿用稿導(dǎo)向也有很大關(guān)系。當(dāng)前學(xué)者所用的統(tǒng)計(jì)模型普遍比較復(fù)雜,且種類繁多,因此需要期刊不斷完善外審專家?guī)斓慕ㄔO(shè)。在用稿方面,期刊對(duì)于統(tǒng)計(jì)模型的使用原則,應(yīng)秉承學(xué)術(shù)的求真本質(zhì),看重是否通過模型得出了新的命題或者是否對(duì)模型方法做出了有價(jià)值的創(chuàng)新,不是單純以模型的復(fù)雜程度評(píng)判研究的含金量。在模型應(yīng)用的其他方面,可關(guān)注模型建立及調(diào)整的理論依據(jù)、假設(shè)條件的合理性、數(shù)據(jù)質(zhì)量等。此外,為了保證模型結(jié)果具有可復(fù)制性*即讀者在使用相同程序和數(shù)據(jù)條件下,可以得到與作者相同或相似的結(jié)果。,可參照英國皇家統(tǒng)計(jì)學(xué)會(huì)期刊的做法,在期刊官網(wǎng)上可下載論文中的源程序、數(shù)據(jù)。
本文探討了統(tǒng)計(jì)模型應(yīng)用的學(xué)術(shù)規(guī)范問題,中國學(xué)術(shù)界在統(tǒng)計(jì)模型上存在的學(xué)術(shù)失范行為不止上文所列,本文僅是起到拋磚引玉的作用。造成學(xué)術(shù)失范的原因是多方面的,既有研究者對(duì)模型的理解存在誤區(qū),也有制度規(guī)則上的缺欠,但更根本的原因是學(xué)術(shù)積累不足,在研究上存在急功近利行為。統(tǒng)計(jì)模型學(xué)術(shù)失范問題的解決也有待于中國學(xué)術(shù)界整體氛圍的凈化。在社科領(lǐng)域中,統(tǒng)計(jì)模型在探求本源、尋求規(guī)律方面是一種有用的分析工具,研究者應(yīng)不斷提高自身的學(xué)術(shù)修養(yǎng),在學(xué)術(shù)規(guī)范中彰顯“獨(dú)立之精神,自由之思想”的學(xué)術(shù)精神。
[1]李金華. 經(jīng)濟(jì)學(xué)論文模型泛化現(xiàn)象解析與思辨[J]. 經(jīng)濟(jì)學(xué)動(dòng)態(tài),2013(3).
[2]AmericanPsychologicalAssociation.PublicationManual[PubManual]oftheAmericanPsychological(Psych)Association[S]. 6thed.WashingtonDC:AmericalPsychologicalAssociation,2010.
[3]TheTaskForceonStatisticalInferenceAPABoardofScientificAffairs.StatisticalMethodsinPsychologyJournals:GuidelinesandExplanations[J].AmericanPsychologist,1999,54(8).
[4]PaulPfleiderer.TheMisuseofTheoreticalModelsinFinanceandEconomics[R/OL].[2014-03-26].http://www.gsb.stanford.edu/sites/default/files/research/documents/Chameleons%20-The%20Misuse%20of%20Theoretical%20Models%20032614.pdf, 2014.
[5]趙凌云. 經(jīng)濟(jì)學(xué)數(shù)學(xué)化的是與非[J]. 經(jīng)濟(jì)學(xué)家,1999(1).
[6]于曉華. 如何正確運(yùn)用計(jì)量經(jīng)濟(jì)模型進(jìn)行實(shí)證分析——實(shí)證分析中的數(shù)據(jù)、模型與參數(shù)[J]. 農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2014(7).
[7]孫秋碧,魏瑾瑞.數(shù)量分析方法的選擇與應(yīng)用——來自課程作業(yè)和建模競賽的思考[J].統(tǒng)計(jì)與信息論壇,2010,26(10).
[8]陳學(xué)飛. 談學(xué)術(shù)規(guī)范及其必要性[J].中國高等教育,2003(11).
[9]孫利天. 學(xué)術(shù)規(guī)范的內(nèi)在支撐——學(xué)術(shù)精神[J]. 吉林大學(xué)社會(huì)科學(xué)學(xué)報(bào),2005,45(1).
[10]葉繼元. 學(xué)術(shù)期刊與學(xué)術(shù)規(guī)范[J]. 學(xué)術(shù)界,2005(4).
[11]DSPrasadaRao.ComputationofBasicHeadingPurchasingPowerParities(PPPs)forComparisonswithinandbetweenRegions[C].Chapter4inMeasuringtheRealSizeoftheWorldEconomy,WorldBank,WashingtonDC, 2013.
[12]AignerDJ,LovellCAK,SchmidtPJ.FormulationandEstimationofStochasticFrontierProductionFunctionModels[J].Econometrics,1977, 6(1).
[13]中華人民共和國國家統(tǒng)計(jì)局. 中國主要統(tǒng)計(jì)指標(biāo)詮釋[S]. 2版. 北京:中國統(tǒng)計(jì)出版社,2013.
[14]查爾莫斯A.F. 科學(xué)究竟是什么[M].3版.魯旭東,譯.北京:商務(wù)印書館,2013.
[15]DavidSMoore,WilliamINotz.Statistics:ConceptsandControversies[M]. 7thed.NewYork:W.H.FreemanandCompany,2008.
[16]王笛. 學(xué)術(shù)規(guī)范與學(xué)術(shù)批評(píng)——談中國問題與西方經(jīng)驗(yàn)[J]. 開放時(shí)代,2001(12).
[17]風(fēng)笑天. 社會(huì)研究方法[M]. 4版. 北京:中國人民大學(xué)出版社,2013.
[18]HansenBruceE.ThresholdEffectsinNon-dynamicPanels:Estimation,TestingandInference[J].JournalofEconometrics,1999,93(2).
[19]BankerRD,CharnesA,CooperWW.SomeModelsforEstimatingTechnicalandScaleInefficienciesinDataEnvelopmentAnalysis[J].ManagementScience, 1984,30(9).
[20]TibshiraniR,RegressionShrinkageandSelectionviatheLasso[J].JournaloftheRoyalStatisticalSociety,SeriesB1996, 58(1).
ResearchontheAcademicNormoftheApplicationofStatisticalModels
FANChao1,2
(1.InternationalStatisticalInformationCenter,NationalBureauofStatistics,Beijing100826,China;2.SchoolofStatistics,RenminUniversityofChina,Beijing100872,China)
Inthefieldofthesocialsciences,misusingandabusingstatisticalmodelsaremoreandmoreseriousintheprocessofwidespreadusingmodels.Allkindsofnon-standardbehaviorsviolatethespiritofacademicresearch.Statisticalmodelsshouldcomplywithacademicnorm.Itincludes:Makingandmodifyingmodelsshouldhavetheoreticalbasis;areasonablemodelistheunityofsubjectiveunderstandingandobjectiveworld;empiricalanalysisshouldpayattentiontothequalityofdatainordertoavoidmisusingorabusingstatistics;theprocessofmodelingshouldavoidmakingthesisstatementsunfalsifiableandplaying"numbersgame".Theacademicspiritshouldbereflectedinthemeaningfulinnovationsforthemodelsorproposingnewthesisstatementsbasedonthemodelresultsbyacademicnorm.NowChinashouldmakerelevantstatisticalacademicstandardsandimproveacademicpeerreviewsystemtosolvetheproblemofnon-standardacademicbehaviors.
statisticalmodels;academicnorm;academicspirit
2016-03-28
國家自然基金項(xiàng)目《金融資產(chǎn)配置中面板數(shù)據(jù)動(dòng)態(tài)因子模型研究》(71271210)
范超,男,北京人,統(tǒng)計(jì)師,博士生,研究方向:統(tǒng)計(jì)模型,購買力平價(jià),效率測(cè)度。
F222.3∶O212.1
A
1007-3116(2016)08-0026-06
(責(zé)任編輯:崔國平)
【統(tǒng)計(jì)理論與方法】