王國凡,薛二劍,唐學峰
大型國際綜合性運動會獎牌數預測研究
——以北京奧運會為例
王國凡1,薛二劍2,唐學峰3
基于計量經濟學理論,依據人口數、人均GDP、主場優(yōu)勢、社會制度、上屆奧運會的成績,利用多元非線性回歸分析建立初步模型;考慮世界各國競技體育實力存在差距,利用模糊C均值聚類分析理論,將競技體育實力劃分為5個等級,通過引入虛擬變量,提出經濟學與競技體育實力差異理論相結合的改進模型,對2008年北京奧運會獎牌數進行預測分析。結果表明,該模型既能揭示世界各國奧運會獎牌數變化的總體趨勢,又能克服競技體育實力差異對預測精度的影響;適用于大型國際綜合性運動會獎牌數的預測,具有較強的科學性和可行性。
計量經濟學;大型國際綜合性運動會;奧運會;獎牌;預測模型
自二戰(zhàn)后,社會學家和經濟學家從不同的國家性質與經濟水平等因素分析影響國家在奧運會中獲得的獎牌數。較早關于這方面的研究成果有Ball[1],Grimes A Ray等人[2]和Levine N[3],而近30年后關于這方面的理論研究才重新被人們所關注[4-8]。Johnson Daniel K N和Ayfer Ali[9]通過引用一國人均收入(以人均GDP為依據)、人口數、政治體系(是否為一黨專政君主政體,是否為社會主義國家或是資本主義國家)、地理位置與氣候,以及是否為主辦國等社會、經濟學方面因素作為變量,基于經濟學方法與這些變量,他們甚至計算出一個國家要派出一名運動員參加奧運會及每贏得一枚奧運獎牌需要的“投資費用”。Bernard與Busse[4]以此為基礎,提出了基于計量經濟學理論,將人口數和經濟資源(以GDP為依據)作為生產要素,利用柯布—道格拉斯生產函數對獎牌數分部進行了研究。此外,Bernard和Busse還引入主場優(yōu)勢、不同國家經濟體系(計劃經濟和市場經濟)的虛擬變量,同時添加了上屆奧運會獎牌數這一變量,并建立回歸預測模型,使預測結果更加準確。
在2008年奧運會獎牌預測方法中,國內學者運用了時間序列法[10]、趨勢直線外推法[11]、統(tǒng)計回歸方法[12]、概率模型[13]、灰色預測[14-15]等方法和手段,開展了大量研究。吳殿廷,吳穎[15]利用模型與東道主效應(或稱主場優(yōu)勢)相結合預測出2008年北京奧運會中美兩國可能會有的獎牌數,取得了很好的預測結果。但是,這些預測方法僅以歷屆奧運會獎牌數為基礎,部分文獻雖結合了主場優(yōu)勢進行分析預測,但這類“以牌推牌”的預測方法,存在較大的偶然性。國外也有不少專家對2008年北京奧運會獎牌數進行了預測研究,遺憾的是,大部分預測結果與真實成績都存在著較大差距。
筆者認為,單純運用經濟學原理提出預測的模型可能適合一個或若干個國家,但把它應用到所有國家是缺乏依據的。本文以2008年北京奧運獎牌數的預測研究為例,嘗試提出一種適用于大型國際綜合性運動會獎牌數的較精確模型。在筆者建立的新模型中,不僅考慮到國家人口數、人均GDP、主場優(yōu)勢、上屆奧運會成績這些關于社會、經濟學方面的變量,另外,加入了在國際競技體育中關鍵的實力差距評估這一因素。事實上,正是這些因素的共同作用決定了一個國家可能獲得獎牌的數目[16-17]。新模型引用模糊C均值聚類分析理論,將各國競技體育實力劃分為5個等級,通過虛擬變量,基于計量經濟學與各國競技體育實力差距相結合的方法,對2008年北京奧運會成績進行預測研究,結果發(fā)現(xiàn)該模型預測精度大大提高。該模型也適用于國際綜合大型運動會獎牌數的預測。
本文采用的世界各國在歷屆奧運會獲得獎牌數據來源于中國奧委會官方網站上公布的成績。世界各國人口數據來源于Angus Maddison,Historical Statistics for the World Economy:1-2003 AD。世界各國GDP來源于聯(lián)合國貿易與發(fā)展組織統(tǒng)計的數據。2008年世界各國GDP來源于由美國中央情報局(CIA)在The World Factbook《世界概況》刊登統(tǒng)計的數據。本文計算所用世界各國人口數及GDP均為舉辦歷屆奧運會年底的數據。
人口數對參賽國獲得獎牌的多少起著重要的作用。人口基數大,國家具有潛在運動天賦的運動員數目就大,就有更大幾率出現(xiàn)優(yōu)秀運動員從而獲得奧運獎牌。
國家的經濟發(fā)展水平可通過國內生產總值(GDP)與人口比值來表示,即人均GDP。人均GDP對一個國家的體育發(fā)展起著至關重要的作用,對獲得奧運會獎牌數具有重要的制約作用。
在奧運會比賽中,主場優(yōu)勢往往起著十分重要的作用[18-20]。由于主辦國的運動員更加熟悉比賽環(huán)境和競賽器材,同時,眾多本國觀眾的主場助威會調動本國運動員的積極情緒和裁判無意識的支持主隊等,最終能夠在一定程度上有助于主辦國運動員競賽成績的提高。
社會制度的不同對奧運會也會產生影響。社會主義國家對待像夏季奧運會這樣的大型國際競賽,在經濟上往往通過“舉國體制”來進行全力保障;而資本主義的經濟體制是自由市場經濟,其投入也是有條件的。有研究表明,不同國家的經濟體制,對奧運會獎牌是有影響的——社會主義國家比資本主義國家在奧運會獎牌分享中,更具有優(yōu)勢。
基于上面的因素分析,將影響國家獲得奧運會獎牌數目的因素選擇為人口、人均GDP、主場優(yōu)勢、社會制度以及上屆奧運會成績,從而建立如下計量經濟模型:
以獎牌占有率M作為因變量[4],即:
上式表示第i個國家在當屆奧運會取得的獎牌數(medalsi)與當屆奧運會總獎牌數(的比值。根據本文前面的分析,若不考慮邊際收益遞減原理,人口越多,就會擁有更多有天賦的優(yōu)秀運動員;人均GDP越大,就會有更多經費訓練出優(yōu)秀的運動員,從而共同決定著國家在奧運會比賽中取得的成績,筆者在此將它們的影響程度以非線性的方式進行處理,取人口數(log(POP))與人均GDP(log(POP))以10為底的對數作為變量,建立的多元非線性回歸模型如下:
式中:M為獎牌占有率;t為時間趨勢(1=1988年奧動會,2=1992年奧動會);POP為當年參賽國人口數(個);PGDP為當年參賽國人均GDP(美元);Home為虛擬變量,Home=1表示奧運會主辦國,Home=0表示非主辦國;P為虛擬變量,P=1為社會主義國家,P=0為資本主義國家;α為常數;βj,(j=1,…,5)為各解釋變量的系數。
二戰(zhàn)以后,越來越多的國家與地區(qū)代表隊陸續(xù)參與奧運會同臺競技;而在這之前,由于部分國家受多種原因限制無法參加夏季奧運會以及大國之間的抵制,因此,受到社會經濟方面的影響因素也較小,使得各國運動成績缺乏可比性。此外,在1984年洛杉磯奧運會中,以前蘇聯(lián)為首的社會主義國家抵制參與奧運會,導致世界各國獎牌占有率失衡,即1984年獎牌占有率可視為異常數據。因此,為了提高預測精度,1988年漢城奧運會不作為預測樣本數據,最終選取1992—2004年奧運會數據進行預測。在國家選擇上,將獲得至少一枚獎牌的國家作為當年奧運會的樣本國家,而沒有獲得獎牌數的國家被剔除。
基于1992—2004年數據的擬合,即可得到模型(2)各解釋變量的系數,并假設解釋變量系數在對2008年北京奧運會的預測中是不變的;與此同時,可類似建立金牌占有率(Mg)多元非線性回歸模型。得到的獎牌與金牌占有率回歸結果見表1。
表1 1992—2004年獎牌與金牌占有率回歸結果
根據該回歸結果,預測出2008年北京奧運會獎牌數與金牌數(見表2、表3)。從表2、表3的預測結果可以看出,部分國家的預測獎牌數、金牌數與真實值差距較大。
針對上述傳統(tǒng)多元非線性回歸模型在預測精度上的不足,筆者引入模糊C均值聚類算法,對奧運會參賽國競技體育實力進行等級評估;在此基礎上,利用引入多個虛擬變量表示競技體育實力等級,對模型(2)進行改進,提出一種更高預測精度的預測模型。
表2 2008年北京奧運會各國獎牌預測值
表3 2008年北京奧運會各國金牌預測值
在模糊C均值(FCM)聚類算法中,每一個數據點按照一定的模糊隸屬度隸屬于某一聚類中心,這一聚類技術作為對傳統(tǒng)聚類技術的改進,是jim Bezdek于1981年提出的。該方法首先隨機選取若干聚類中心,所有數據點都被賦予對聚類中心一定的模糊隸屬度,然后通過迭代方法不斷修正聚類中心,迭代過程以極小化所有數據點到各個聚類中心的距離及隸屬度值的加權和優(yōu)化目標[21-22]。
首先對奧運會參賽國建立5個評價等級(見表4),依據1988至2004年各國參加奧運會獲得的金牌、銀牌、銅牌以及獎牌總數為樣本數據,統(tǒng)計出這5屆奧運會世界各國獲得的獎牌總數,利用模糊C均值聚類進行分類比較,實現(xiàn)工具為MATLAB軟件。MATLAB模糊邏輯工具箱提供了模糊C均值聚類方法即FCM命令函數[23]。得到的分類結果見表5。
表4 參賽國競技體育實力標度的劃分及虛擬變量設定
表5 基于模糊C均值聚類分類結果
在奧運會獎牌數預測中,許多經濟變量是可以定量度量的;而某些影響因素若無法量化,將對模型預測結果存在著很大的影響。如競技體育實力是反映各國家比賽成績的核心要素,也是決定獲得獎牌數增多或減少的主要因素,競技體育實力將直接決定誰將成為奧運會的霸主。因此,建立的經驗模型要想取得準確的預測值,就必須考慮競技體育實力的影響。筆者采用虛擬變量方法,將這一定性因素定量化,建立含有多個虛擬變量的回歸模型,從而能夠更好地反映出影響因素的共同作用。
在當代計量經濟學分析中,利用模型進行回歸分析是應用比較廣泛的一種數據分析技術。一般回歸分析中的變量都是定量變量,這是因為模擬回歸需要樣本數據。而在實際中,模型僅考慮定量變量是不夠的,如果某一變量確實受到定性因素影響,將虛擬變量技術用到回歸模型中就可以解決該問題[24],本文中就利用了虛擬變量將主場優(yōu)勢影響因素定量化。
將奧運會參賽國進行分類后,所有參賽國競技體育實力劃分為5個不同的等級,可利用虛擬變量表示這5個等級(見表2),再將虛擬變量添加到多元非線性回歸模型從而建立新模型。為了避免“虛擬變量陷阱”[25],利用4個虛擬變量D1,D2,D3,D4分別表示5個類別,即:
從表1的回歸結果可知,社會制度虛擬變量系數很小,換句話說,在現(xiàn)在奧運會比賽中,社會主義國家的幾乎不占優(yōu)勢。故將其忽略。
新模型為:
利用1992—2004年奧運會實際數據為樣本數據,對新模型(3)進行回歸,得到的結果見表6。
表6 改進模型的獎牌與金牌占有率回歸結果
從回歸結果可以看出,利用模糊C均值聚類對參賽國分類后,通過添加虛擬變量得到的改進模型(3),擬合優(yōu)度R2明顯大于模型(2)。因此,改進的新模型(3)預測結果更好,因為,R2值越高,預測越準[26]。
有了新模型(3),就可以重新對2008年北京奧運會獎牌數進行預測,預測結果數據見表2、表3。從預測中可以看出,基于模糊C均值聚類分類的改進模型,在對大部分國家的獎牌預測中,其精度都要高于前模型。
利用模型(3)對中國、俄羅斯、德國等幾個國家進行預測,結果存有較大差距。出現(xiàn)這種情況是有原因的,在這里可稱之為國家的競技體育實力“等級跳躍”現(xiàn)象;筆者認為:競技體育實力“等級跳躍”,是指若將奧運會參賽國分成若干個等級區(qū)間,各國分別處于不同的等級,但在奧運會比賽中,有時會出現(xiàn)個別國家運動員發(fā)揮異常出色,奪牌的實力明顯變強,從而使得該國的競技實力等級上升一級甚至多級;相反,有的國家運動員集體發(fā)揮不理想,從而會使該國的競技實力等級下滑的現(xiàn)象。事實上,歷屆奧運會都出現(xiàn)過競技體育實力“等級跳躍”現(xiàn)象。以此分類,中國的競技體育實力為“較強”,但曾在1988年漢城奧運會出現(xiàn)過實力等級下滑的現(xiàn)象,當屆中國的競技體育實力等級就下降為“一般”。
俄羅斯在近兩屆奧運會的實力與中國相當,尤其是在奪金上能夠體現(xiàn)出來。2000年奧運會俄羅斯比中國多獲4枚金牌,但在2004年奧運會上,中國超出俄羅斯5枚金牌。將俄羅斯在2008年奧運會的競技體育實力下降一個等級(即為類別4),那么獎牌數與金牌數預測值(見表2、表3中的“預測修正”)與真實值相當接近。牙買加異軍突起在2008年北京奧運會的田徑賽場,攪亂了奧運會田徑賽場的原有形勢。這個非洲小國的田徑實力緊隨美國、俄羅斯,因此,使得預測值與真實值差距較大。如果將牙買加的競技體育實力等級提升,那么預測的獎牌數與真實值差距較小,金牌數預測與真實值則完全相同(見表2、表3中的“預測修正”)。此外,從2008年奧運會還可以看出,英國、烏克蘭發(fā)揮出色,等級提升;德國、日本、荷蘭、羅馬尼、匈亞利等國發(fā)揮失常,等級下降。但從總體來看,大部分國家均處于所分類的等級之中。
另外,在奧運會主辦國,有時還會出現(xiàn)一個“主場優(yōu)勢跳躍”現(xiàn)象,即主辦國不僅占有主場優(yōu)勢,甚至還可以由于多種有利因素而再次提升一個甚至多個等級。針對這種情況,筆者利用基于模糊C均值聚類改進的非線性多元回歸模型對1992—2004主辦國通過“主場優(yōu)勢跳躍”進行預測,即不僅考慮主場優(yōu)勢這個虛擬變量,同時,將主辦國體育競技實力提升一個或多個等級,所計算得到的預測值與真實值相差無幾。對于2008年北京奧運會的主辦國中國,上升一個等級(即為類別5)再進行預測,從而得到的獎牌數為97(見表2、表3中的“預測修正”),與實際獎牌數僅差3枚。
值得一提的是,主辦國通常在下屆奧運會表現(xiàn)出實力有較大幅度的下滑現(xiàn)象,筆者稱之為“次場效應”。例如,文中對希臘的預測結果,真實值與預測值就存在著較大的差距。從分類結果可以看出,希臘競技體育實力等級為“較弱”,若將希臘下降一個等級,即為類別1(弱),其預測值與真實值則較為接近。
(1)從計量經濟學角度出發(fā),指出人口數、人均GDP決定著國家獲得奧運會獎牌數目,同時分析了主場優(yōu)勢以及上屆奧運會成績也會對獲得獎牌數有一定程度的影響。以此為依據,建立初步的多元非線性回歸模型(2),這樣建立的模型,解決了以往國內僅以歷屆奧運會成績?yōu)榛A,部分結合了主場優(yōu)勢所提出的預測結果偶然性較大的問題。
(2)提出了對世界各國競技體育實力5個等級劃分的理論。運用計量經濟學與競技體育實力等級差異理論相結合,對原有模型進行改進后建立的新模型(3)大大提升了對奧運會獎牌預測的精度。
(3)對于奧運會主辦國獎牌數的準確預測,有時還應該考慮引入“主場優(yōu)勢跳躍”因素。
(4)對奧運會主辦國在下屆奧運會比賽中獎牌數的準確預測,有時還應該考慮引入“次場效應”因素。
新模型(3)的建立雖然提升了以往預測的精度,但還存在對少數國家預測不準確的問題,筆者在此引入了競技體育實力“等級跳躍”現(xiàn)象。以競技體育“等級跳躍”為判據,進行了預測修正,從而提升了預測的準確性。筆者認為,出現(xiàn)競技體育實力“等級跳躍”現(xiàn)象的原因,可能是由于某國個別運動員異常出色的發(fā)揮;或者是某國在特定時期對競技體育給予相當大的重視及特別加大競技體育的投入等,這些有利因素都能使國家體育競技實力等級上升;相反,一個國家若在自己的強勢項目中發(fā)揮失常,或者國家政治不穩(wěn)定,甚至處于戰(zhàn)亂狀態(tài)等,這些不利因素都會使其體育競技實力等級下滑。
在預測結果中,我們發(fā)現(xiàn)競技體育實力“等級跳躍”現(xiàn)象出現(xiàn)的概率很小,在對2008年北京奧運會獎牌預測中有10個國家出現(xiàn)“等級跳躍”現(xiàn)象,在金牌預測中僅有3個。
在北京奧運會中,中國代表團取得了驕人的成績,筆者認為:其中“主場優(yōu)勢跳躍”帶來的效益不可忽視。產生的原因除了由于主辦國的運動員熟悉比賽環(huán)境和競賽器材、眾多本國觀眾的主場助威、運動員情緒興奮和裁判無意識的支持主隊外,我國政府對北京奧運會極度重視,采用“舉國體制”加大對體育的投入和啟動“119工程”等。正是這些因素的綜合作用,在2008年奧運會中我國運動員的總體實力大大上升,出現(xiàn)了“主場優(yōu)勢跳躍”現(xiàn)象。
筆者在研究中發(fā)現(xiàn),主辦國在下屆奧運會中表現(xiàn)出的實力通常會有較大幅度下滑:即競技體育實力等級不但會從“主場優(yōu)勢”回歸到正常等級,而且還可能會從正常等級再下滑一個甚至多個等級,筆者稱之為“次場效應”。之所以會出現(xiàn)“次場效應”,可能為參賽國的重視不夠、投入相對較少、參賽國運動員由于前一次比賽成績過好,而出現(xiàn)了無意識的松懈現(xiàn)象等,這也是我國運動員對于將要參加的2012年倫敦奧運會所要注意和克服的問題。
[1]Ball Donald W.Olympic Games Competition:Structural Correlates of NationalSuccess[J].International Journal of Comparative Sociologu,1972,12:86-200.
[2]Grimes A Ray,WilliamJ.Kelly,Paul H,Rubin.A Socioeconomic Model of National Olympic Performance[J].Social Science Quarterly,1974,55,777-782.
[3]Levine Ned.Why Do Countries Win Olympic Medals?Some Structural Correlates of Olympic Games Success:1972 [J].Sociology and Social Research,1974,58:353-360.
[4]Bernard Andrew B,Meghan R Busse.Who Wins the Olympic Games:Economic Resources and Medals Totals[J].Review of Economics and Statistics,2004,86(1):413-417.
[5]Kuper G,E Sterken.Olympic Participation and Performance since 1986[J]. Mineo.Department of Economics,University of Groningen.2001.
[6]Oyebanke Oyeyinka.The Determinants of Participation and Success at Olympic Games:A Cross-Country Analysis [J].CarrollRound Proceedings,2007,2:156-180.
[7]Bian Xun.Predicting Olympic Medal Counts:The Effects of Economic Development on Olympic Performance [J].The Park Place Economist,2005,VIII,37-44.
[8]Condon,E M,Golden B L,Wasil E A.Predicting the success of nations at the Summer Olympics usingneural networks[J].Computer&Operations Research,1999,26,1 243-1 265.
[9]Johnson Daniel K N,Ayfer Ali.A Tale of Two Seasons:Participation and Medal Counts at the Summer and Winter Olympic Games[J].Social Science Quarterly,2004,85(4):974-993.
[10]藺銀萍,王建軍.運用時間序列法預測2008年奧運會獎牌數[J].南京體育學院學報,2007,6(1):31-32.
[11]范珣,齊輝.運用趨勢直線外推法預測2008年奧運會中國獲獎牌數[J].遼寧體育科技,2007,29(4):57-58.
[12]江立平.用統(tǒng)計回歸方法預測我國代表團在2008年奧運會上的獎牌數[J].南京體育學院學報,2007,6(2):54-55.
[13]劉萬民,吳瑕.基于概率模型對2008北京奧運會中國代表團成績的預測[J].湖北師范學院學報,2008,28(1):16-19.
[14]姜一鵬.第28屆奧運會中國獎牌預測[J].天津體育學院學報,2004,19(2):86-87.
[15]吳殿廷,吳穎.2008北京奧運會中國金牌趕超美國的可能性——基于東道主效應的分析和預測[J].統(tǒng)計研究,2008,25(3):60-64.
[16]古扎拉蒂.林少宮,譯.計量經濟學[M].林少宮,譯.北京:中國人民大學出版社,2000.
[17]白海波,郭權.我國與奧運強國競技體育實力的比較研究[J].沈陽體育學院學報,2004,23(2):163-117.
[18]N J Balmer,A M Nevill,A M.Williams.Modelling home advantage in the Summer Olympic Games[J].Journal of Sports Sciences,2003,21:469-478.
[19]劉萬民,柳建慶.體育比賽中主場優(yōu)勢的研究[J].中國體育科技,2006,42(3):101-105.
[20]田雷,劉萬民,劉丹.夏季奧運會比賽主場優(yōu)勢的量化研究[J].中國體育科技,2008,44(1):3-6.
[21]高新波.模糊聚類分析及其應用[M].西安:西安電子科技大學出版社,2004.
[22]錢同惠,沈其聰,葛曉濱,等.模糊邏輯及其工程應用[M].北京:電子工業(yè)出版社,2001.
[23]張曙紅,孫建勛,諸克軍.基于遺傳優(yōu)化的采樣模糊C均值聚類算法[J].系統(tǒng)工程理論與實踐,2004,24(5):121-125.
[24]聞新,周露.MATLAB模糊邏輯工具箱的分析與應用[M].北京:科學出版社,2001.
[25]趙家敏,彭虹.我國證劵投資基金羊群行為及其對股價影響愛那個的實證研究[J].系統(tǒng)工程,2004,22(7):38-43.
[26]嚴忠,岳朝龍,劉竹林.計量經濟學[M].合肥:中國科學技術大學出版社,2005.
Prediction of the Number of Medals in International General Games:With Beijing Olympic Games as an Example
WANG Guofan1,XUE Erjian2,TANG Xuefeng3
(1.School of PE,Anhui Normal University,Wuhu 241000,China;2.School of Mathematics and Computer Science,Anhui Normal University,Wuhu 241000,China;3.School of Physics,University of Science and Technology of China,Hefei 230026,China)
Based on theories of econometrics,population,GDP per capita,home advantage,social system,achievements in the previous Olympic Games,this paper established a preliminary model with multiple non-linear regression analysis.Considering the discrepancy in competitive sports strength between countries,the authors divided competitive sports strength into five scales with fuzzy C-means clustering algorithm.By introducing dummy variable,the authors proposed a revised model which combines theories of economics and discrepancy in competitive sports strength,and conducts a prediction analysis of the number of medals in 2008 Beijing Olympic Games.Results showed that this model can reveal the general tendency in the change of Olympic medals won by different countries,and can overcome the influence of discrepancy in competitive sports strength on prediction precision.This model can be applied to the prediction of the number of medals in international general games due to its scientificity and feasibility.
econometrics;international general game;Olympic Games;medal;prediction model
G 80-32
A
1005-0000(2010)01-0086-05
2009-09-03;
2009-11-15;錄用日期:2009-11-16
國家體育總局體育文化發(fā)展中心項目(項目編號:08TYWH146);安徽省哲學社會科學規(guī)劃項目(項目編號:AHSK07-08D102)
王國凡(1964-),男,安徽肥西人,安徽師范大學副教授。
1.安徽師范大學體育學院,蕪湖241000;2.安徽師范大學數學計算機科學學院,蕪湖241000;3.中國科學技術大學近代物理系,合肥230026。