張 嘯
(武漢科技大學(xué) 管理學(xué)院,武漢 430081)
對(duì)于當(dāng)今世界主流足球聯(lián)賽的各個(gè)俱樂部來說,數(shù)據(jù)分析已經(jīng)成為了非常常見同時(shí)也非常重要的一項(xiàng)工作.通過引入數(shù)學(xué)方法和統(tǒng)計(jì)學(xué)方法,球隊(duì)的數(shù)據(jù)分析人員能夠更加全面地了解足球比賽和球員,并歸納出比賽當(dāng)中的一些不易被人直接觀察得到的結(jié)論.
在足球比賽中,由于點(diǎn)球的特殊性,使其成為最容易引起學(xué)者關(guān)注的研究領(lǐng)域.例如,Chiappori[1]等人通過博弈論方法分析了球員在罰點(diǎn)球時(shí)的策略選擇問題;Palacios-Huerta[2]同樣也做過類似的分析.此外,其他一些學(xué)者也嘗試過利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)以及人類行為學(xué)等各種方法來分析罰點(diǎn)球時(shí)球員和守門員的策略以及行為特征.
本文將不把研究重點(diǎn)放在罰點(diǎn)球上,而是將比賽中一般情況下的射門作為考察對(duì)象.具體而言,將利用博弈論的方法建立一個(gè)數(shù)學(xué)模型,對(duì)一般情況下射門球員和守門員所處的狀態(tài)進(jìn)行模擬,并通過對(duì)模型的進(jìn)一步分析,得到射門球員和守門員的策略選擇傾向.在得出理論上的結(jié)論后,本文還將利用統(tǒng)計(jì)檢驗(yàn)來驗(yàn)證這些結(jié)論.
由于實(shí)際比賽中的策略選擇以及行為之間的相互依賴關(guān)系非常復(fù)雜,在建立數(shù)學(xué)模型之前,我們需要對(duì)問題所涉及到的射門球員、守門員以及他們所面臨的環(huán)境狀態(tài)做出一些必要的規(guī)范化假設(shè),這將有利于我們對(duì)問題的簡化和分析.而這種簡化并不會(huì)影響對(duì)問題核心內(nèi)容的考察.
假設(shè)1:假定射門的球員在面臨射門機(jī)會(huì)時(shí),所處的位置并非正對(duì)球門.
這樣假設(shè)的原因是:可以讓球員面臨兩種區(qū)別更明顯的選擇,要么選擇朝球門近角踢,要么朝球門遠(yuǎn)角踢.如果球員正好在中間位置,則可以預(yù)見到的是,球員在射門時(shí)會(huì)顯得更隨機(jī)化(在不考慮球員可能存在某些個(gè)人射門習(xí)慣的情況下),而守門員也不會(huì)去選擇極端的站位(門柱附近).
因此,在本模型中,射手在射門時(shí)面臨的情況就是選擇近角或者遠(yuǎn)角.
假設(shè)2:假定博弈過程是存在先后順序的(雖然這種時(shí)間上的先后順序可能并不明顯),首先,對(duì)于門將來說,在球員射門前,他們會(huì)選擇自己的站位;之后,對(duì)射門球員來說,他們會(huì)根據(jù)觀察到的門將的站位情況來選擇是射遠(yuǎn)角,還是射近角.
為了將門將的站位進(jìn)行量化分析,我們把球門的長度設(shè)定為1,并令門將與球門遠(yuǎn)角之間的距離為p,p顯然滿足p∈[0,1],因此,博弈的過程可以表示為圖1.
圖1 守門員和射門球員策略選擇過程
而球員和守門員站位的示意圖如圖2所示.
圖2 守門員和射門球員站位選擇
在圖2中,上方的矩形表示球門,球門中間的虛線是對(duì)守門員的抽象,下方的圓形表示球員射門時(shí)的位置,從守門員到球門遠(yuǎn)門柱之間的距離設(shè)為p,從足球向兩方延伸的箭頭虛線表示射手可能選擇的兩個(gè)射門方向,即近角和遠(yuǎn)角,并且向近角射門的概率為q,向遠(yuǎn)角射門的概率為1-q.
假設(shè)3:射門的結(jié)果是隨機(jī)的,也就是說,即使球完全按照射手的意愿被踢出,最終也不一定能打在射門球員所期望其到達(dá)的球門近角或者球門遠(yuǎn)角的球門范圍之內(nèi).
為了量化這種假設(shè),我們設(shè)想球員在選擇射近角的時(shí)候,足球按照球員期望落在近角球門范圍之內(nèi)的概率為α,且α∈(0,1);球員在選擇射遠(yuǎn)角的時(shí)候,足球按照球員期望落在遠(yuǎn)角球門范圍之內(nèi)的概率為β,且β∈(0,1).
假設(shè)4:假設(shè)3當(dāng)中的α和β實(shí)際上是對(duì)射門精確程度的一種測度,為了簡化問題,假設(shè)射門的精確程度與兩個(gè)因素有關(guān),一個(gè)是射手的技術(shù),另一個(gè)是射手的射門位置.
為了表示出這兩種影響因素,我們考慮為概率α和β建立兩個(gè)函數(shù)表達(dá)式:令α=μhα(δ),β=μhβ(δ),其中,μ代表球員的技術(shù)水平對(duì)精度的影響,且我們令μ∈(0,1);另一方面,hi(δ)代表射門位置對(duì)精度的影響,i=α,β,其中,δ是位置變量,并且為了簡單化,我們同樣規(guī)定δ∈(0,1).可以看出,μ的變化將同等程度地影響到射遠(yuǎn)角和射近角時(shí)的射門精度.
假設(shè)5:在不考慮射手自身技術(shù)水平μ的情況下,射近角的精度要大于射遠(yuǎn)角的精度,即對(duì)于一切δ∈(0,1),都有hα(δ)>hβ(δ).這實(shí)際上是在假設(shè)4基礎(chǔ)上的一個(gè)引申假設(shè),這個(gè)假設(shè)也是符合現(xiàn)實(shí)情況的.
假設(shè)6:球能否踢進(jìn)球門,除了與球能夠按照球員的意愿命中球框范圍之內(nèi)相關(guān)之外,還取決于守門員是否能對(duì)來球做出及時(shí)準(zhǔn)確的反應(yīng),以及門將的站位選擇.令守門員的反應(yīng)速度用參數(shù)ζ來表示,且令ζ∈(0,1);而守門員的站位在前面已定義,用參數(shù)p來刻畫.
假設(shè)7:在不失一般性的情況下,在分析時(shí),我們將會(huì)忽略掉那些沒有命中球門范圍內(nèi)的情況,也就是說,我們不會(huì)去考慮和區(qū)分那些射高了或者射偏了的射門,而只會(huì)考察那些射在球門范圍內(nèi)的情況.
根據(jù)前面一節(jié)的假設(shè)和參數(shù)設(shè)定,我們希望可以得到射手的得益情況(注意,由于射門是一個(gè)零和游戲,所以這里實(shí)際上可以省略掉對(duì)守門員得益情況的分析),為此,我們設(shè)想得益情況用“射門精度”、“門將站位”以及“門將反應(yīng)速度”這三個(gè)參數(shù)來表示.并且,得益與“射門精度”正相關(guān),而與“門將站位”以及“門將反應(yīng)速度”負(fù)相關(guān).因此,我們可以得到射門球員在選擇近角或者遠(yuǎn)角并且進(jìn)球時(shí)的期望得益:
其中,(1-ζ)表示守門員沒有能夠及時(shí)做出反應(yīng).
容易看出,此問題不存在純策略納什均衡.原因在于,守門員在射手選擇時(shí),最好的選擇是p=0,而在射手選擇時(shí),守門員最好的選擇是p=1,所以不存在純策略納什均衡.但是,此問題存在混合策略納什均衡.我們令射手選擇近角的概率為q,選擇遠(yuǎn)角的概率為1-q,則可以得到如表1表示的雙方得益情況.
表1 守門員和射門球員得益情況
其中,逗號(hào)前面的式子表示射門球員的期望得益,逗號(hào)后面的式子表示守門員的期望得益.注意,此處的矩陣不是得益矩陣,而只是對(duì)射門球員和守門員的期望得益情況進(jìn)行了一個(gè)表達(dá).實(shí)際上,由于在這個(gè)博弈中守門員所面臨的選擇p是連續(xù)的,我們無法很好地通過得益矩陣來表示博弈雙方的得益情況.
首先,對(duì)于守門員來說,要通過讓p隨機(jī)化,使得射手無論選擇近角或者遠(yuǎn)角,最后的期望得益是無差異的.即守門員所選擇的p需要使得下式成立:
可以解得p的均衡值為:p=α/(β+α).
其次,對(duì)于射手來說,要通過讓射門選擇概率q隨機(jī)化,使得守門員無論選擇任何p,最后的期望得益是無差異的.即射手所選擇的q需要使得下式不會(huì)因?yàn)閜的改變而改變:
為了求得q的均衡值,我們不能將上面求得的p代入,因?yàn)檫@樣無法求出q的均衡值,要求得這個(gè)均衡值,我們令p分別取兩個(gè)特殊的邊界值0和1,分別代入(4)式使其相等:
可以解得q的均衡值為:q=β/(β+α).
自此,我們已經(jīng)求出了博弈雙方(守門員,射手)的混合策略(p*,q*),即:
這個(gè)混合策略納什均衡是唯一的,也是子博弈完美納什均衡.可以看出,由于p*/q*只與δ有關(guān),而與μ和ζ無關(guān),因此,這個(gè)混合策略解僅僅取決于位置變量δ,而獨(dú)立于射手的技術(shù)變量μ以及守門員的技術(shù)變量ζ.
結(jié)論1:根據(jù)之前假設(shè)5當(dāng)中的hα(δ)>hβ(δ),我們也有α>β,在這個(gè)前提下,我們將會(huì)發(fā)現(xiàn),射手更偏愛于選擇射遠(yuǎn)角,而守門員更偏愛于選擇近角的站位.
這個(gè)結(jié)論很容易根據(jù)混合策略解得出,我們只需要對(duì)p*和q*分別關(guān)于β和α求偏導(dǎo)就可以了.求導(dǎo)之后顯然有:dp*/dα>0,dp*/dβ<0,dq*/dα<0,dq*/dβ>0.因此,一方面,根據(jù)dp*/dα>0,dp*/dβ<0可得,如果射手往近角或者遠(yuǎn)角射門時(shí)的射門精度(α和β)越高,則門將也會(huì)更傾向于選擇相應(yīng)的偏向近角或者遠(yuǎn)角的站位(根據(jù)p來定義);另一方面,根據(jù)dq*/dα<0,dq*/dβ>0可得,這種情況導(dǎo)致射手更傾向于選擇相反的角度,即α或β越高,反而在混合策略中選擇近角或遠(yuǎn)角的概率會(huì)越低.
結(jié)論1實(shí)際上也很符合我們平時(shí)觀察到的情況,接下來,我們希望從數(shù)據(jù)統(tǒng)計(jì)及檢驗(yàn)的角度來驗(yàn)證這個(gè)結(jié)論.
這種經(jīng)驗(yàn)數(shù)據(jù)實(shí)際上就是足球比賽當(dāng)中的射門得分?jǐn)?shù)據(jù),由于這種數(shù)據(jù)統(tǒng)計(jì)涉及到的數(shù)據(jù)量很大,要統(tǒng)計(jì)出一個(gè)賽季甚至幾個(gè)賽季的某個(gè)聯(lián)盟甚至全世界所有的足球比賽的射門數(shù)據(jù)很困難,因此,筆者在本文中將數(shù)據(jù)樣本限定在2010-2011賽季英格蘭超級(jí)聯(lián)賽的全部進(jìn)球.這樣選擇是因?yàn)橛⒊巧蟼€(gè)賽季歐洲五大聯(lián)賽中進(jìn)球數(shù)最多的,選擇英超能夠盡量增大我們的數(shù)據(jù)容量,使結(jié)果更可靠.
值得注意的是,由于我們的理論結(jié)果并不要求出現(xiàn)非常精細(xì)的數(shù)字結(jié)論,因此,我們只需要比較近角進(jìn)球所占比例和遠(yuǎn)角進(jìn)球所占比例這兩個(gè)數(shù)字的相對(duì)大小就可以了.為此,我們令近角進(jìn)球和遠(yuǎn)角進(jìn)球的期望概率分別如下:
推論1:根據(jù)結(jié)論1,在納什均衡時(shí),我們應(yīng)該能夠觀察到mβ>mα,即遠(yuǎn)角的進(jìn)球應(yīng)該多于近角的進(jìn)球.
在說明統(tǒng)計(jì)結(jié)果之前,先將進(jìn)球的分類進(jìn)行說明.在統(tǒng)計(jì)過程中,筆者將進(jìn)球分為了如下幾種:1)近角進(jìn)球;2)遠(yuǎn)角進(jìn)球;3)頭球;4)任意球直接進(jìn)球(包括角球);5)烏龍;6)點(diǎn)球(在正中間,不存在近角遠(yuǎn)角的問題);7)其他,例如折射等等.
之所以這樣分類,是因?yàn)槲覀兯懻摰膯栴}涉及到近角和遠(yuǎn)角的選擇問題,并且,我們假定守門員和球員都具有一定的思考時(shí)間來進(jìn)行抉擇(雖然這個(gè)時(shí)間非常短).在這種前提下,我們需要人為地排除掉一些與此不相符合的情況,例如,折射進(jìn)球的角度并非射門球員原本的設(shè)想;點(diǎn)球是在正中間位置踢,不存在近角和遠(yuǎn)角問題;門前搶點(diǎn)時(shí),守門員和射門球員都沒有足夠的時(shí)間去考慮站位和角度的問題等等.
根據(jù)以上分類原則,通過一些視頻資料來對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),最后得到的結(jié)果大致為:2010-2011賽季英超一共打進(jìn)1063球,其中,近角進(jìn)球共有117個(gè),遠(yuǎn)角進(jìn)球共有242個(gè),另外,還有372個(gè)定位球,81個(gè)點(diǎn)球,36個(gè)烏龍以及其他進(jìn)球.
詳細(xì)的近角進(jìn)球數(shù)和遠(yuǎn)角進(jìn)球數(shù)統(tǒng)計(jì)結(jié)果如表2所示.
表2 2010-2011賽季英超進(jìn)球類型分布
從統(tǒng)計(jì)數(shù)據(jù)可以看出,遠(yuǎn)角進(jìn)球的數(shù)量大約為近角進(jìn)球數(shù)量的兩倍,這首先為我們的結(jié)論1提供了一種直觀的證據(jù)支持.
為了從統(tǒng)計(jì)檢驗(yàn)的角度來考察,我們需要設(shè)定一個(gè)統(tǒng)計(jì)變量.為此,我們令隨機(jī)變量xα代表近角進(jìn)球的數(shù)量,xβ代表遠(yuǎn)角進(jìn)球的數(shù)量,令近角進(jìn)球的概率為ρ,則隨機(jī)變量xα在α次試驗(yàn)中應(yīng)該服從二項(xiàng)分布.又因?yàn)槲覀兊目傔M(jìn)球數(shù)為359,是一個(gè)比較大的量,所以我們可以用正態(tài)分布來近似地表達(dá)這個(gè)二項(xiàng)分布.我們對(duì)ρ作如下假設(shè):
這是一個(gè)典型的單尾檢驗(yàn)形式的假設(shè),并且,我們需要計(jì)算如下的Z值:
將數(shù)據(jù) xα=117,xβ=242,ρ=1/2代入上式可得 Z=6.597.查表可得,相應(yīng)的 P值約等于 3.38×10-11,這也就意味著H0很容易就能被拒絕,同時(shí),這也意味著近角進(jìn)球數(shù)所占比例顯著地小于1/2.這個(gè)統(tǒng)計(jì)檢驗(yàn)結(jié)果在一定程度上證明了近角進(jìn)球數(shù)和遠(yuǎn)角進(jìn)球數(shù)是服從我們所得到的納什均衡模型的.
當(dāng)然,以上的檢驗(yàn)是對(duì)整體進(jìn)行考察的,我們還可以更進(jìn)一步地來驗(yàn)證每一輪比賽的進(jìn)球數(shù)量分布是否也服從我們的模型.為此,我們令η=117/359,并且令yαi以及yβi分別代表每一輪比賽中近角進(jìn)球數(shù)和遠(yuǎn)角進(jìn)球數(shù),其中i=1,2,3,……,38,則以下這個(gè)變量D將服從一個(gè)卡方分布:
從表2中的數(shù)據(jù)可以算出D=32.67992.同時(shí),利用統(tǒng)計(jì)軟件,我們可以得到相應(yīng)的P值約為0.67177,這也就意味著,“每輪比賽的近角進(jìn)球和遠(yuǎn)角進(jìn)球分布情況都服從同一個(gè)納什均衡解”這個(gè)結(jié)論將會(huì)很難被拒絕,或者我們可以認(rèn)為,每輪比賽的近角進(jìn)球和遠(yuǎn)角進(jìn)球的分布情況都是服從同一個(gè)納什均衡解的.因此,不僅在整體上我們驗(yàn)證了統(tǒng)計(jì)數(shù)據(jù)是服從納什均衡解的,并且在局部,我們也驗(yàn)證了同樣的結(jié)論.
在本文中,我們用數(shù)學(xué)模型模擬了足球比賽中球員在射門時(shí)和門將之間的博弈關(guān)系.模型的納什均衡解顯示出射手更偏愛于選擇遠(yuǎn)角,而守門員更偏愛于選擇近角的站位;與此同時(shí),遠(yuǎn)角進(jìn)球數(shù)會(huì)顯著地多于近角進(jìn)球數(shù).之后,通過統(tǒng)計(jì)檢驗(yàn),這個(gè)理論模型的結(jié)論得到了很好的驗(yàn)證.
值得注意的是,本文尚存在一些問題,例如,數(shù)學(xué)建模本身存在著大量的抽象和假設(shè),現(xiàn)實(shí)并沒有模型所表示的這么簡單;統(tǒng)計(jì)數(shù)據(jù)和統(tǒng)計(jì)檢驗(yàn)并不是完善的;另外,最重要的是,球員畢竟是人,他們都具有自身習(xí)慣以及其他統(tǒng)計(jì)數(shù)據(jù)無法表現(xiàn)出的特征.因此,在考慮更多因素的情況下,可以對(duì)本文的模型進(jìn)行更加深入和廣泛的拓展.
[1]Walker M,Wooders J.Minimax play at Wimbledon[J].American Economic Review,2001,91(5):1521-1538.
[2]Palacios Huerta I.Professionals play minimax[J].Review of Economic Studies,2003,70(2):395-415.