□ 劉玥瑋(北京市海淀區(qū)育英學校高中二年級1班 北京 100039)
CBA正在如火如荼地進行,各支球隊都努力爭取每一場比賽的勝利,尤其是今年這個賽季,季后賽的隊數(shù)增加到12支,以前排名處于中下游的球隊都看到了晉級季后賽的希望,所以比賽的觀賞性也提高不少。
隨著每輪比賽的進行,每一場球都會產(chǎn)生大量的數(shù)據(jù),比如得分、籃板、助攻、上場時間等等。結(jié)合到多個場次,更是有不同的統(tǒng)計數(shù)據(jù)產(chǎn)生:場均得分、場均上場時間、場均籃板等等。如果是整個賽季,則有賽季出場次數(shù)、首發(fā)次數(shù)、賽季平均上場時間、賽季平均得分、賽季平均助攻數(shù)等等。這些數(shù)據(jù)都可以從不同角度體現(xiàn)出球員的不同特點,例如從上場時間上可以看出該球員是核心球員還是角色球員,從場均得分、場均籃板、場均助攻、場均蓋帽以及場均犯規(guī)等數(shù)據(jù)上可以看出是主要得分球員還是藍領(lǐng)球員。
但這些數(shù)據(jù)都只是從一個或者多個方面反映了一位球員的能力、對球隊總的貢獻,并沒有體現(xiàn)出對球隊輸贏的影響,比如某一球員在一場球中爆發(fā),得分很高,達到50多分甚至60多分,這只能說明該球員在這場球中對球隊總得分的貢獻很大,但不能說明球隊肯定能夠贏球。比如這個賽季11月11日北控主場對上海那一場比賽,上海球員弗雷戴特發(fā)揮大爆發(fā)得到75分,達到全隊總得分136的55%,但球隊卻輸了。
對于觀眾來講,大家更關(guān)注自己喜歡球隊的輸贏,這一點對于球隊的球員、教練和領(lǐng)導也更關(guān)心。如何將球員的各項指標數(shù)據(jù)和球隊的輸贏結(jié)合起來,讓我們在看熱鬧的同時,能夠看出一些門道,便成為一個關(guān)心的領(lǐng)域,作者正是在這樣的領(lǐng)域做了一個嘗試。
作者先是對2017-2018賽季北京首鋼男子籃球俱樂部 (以下簡稱北京首鋼)每場籃球數(shù)據(jù)進行采集,并對數(shù)據(jù)進行轉(zhuǎn)換整理,然后結(jié)合球隊的輸贏進行數(shù)據(jù)相關(guān)分析,最后給出了北京首鋼隊主要球員的特點及建議。
當前CAB共有20支球隊,每支球隊都有幾年的數(shù)據(jù),鑒于時間上的限制,作者沒有對各個球隊都進行分析,這里只收集了北京首鋼在2017-18賽季的數(shù)據(jù)作為例子。
本文所有數(shù)據(jù)均來自于新浪網(wǎng)CBA頻道,詳細情況參見ht tp∶//spor ts.sina.com.cn/cba/。
采集的數(shù)據(jù)共有兩類。第一類是北京首鋼在2017-2018賽季各輪次比賽日期、對手、主客場和比分,這類數(shù)據(jù)總共一張表格。第二類是每一輪次北京首鋼球員上場情況、比賽中的各種數(shù)據(jù),這類數(shù)據(jù)共38張表格。
數(shù)據(jù)采集共分兩步完成。
第一步:將新浪網(wǎng)頁上的數(shù)據(jù)手工拷貝到一個Excel文件中。這樣共有兩類數(shù)據(jù)共39個表格。
第二步:通過一段程序,將39個表格數(shù)據(jù)轉(zhuǎn)換成可供分析的數(shù)據(jù),具體數(shù)據(jù)模型見下面的數(shù)據(jù)整理。
為了分析球員的各項指標數(shù)據(jù)對球隊輸贏的影響,結(jié)合實際數(shù)據(jù)情況,設(shè)計了這樣的數(shù)據(jù)模型:
(1)每一輪次的數(shù)據(jù)作為一個觀測值;
(2)輸贏作為目標變量;
(3)每一位球員在每一輪次中的各項數(shù)據(jù)都作為一個變量。
這樣得到一個38個觀測,366個變量的數(shù)據(jù)。下表列出了主要的變量列表:
表1
數(shù)據(jù)相關(guān)分析(Analysis of Cor relation)是對兩個或者多個變量之間的關(guān)系進行分析,發(fā)現(xiàn)其內(nèi)在因素。在開始介紹相關(guān)分析之前,需要特別說明的是相關(guān)關(guān)系不等于因果關(guān)系。
相關(guān)分析的方法很多,初級的方法可以快速發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,如正相關(guān),負相關(guān)或不相關(guān)。中級的方法可以對數(shù)據(jù)間關(guān)系的強弱進行度量,如完全相關(guān),不完全相關(guān)等。高級的方法可以將數(shù)據(jù)間的關(guān)系轉(zhuǎn)化為模型,并通過模型對未來的業(yè)務發(fā)展進行預測。
按照變量之間的類型不同,數(shù)據(jù)相關(guān)分析分為以下四種:
(1)自變量為數(shù)值型變量,因變量為數(shù)值型變量;
(2)自變量為數(shù)值型變量,因變量為分類變量;
(3)自變量為分類變量,因變量為數(shù)值型變量;
(4)自變量為分類變量,因變量為分類變量。
由于我們需要分析數(shù)據(jù)的自變量為數(shù)值型,而因變量只考慮輸贏,所以我們的分析屬于自變量為數(shù)值型變量,因變量為二元的分類變量。
分析過程比較簡單,就是將各個關(guān)心的球員指標數(shù)據(jù)分別與因變量進行比對,查看二者之間的關(guān)聯(lián)性。對于關(guān)聯(lián)性不強的,這里就不再贅述。另外我們只是分析了北京首鋼幾位重要球員的指標數(shù)據(jù),其他球員要么出場次數(shù)太少,數(shù)據(jù)缺失嚴重,要么上場時間太短,多數(shù)指標數(shù)據(jù)為零,因此這里給出的是球隊的幾位重要球員分析的結(jié)果。
(1)7 號(杰克遜)分析。
①失誤次數(shù)多于3個(含3個)時,11場球贏了10場,相反,當少于3個時,20場球輸了9場;
②罰球出手次數(shù)5個(含5個)以上時,16場球贏了14場,相反,當少于5個時,15場球輸了8場;
③前場籃板個數(shù)在2個(含2個)以上時,7場球贏了6場;
④當搶斷個數(shù)3個(含3個)以上時,8場球贏了7場;
⑤當?shù)梅衷?8分(含18分)以上時,16場球贏了14場,相反,但得分在18分以下時,則是15場輸了8場。
注:“.”表示該球員未參加比賽,下同。
球員分析:失誤次數(shù)多反而贏球多,失誤次數(shù)少反而贏球少。失誤次數(shù)多說明杰克遜傳球多,失誤次數(shù)少一方面說明傳球好,更多的是說明傳球少。而當傳球多時,無論是否是失誤或者傳球成功,目的都達到了,那就是起到串聯(lián)的作用,通過傳球帶領(lǐng)全隊,而不是自己單打獨斗。至于罰球次數(shù)、搶斷和進攻籃板,則說明當杰克遜打的比較硬氣時,球隊往往贏多輸少。
(2)8 號(方碩)分析。
①三分球出手次數(shù)9個(含9個)以上,共有8場球,球隊全部贏了;
②兩分球出手次數(shù)小于4個(含4個),共有4場球,球隊全部贏了。
球員分析:典型的外線球員,多投三分,少投兩分。
(3)20 號(翟曉川)分析。
①蓋帽2次(含2次)以上就能夠贏球,共有5場球?qū)儆谶@種情況,5場全贏;
②犯規(guī)5次(含5次)以上就能夠贏球,共有5場球?qū)儆谶@種情況,5場全贏。
球員分析:拼命三郎,打球積極,球隊便能贏球。
(4)23 號(常林)分析。
只要有蓋帽就能夠贏球,共有5場球?qū)儆谶@種情況,5場全贏。
球員分析:內(nèi)線球員,以后就坐鎮(zhèn)內(nèi)線,等著蓋別人的帽。
以上只是作者對于北京首鋼一支球隊、一個賽季的數(shù)據(jù)進行的分析,鑒于作者目前的水平,僅考慮了最簡單的一類相關(guān)分析。除此之外作者考慮了還可以進行以下幾種類型的分析:
(1)分析其他球隊的情況;
(2)分析多個賽季的情況;
(3)多個變量相互作用對球隊輸贏的分析,比如將主客場因素考慮到分析中去;
(4)其它類型的相關(guān)分析。