国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

聚類分析在美職籃數(shù)據(jù)中的應(yīng)用

2017-09-03 10:02
福建質(zhì)量管理 2017年10期
關(guān)鍵詞:職籃籃球聯(lián)賽中鋒

侯 威

(云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 云南 昆明 650000)

聚類分析在美職籃數(shù)據(jù)中的應(yīng)用

侯 威

(云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 云南 昆明 650000)

聚類分析是機(jī)器學(xué)習(xí)領(lǐng)域、模式識別領(lǐng)域等研究方向的重要研究課題之一,在識別數(shù)據(jù)內(nèi)部結(jié)構(gòu)方面具有極其重要的作用。本文選取美國男子職業(yè)籃球聯(lián)賽賽季數(shù)據(jù),選取聯(lián)盟中鋒,進(jìn)行聚類分析。結(jié)果發(fā)現(xiàn),全能型中鋒球員較少,大部分中鋒為藍(lán)領(lǐng)球員。

聚類分析;機(jī)器學(xué)習(xí);藍(lán)領(lǐng);中鋒

一、研究背景及意義

美國男子職業(yè)籃球聯(lián)賽,即美職籃①,做為全球最頂尖的籃球聯(lián)賽代表著當(dāng)今籃球最高的水準(zhǔn),也引領(lǐng)者當(dāng)今世界籃球發(fā)展的潮流,美職籃吸引著世界各地頂尖的籃球選手,美職籃成立近70年來,一個(gè)接一個(gè)的傳奇選手為世界各地球迷奉獻(xiàn)了一場接一場的籃球盛宴,在美職籃漫長歷史中,不斷涌現(xiàn)的偉大的球員一直刷新著美職籃的記錄數(shù)據(jù),進(jìn)入21世紀(jì),本世紀(jì)前十年隨著姚明奧尼爾等一批傳奇中鋒退役,最近幾年,美職籃進(jìn)入小球時(shí)代,中鋒的作用被不斷看衰,外線后衛(wèi)等投手不斷涌現(xiàn)。雖然,美職籃中的中鋒作用在不斷看衰,但是中鋒在內(nèi)線的巨大殺傷力,較容易的得分方式,中鋒搶籃板為球隊(duì)創(chuàng)造二次進(jìn)攻的機(jī)會,讓我們無法忽視中鋒在美職籃中的重要作用。利用機(jī)器學(xué)習(xí)方法,分析美職籃中的中鋒數(shù)據(jù),探索當(dāng)今小球當(dāng)?shù)赖臅r(shí)代背景下,美職籃中鋒今后的發(fā)展趨勢,具有重要的研究意義。

二、數(shù)據(jù)介紹及選取

數(shù)據(jù)選取自美職籃2016-2017賽季常規(guī)賽球員數(shù)據(jù),包括美職籃32支球隊(duì)各個(gè)球員在常規(guī)賽81場比賽中各個(gè)方面的統(tǒng)計(jì)數(shù)據(jù)。里面的數(shù)據(jù)均是球員在整個(gè)常規(guī)賽賽季的表現(xiàn)匯總數(shù)據(jù)。考量一個(gè)中鋒的數(shù)據(jù),主要包括:蓋帽次數(shù)、籃板數(shù)、前場籃板數(shù)、后場籃板數(shù)、得分。本文選取的指標(biāo)為場均得分和場均籃板數(shù)。

三、算法實(shí)現(xiàn)步驟

#第一步:當(dāng)k=5時(shí),他會隨機(jī)選取5個(gè)點(diǎn)作為中心點(diǎn),然后計(jì)算所有點(diǎn)到這5個(gè)點(diǎn)的距離

#第二步:將每一個(gè)點(diǎn)劃到不同的簇

#第三步:將每一個(gè)簇中的點(diǎn)計(jì)算橫縱坐標(biāo)的均值,計(jì)算出新的中心點(diǎn)(可以是不是實(shí)際的點(diǎn))

#第四步:重新計(jì)算每一個(gè)點(diǎn)到中心點(diǎn)的距離,重新劃分屬于不同的簇

#第五步:不斷的更新中心點(diǎn),不斷的重新劃分簇,直到再怎么更新中心點(diǎn),簇里的元素都不再發(fā)生變化了

四、Kmeans分類算法Python實(shí)戰(zhàn)

(一)讀取數(shù)據(jù)

選取球員中位置為中鋒的遠(yuǎn)動(dòng)員,選取球員的本賽季總共的出場次數(shù)、賽季總得分和賽季籃板總數(shù)三個(gè)指標(biāo)。代碼如下:

#取出中鋒的數(shù)據(jù),“C”就是位置為中鋒的球員。

point_guards = nba[nba["pos"]=="C"]

#pts代表是總得分,g代表是打了多少場球

point_guards["ppg"]= point_guards[′pts′]/point_guards[′g′]

point_guards[[′pts′,′g′,′ppg′]].head(5)

#trb代表籃板的次數(shù)

point_guards[′ptrb′]= point_guards[′trb′]/point_guards[′g′]

(二)對數(shù)據(jù)進(jìn)行聚類

(1)畫出散點(diǎn)圖

以球員場均得分為橫坐標(biāo)值,場均籃板數(shù)為縱坐標(biāo)值,畫出散點(diǎn)圖如下圖1。

圖1 散點(diǎn)圖

可以從圖中大致看出,能拿到兩雙數(shù)據(jù)(場均得分和場均籃板數(shù)均為10)的球員 較少,說明在小球背景下,中鋒得分和搶籃板能力受到限制。

(2)聚類分析

利用K均值聚類,根據(jù)選取的兩個(gè)指標(biāo)隨機(jī)把球員分為5類,結(jié)果見下圖2。

圖2 隨機(jī)選取質(zhì)心聚類

經(jīng)過幾次不斷計(jì)算,一直到得到的分類簇基本不再發(fā)生變化,即聚類的結(jié)果收斂,結(jié)果如下圖3。

圖3 聚類結(jié)果

從最終的聚類結(jié)果可以看到,我們把中鋒球員分為5類,聚類的最終效果還是比較理想。但是我們只能從上圖,大概看到聚類的效果,為了更準(zhǔn)確地顯示聚類效果,選取原始數(shù)據(jù)的所有指標(biāo)進(jìn)行聚類,打印顯示出來。

打印出來的比較理想的最終聚類結(jié)果如下。

[′Alexis Ajinca′,′Chris Andersen′,′Aron Baynes′,′Jason Collins′,′Samuel Dalembert′,′Andre Drummond′,′Vitor Faverani′,′Marcin Gortat′,′Josh Harrellson′,′Spencer Hawes′,′Kosta Koufos′,′Ian Mahinmi′,"Kyle O′Quinn",′Daniel Orton′,′Miles Plumlee′,′Robert Sacre′,′Larry Sanders′,′Tiago Splitter′,′Jeremy Tyler′,′Jonas Valanciunas′,′Nikola Vucevic′,′Jeff Withey′,′Cody Zeller′,′Bismack Biyombo′,′Andris Biedrins′]

[′Andrew Bynum′,′Drew Gooden′,′Roy Hibbert′,′Enes Kanter′,′Viacheslav Kravtsov′,′Robin Lopez′,′Timofey Mozgov′,′Mike Muscala′,′Greg Oden′,′Kelly Olynyk′,′Zaza Pachulia′,′Miroslav Raduljica′,′Henry Sims′,′Greg Smith′,′Tyler Zeller′,′Hilton Armstrong′]

[′Andrea Bargnani′,′Chris Bosh′,′DeMarcus Cousins′,′Anthony Davis′,′Melvin Ely′,′Marc Gasol′,′Pau Gasol′,′Justin Hamilton′,′Al Horford′,′Chris Kaman′,′Brook Lopez′,′JaVale McGee′,′Byron Mullens′,′Nikola Pekovic′,′Kevin Seraphin′,′Marreese Speights′,"Amar′e Stoudemire",′Brandan Wright′][′Steven Adams′,′Cole Aldrich′,′Joel Anthony′,′Omer Asik′,′Gustavo Ayon′,′Andrew Bogut′,′Tyson Chandler′,′Dewayne Dedmon′,′Gorgui Dieng′,′Joel Freeland′,′Kevin Garnett′,′Rudy Gobert′,′Bernard James′,′Ognjen Kuzmic′,′Alex Len′,′Meyers Leonard′,′Nazr Mohammed′,′Erik Murphy′,′Kendrick Perkins′,′Greg Stiemsma′,′Hasheem Thabeet′,′Anderson Varejao′]

[′DeAndre Jordan′,′Dwight Howard′,′Joakim Noah′,′Al Jefferson′,′Aaron Gray′,′Chuck Hayes′,"Hamady N′Diaye",′Dexter Pittman′]

從上面聚類結(jié)果可以看到,賽季中場均分達(dá)到20分以上的同時(shí)又能搶下10個(gè)籃板以上的中鋒比較上,有相當(dāng)一部分中鋒球員屬于藍(lán)領(lǐng),即他們能夠搶到較多的藍(lán)板,但是對籃筐的攻擊殺傷力沒有較小,這說明:隨著上世紀(jì)模奧拉朱旺,大衛(wèi)羅賓遜等傳奇中鋒的謝幕,現(xiàn)在美職籃比賽防守強(qiáng)度下降,同時(shí)現(xiàn)在美職籃小球當(dāng)?shù)?,會遠(yuǎn)投的球員主導(dǎo)球場,中鋒球員的籃下勾手等基本功不再被看重,中鋒球員的得分能力被削弱,更多的中鋒偏向于搶籃板,為球隊(duì)的投手,得分手們創(chuàng)造更多的投籃機(jī)會。

【注釋】

①為了方便表述,把美國男子職業(yè)籃球聯(lián)賽簡稱為美職籃。

[1]朱明.數(shù)據(jù)挖掘[M].北京:中國科學(xué)技術(shù)大學(xué)出版社,2002.

[2]Willi Richert,Luis Pedro Coelho著.機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)[M].劉峰譯.北京:人民郵電出版社

[3]張建萍,劉希亞.基于聚類分析的K均值算法研究與應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2007,24(5):166-168.

[4]趙法信,王國業(yè).?dāng)?shù)據(jù)挖掘中聚類分析算法研究[J].通化師范學(xué)院學(xué),2005,3:11-13.

[5]袁方,周志勇.宋鑫.初始聚類中心優(yōu)化的K均值算法[J].計(jì)算機(jī)工程,2007,33(3):65-66.

侯威(1992-),男,漢族,河南許昌人,云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)。

猜你喜歡
職籃籃球聯(lián)賽中鋒
南通市部分高校校園籃球聯(lián)賽開展現(xiàn)狀及改進(jìn)策略
大學(xué)生籃球聯(lián)賽發(fā)展困境和路徑
斯特恩 不打籃球的籃球人
從公共關(guān)系學(xué)視角看美職籃成功的原因
美職籃的美學(xué)和文化學(xué)新思考
蔡中鋒小小說三題
蔡中鋒微小說二題
蔡中鋒閃小說四題
蔡中鋒閃小說兩篇
廣東省第一屆高中男子籃球聯(lián)賽閉幕