国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

決策樹(shù)方法在網(wǎng)球訓(xùn)練中的應(yīng)用

2014-09-17 14:40:02馮能山龍超熊金志廖國(guó)君
電腦知識(shí)與技術(shù) 2014年22期
關(guān)鍵詞:決策樹(shù)數(shù)據(jù)挖掘

馮能山 龍超 熊金志 廖國(guó)君

摘要:數(shù)據(jù)挖掘在體育領(lǐng)域的應(yīng)用還比較少。如何利用好體育運(yùn)動(dòng)的訓(xùn)練數(shù)據(jù), 從中挖掘出有用信息,是數(shù)據(jù)挖掘技術(shù)在體育領(lǐng)域中的一項(xiàng)重要任務(wù)。決策樹(shù)方法是一種常用的數(shù)據(jù)挖掘技術(shù),該文把決策樹(shù)方法應(yīng)用于網(wǎng)球訓(xùn)練,對(duì)有關(guān)數(shù)據(jù)進(jìn)行挖掘,形成一棵網(wǎng)球訓(xùn)練的決策樹(shù),從而協(xié)助體育工作人員更合理地制定網(wǎng)球訓(xùn)練方案,提高網(wǎng)球訓(xùn)練的效率。

關(guān)鍵詞: 數(shù)據(jù)挖掘;決策樹(shù);ID3算法;網(wǎng)球訓(xùn)練

中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)22-5336-04

現(xiàn)代競(jìng)技體育的發(fā)展方向是高、難、精、尖,因此體育訓(xùn)練需要盡量多地借助于現(xiàn)代科技手段。為了最大限度地提高訓(xùn)練效果, 在國(guó)際體壇拿更多的冠軍,現(xiàn)代體育需要利用最新的信息技術(shù),對(duì)體育運(yùn)動(dòng)的內(nèi)在規(guī)律進(jìn)行研究。隨著信息技術(shù)的發(fā)展, 體育領(lǐng)域在運(yùn)動(dòng)訓(xùn)練方面有著大量的數(shù)據(jù)[1-2]。如何從這些大量的數(shù)據(jù)中,尋找各種因素間的相互聯(lián)系, 得到有用的信息,發(fā)現(xiàn)規(guī)律,對(duì)體育科研和體育訓(xùn)練都極為重要。隨著我國(guó)體育事業(yè)的不斷發(fā)展, 中國(guó)體育已經(jīng)成功走向世界, 信息技術(shù)在體育領(lǐng)域中有一些應(yīng)用,但還遠(yuǎn)遠(yuǎn)不夠。我國(guó)政府非常重視體育事業(yè),體育領(lǐng)域積累了大量數(shù)據(jù),如何利用最新的數(shù)據(jù)挖掘技術(shù),對(duì)體育數(shù)據(jù)進(jìn)行深入挖掘,對(duì)我國(guó)體育的進(jìn)一步發(fā)展非常有益[3-4]。

2011年我國(guó)湖北選手李娜在法國(guó)網(wǎng)球公開(kāi)賽女單奪冠,在國(guó)際和國(guó)內(nèi)引起重大反響。這次奪冠在中國(guó)網(wǎng)球的歷史上具有劃時(shí)代意義,并進(jìn)一步說(shuō)明中國(guó)網(wǎng)球在國(guó)際網(wǎng)壇的影響力不容忽視??梢灶A(yù)計(jì):越來(lái)越多的國(guó)際大賽將會(huì)把賽場(chǎng)移至中國(guó),國(guó)內(nèi)從事職業(yè)網(wǎng)球的人員也將越來(lái)越多。因此,如何跟隨信息技術(shù)的迅猛發(fā)展,進(jìn)一步提高我國(guó)網(wǎng)球的訓(xùn)練效果,是一個(gè)值得科研人員去研究的重大課題[5]。

1 決策樹(shù)方法

1.1決策樹(shù)的定義

決策樹(shù)方法是目前應(yīng)用最廣泛的歸納推理算法之一,是一種逼近離散函數(shù)值的方法。它是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,通常用來(lái)形成分類(lèi)器和預(yù)測(cè)模型,著眼于從一組無(wú)次序的、無(wú)規(guī)則的事例中,推理出決策樹(shù)表示形式的分類(lèi)規(guī)則[3]。

1.2決策樹(shù)算法的優(yōu)點(diǎn)

1) 分類(lèi)精度高;

2) 生成的模式簡(jiǎn)單;

3) 對(duì)噪聲數(shù)據(jù)有很好的健壯性。

1.3 ID3算法的基本思想[1]

決策樹(shù)方法中比較流行的算法有ID3、C4.5、CART、SLIQ等。這些算法的基本思路都是在訓(xùn)練數(shù)據(jù)樣本集的基礎(chǔ)上建立一顆決策樹(shù),然后用這顆決策樹(shù)對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。ID3算法在決策樹(shù)方法中最為經(jīng)典,其它很多算法都可從ID3算法演變而來(lái)。

ID3算法建樹(shù)的思路是:首先找出最有判別力的屬性,把樣例分成多個(gè)子集,每個(gè)子集又選擇最有判別力的屬性進(jìn)行劃分,一直進(jìn)行到所有子集僅包含同一類(lèi)型的數(shù)據(jù)為止。最后得到一棵決策樹(shù)。

2 決策樹(shù)方法在網(wǎng)球訓(xùn)練中的應(yīng)用

2.1 網(wǎng)球訓(xùn)練數(shù)據(jù)建表

在研究中我們主要挑選了客觀的4個(gè)氣候因素及兩個(gè)自身因素。他們分別是:

1) 天氣:多云 雨 晴。

2) 氣溫:冷 熱 適中。

3) 濕度:正常 高。

4) 風(fēng):中風(fēng) 大風(fēng) 無(wú)風(fēng)。

5) 情緒:好 一般 差。

6) 狀態(tài):Good Bad(為了與情緒的好差區(qū)別,將其設(shè)置為英文)

另外設(shè)置了Affection來(lái)表示是否合適訓(xùn)練。我們通過(guò)現(xiàn)有的24組網(wǎng)球訓(xùn)練數(shù)據(jù)進(jìn)行研究,這些數(shù)據(jù)如表1所示。

這張表格記錄了以往在不同的情況下,運(yùn)動(dòng)員訓(xùn)練效果的一個(gè)記錄。將好的訓(xùn)練效果定義為適合,不好的訓(xùn)練效果定義為不適合。

由于網(wǎng)球訓(xùn)練及比賽一般都是在室外進(jìn)行,屬性中包含了天氣、氣溫、濕度、風(fēng)、情緒、狀態(tài)這六個(gè)因素[1]。

2.2 決策樹(shù)的創(chuàng)建

1) ID3算法過(guò)程[1]

(1) 計(jì)算各屬性的信息增益;

(2) 選擇信息增益最大的屬性Ak;

(3) 把Ak處取值相同的例子歸于同一子集,Ak取幾個(gè)值就得幾個(gè)子集;

(4) 對(duì)既含正例又含反例的子集,遞歸調(diào)用建樹(shù)算法;

(5) 若子集僅含正例或反例,返回調(diào)用處。

2) 信息增益

(1) 其中S是樣例的集合, P(ui)是類(lèi)別i出現(xiàn)概率

[Gain(S,A)=Entropy(S)-vSvSEntropy(Sv)]

(2) 信息熵:

[Gain(S,A)=Entropy(S)-vSvSEntropy(Sv)]

(3) 信息增益:

[Gain(S,A)=Entropy(S)-vSvSEntropy(Sv)]

根據(jù)以上的訓(xùn)練集(表1 網(wǎng)球訓(xùn)練數(shù)據(jù)表),可計(jì)算天氣、氣溫、濕度、風(fēng)、情緒、狀態(tài)這六個(gè)因素的信息增益。計(jì)算過(guò)程略去,結(jié)果如表2。

根據(jù)以上決策樹(shù),我們可以得到:

1) 當(dāng)天氣為晴天的時(shí)候,適合網(wǎng)球訓(xùn)練。

2) 當(dāng)天氣為多云的情況下,還需要考慮濕度。如果濕度為高,則不適合訓(xùn)練;反之濕度為正常,則適合訓(xùn)練。

3 當(dāng)天氣為雨的情況下,先考慮氣溫,如果氣溫為冷,則不適合訓(xùn)練;如果氣溫為適中也不適合訓(xùn)練;當(dāng)氣溫為熱時(shí),還需要考慮風(fēng)的因素,若風(fēng)為大風(fēng),則不適合訓(xùn)練,若無(wú)風(fēng)則適合訓(xùn)練。

2.3 模型測(cè)試

為檢驗(yàn)決策樹(shù)的正確性,我們選取3組數(shù)據(jù)進(jìn)行測(cè)試,如表6所示。

第一組數(shù)據(jù)天氣為多云,按照?qǐng)D 1 形成的決策樹(shù),我們判斷為合適訓(xùn)練;第二組數(shù)據(jù)天氣為雨,根據(jù)此決策樹(shù)我們判斷為不合適訓(xùn)練;第三組數(shù)據(jù)天氣為晴,我們可以根據(jù)此決策樹(shù)判斷為合適訓(xùn)練。這些結(jié)果與我們的數(shù)據(jù)表1相符,說(shuō)明我們的決策樹(shù)是正確的。

3 結(jié)論

通過(guò)決策樹(shù)的ID3算法,我們?cè)诖罅康木W(wǎng)球訓(xùn)練中找到了有用的、潛在的、有助于后續(xù)訓(xùn)練的信息,形成了一棵決策樹(shù)。這就使得網(wǎng)球訓(xùn)練者更易于發(fā)現(xiàn)規(guī)律,從而指導(dǎo)訓(xùn)練。這棵決策樹(shù)的優(yōu)點(diǎn)是:基礎(chǔ)理論清晰,算法較簡(jiǎn)單實(shí)用,是一個(gè)很有實(shí)用價(jià)值的算法。隨著訓(xùn)練數(shù)據(jù)不斷的增加,對(duì)數(shù)據(jù)不斷地計(jì)算、刪除、遞歸,結(jié)果會(huì)更加趨于準(zhǔn)確。該決策樹(shù)有一個(gè)不足:數(shù)據(jù)中我們假設(shè)訓(xùn)練子集中正反例的比例與實(shí)際問(wèn)題中正反例的比例相同。但一般情況不能完全保證相同,這樣計(jì)算訓(xùn)練集的信息增益就會(huì)有所偏差。這個(gè)不足也是我們今后要研究的工作。

參考文獻(xiàn):

[1] 朱明.數(shù)據(jù)挖掘[M].2版.北京:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2008.

[2] 楊雙燕,趙水寧.體育數(shù)據(jù)分析中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].浙江體育科學(xué),2003(3):73-76.

[3] 韓家煒,堪博.數(shù)據(jù)挖掘概念與技術(shù)[M].2版.北京:北京機(jī)械工業(yè)出版社,2007.

[4] 張喆,馬明純.網(wǎng)球進(jìn)階訓(xùn)練[M].北京:吉林科學(xué)技術(shù)出版社,2011.

[5] 巫文佳,閔帆.基于決策樹(shù)的網(wǎng)球選材指標(biāo)學(xué)習(xí)方法[J].哈爾濱師范大學(xué):自然科學(xué)學(xué)報(bào),2013(6):90-94.

猜你喜歡
決策樹(shù)數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
基于改進(jìn)決策樹(shù)的故障診斷方法研究
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
基于決策樹(shù)的復(fù)雜電網(wǎng)多諧波源監(jiān)管
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
涿州市| 珠海市| 油尖旺区| 吉木乃县| 瓮安县| 都昌县| 开鲁县| 北碚区| 汾阳市| 渝中区| 阿拉善右旗| 大化| 兴业县| 渭源县| 正镶白旗| 界首市| 婺源县| 天门市| 象州县| 阳西县| 祁门县| 读书| 大埔区| 南乐县| 平泉县| 拉孜县| 肥城市| 丰台区| 五莲县| 长宁县| 卓资县| 东兴市| 吴旗县| 本溪市| 双牌县| 曲沃县| 株洲县| 镇巴县| 噶尔县| 阳春市| 于都县|