李梅 張志軍
摘要:在ID3算法中,主要是計算出各個屬性的信息增益,比較信息增益的大小,選擇最大取值的屬性作為分裂節(jié)點,從而生成決策樹,但是在計算時,需要多次調(diào)運log函數(shù),計算量特別大,對決策樹的生成有一定的影響。本文主要利用冪級展開式對log函數(shù)進行改進,以此來提高計算速度。
關(guān)鍵詞:信息熵;log函數(shù);改進
中圖分類號:TP3 文獻標識碼:A 文章編號:1009-3044(2018)29-0020-01
1 ID3算法理論簡介
參考文獻:
[1]趙薇, 蘇建民. 基于ID3算法決策樹的研究與改進[J]. 科技信息, 2008(23):383-392.
[2]袁琴琴. 基于決策樹算法的改進與應用[D]. 長安大學, 2006.
[3]蘇錦. 基于決策樹方法的學生成績分析應用[J]. 信息通信, 2017,169(01):52-53.
[4]劉紅巖, 陳劍, 陳國青. 數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J]. 清華大學學報(自然科學版), 2002,6(42):727-730.
[5]段玉春, 朱曉艷, 孫玉強. 一種改進的ID3算法[J]. 南陽師范學院學報(社會科學版), 2006,(09):63-65.
【通聯(lián)編輯:梁書】