孫忠華 楊婷婷
摘 要:本文以歐盟最新港口國監(jiān)督法令(2009/16/EC)巴黎備忘錄目標船選船機制(NIR)為研究對象,提
出基于粗糙集和BP神經(jīng)網(wǎng)絡組合算法的PSC的新選船模型。研究結果表明:該算法有效結合粗糙集
理論與BP神經(jīng)網(wǎng)絡的優(yōu)點,屬性約簡科學合理,避免選擇評價因素的主觀影響,簡化了網(wǎng)絡結構。
關鍵詞:粗糙集 BP神經(jīng)網(wǎng)絡 約簡 PSC選船
2009/16/EC歐盟最新港口國監(jiān)督法令第10條“船舶風險等級”規(guī)定:“所有停靠歐盟成員國港口或錨地的船舶在船舶檢查數(shù)據(jù)庫中都具有一個船舶風險等級信息,風險等級決定了檢查等級、檢查周期和檢查范圍?!倍帮L險等級的評估則由包括船型、船齡、船旗國、認可組織及管理公司表現(xiàn)在內(nèi)的通用參數(shù)和基于一定歷史時期內(nèi)(通常是3年)在巴黎備忘錄地區(qū)港口國監(jiān)督檢查缺陷數(shù)和滯留次數(shù)的歷史參數(shù)共同確定。但由于該選船方法中的風險因素只是提供了一些相對具有代表性的因素,這些因素是否科學,能否通過PSC歷史檢查數(shù)據(jù)對船舶風險因素進行重新梳理,而且該機制只是對風險因素進行打分并通過簡單的相加得出船舶風險值,是線性選船模型,而實際上PSC預測選船模型是非線性模型。
PSC選船模型國內(nèi)外相關研究主要集中在層次分析法和模糊綜合評價方法,魏棟等人采用BP神經(jīng)網(wǎng)絡可以很好地逼近非線性性函數(shù)的特性,采用BP神經(jīng)網(wǎng)絡建立了FSC檢查選船模型。但BP神經(jīng)網(wǎng)絡需要大量樣本數(shù)據(jù)進行訓練,收斂速度慢,并易陷入局部最優(yōu)。本文以2009/16/EC巴黎備忘錄目標船選船機制(NIR)為研究對象,基于粗糙集和BP神經(jīng)網(wǎng)絡組合算法提出一種創(chuàng)新性的PSC選船模型。該算法采用了RSES粗糙集理論工具箱進行屬性約簡,并通過決策挖掘的知識訓練樣本建立神經(jīng)網(wǎng)絡。
基于粗糙集理論在PSC選船模型中的應用
粗糙集理論是由波蘭數(shù)學家Pawlak于1982年首次提出的,它是一種處理不確定、不精確和不完全數(shù)據(jù)的新理論,特別在數(shù)據(jù)庫知識挖掘領域,粗糙集已經(jīng)成為知識獲取的有力工具。信息決策系統(tǒng)T可表示為T=(U,A,C,D),其中U是對象的集合,即論域,A是屬性集合,如果屬性A集可以分為條件屬性集C和決策屬性集D,即C∪D=A,C∩D=?覫,則該信息系統(tǒng)稱為決策系統(tǒng)或決策表。對于每個屬性子集R?哿A,不可分辨關系為:Ind(R)={(x,y)∈U×U:r∈R:r(x)=r(y)},顯然Ind(R)是一個等價關系,在不產(chǎn)生混淆的情況下可用R代替Ind(R)。所謂約簡,即不含多余屬性并保證分類正確的最小條件屬性集。一個信息決策表殼同時存在多個約簡。關系等價族R中所有不可約去的關系稱為核,由它構成的集合稱為R的核集,記作Core(R)。
1、構建PSC評價決策表
根據(jù)遼寧海事局2006-2010年內(nèi)PSC檢查結果建立一個船舶風險因素決策表,共50個記錄,對于決策屬性值ACC,高風險船舶進行了PSC檢查的置為1;低風險船舶暫未進行PSC檢查的置為0。根據(jù)NIR船舶風險因素評價,具體的條件屬性分別為:
船型={其他類型,散貨船,油船客船及危險品船}
船齡={船齡小于等于5年的船舶,船齡大于5年而非老舊船舶,老舊船舶而船齡小于特別定期檢驗船齡船舶,船齡大于特別定期檢驗船齡而尚未需強制報廢船舶}
船員扣分情況={未扣過分,扣分1次,扣分2次,扣分2次以上}
航線={國內(nèi)航線,國際航線}
噸位={0~500GRT,500~3000GRT,3000~10000GRT,10000GRT+ }
船旗國={是否方便旗國家,船旗國的滯留率,船旗國核準公約程度}
認可機構船級社={是否為IACS會員,船級社的滯留率}
公司NSM體系={A類,B類, C類}
船舶NSM體系={A類,B類, C類}
天氣地理及水文={A類,B類, C類}
過去36個月每次檢查記錄的缺陷數(shù)量={前三次安檢平均缺陷數(shù)小于等于5個,前三次安檢平均缺陷數(shù)大于5個但小于等于10個,前三次安檢平均缺陷數(shù)大于10個但小于等于15個,前三次安檢平均缺陷數(shù)大于15個}
過去36個月滯留數(shù)量={未被滯留,被滯留1次,被滯留2次,被滯留2次以上}
距上次檢查時間={0~6個月,7~12個,13個月+}
距上次滯留時間={0~6個月,7~12個,13個月+}
是否存在未糾正缺陷={不存在,存在}
2、離散化
由于粗集理論方法分析的決策是有限維的離散化數(shù)據(jù)表,因此對上述數(shù)據(jù)必須進行離散化,使屬性值離散化后的空間維數(shù)最小,才能進行粗糙集分析。對各條件屬性指標相對應的離散化規(guī)則如下:
VTYPE={1,2,3},VAGE={1,2,3,4},VMARINER={1,2,3,4},VROUTE={1,2},VTON={1,2,3,4},VFLAG={1,2,3},VCS={1,2},VCNSM={1,2,3},VSNSM={1,2,3},VWET={1,2,3},VDEF={1,2,3},VDET={1,2,3,4},VDUR1={1,2,3},VDUR2={1,2,3},VDEF2={1,2},決策屬性離散化為VACC={1,0}。
3、基于RSES粗糙集軟件的數(shù)據(jù)挖掘
采用Warsaw University開發(fā)粗糙集數(shù)據(jù)處理系統(tǒng)RSES 對PSC選船決策表進行約簡,得出屬性約簡集,規(guī)則集及各屬性分布頻度。具體步驟如下:
RSES決策表生成。在Newproject下用“InsertTable”插入新表格并導入原始決策表。新的決策表共有100條記錄,16個屬性,其中15個為條件屬性,1個為決策屬性。
約簡。利用粗糙集理論中常見的約簡和規(guī)則生成算法—基因遺傳算法(genetical algorithm),規(guī)則集生成。共產(chǎn)生22個約簡集1544條規(guī)則,與無約簡的決策規(guī)則集相比,擴大了15.4倍。各約簡集的規(guī)則數(shù)為:
|Rules{TYPE,MARINER,FLAG,CNSM,DEF,DUR2,ROUTE}|=126
|Rules{TYPE,MARINER,FLAG,CNSM,DEF,DEF2}|=124
|Rules{TYPE,MARINER,ROUTE,CS,CNSM,WET,DUR2}|=58
|Rules{TYPE,MARINER,CNSM,WET,DEF,DEF2}|=56
計算可信度。根據(jù)可信度定義,CFij=card(Ci∩Dj)/card(Ci), Ci∩Dj≠?覫這里只列舉條件屬性TYPE的可信度計算方法,其他同。
CF(TYPE→ACC(1))=card(TYPE∩ACC(1))/card(TYPE)=962/1544=0.62
CF(TYPE→ACC(0))=card(TYPE∩ACC(0))/card(TYPE)=582/1544=0.38
則我們可以認為船型指標導致進行PSC檢查的可信度大于不進行PSC檢查的可信度。
綜上選取Rules{TYPE,MARINER,FLAG,CNSM,DEF,DUR2,ROUTE}作為PSC檢查的評價因素約簡集。
BP神經(jīng)網(wǎng)絡在PSC選船模型中的應用
本文采用權值訓練中使用誤差逆向傳播方式的反向傳播(backward propagation, BP)神經(jīng)網(wǎng)絡。使用MATLAB語言的神經(jīng)網(wǎng)絡工具箱提供的函數(shù)和神經(jīng)網(wǎng)絡類,采用Sigmoid函數(shù)作為傳輸函數(shù),使用net=newff(minmax(Xtrain),[10,10,1],{'tansig','tansig','purelin'},'traingdm')建立神經(jīng)網(wǎng)絡。這里構建3個隱層的神經(jīng)網(wǎng)絡,第一個隱層節(jié)點個數(shù)10, 第2個隱層節(jié)點數(shù)個數(shù)為10,第3個隱層有1個節(jié)點。具體設置如下:
自學習的學習率net.trainParam.lr = 0.02;
學習系數(shù)的初始值,Marquardt調(diào)整參數(shù)net.trainParam.mu=0 ;
學習系數(shù)下降因子net.trainParam.mu_dec= 0.9;
學習系數(shù)上升因子net.trainParam.mu_inc=1.05;
訓練步數(shù)net.trainParam.epochs = 10000;
訓練目標net.trainParam.goal = 0.01;
將訓練樣本使用規(guī)則約簡后從遼寧海事局PSC檢查數(shù)據(jù)庫中另選10組樣本對網(wǎng)絡進行測試經(jīng)過7419步訓練,性能達到0.00999992,網(wǎng)絡平滑收斂于全局極小值,得出訓練過程的均方誤差曲線。表1為測試樣本,可見真實檢查結果和該算法辨識結果誤差較小,從而證明該網(wǎng)絡精度較高,滿足實際PSC工作需要。
(作者單位:大連海事大學)