国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Apriori算法的PSC檢查船舶缺陷數(shù)據(jù)挖掘

2014-07-17 00:06姜美靈鄔惠國肖英杰王露向俊
水運管理 2014年4期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則

姜美靈+鄔惠國+肖英杰+王露+向俊

【摘 要】 為了提高我國港口國監(jiān)督(PSC)工作人員的工作效率,以近10年東南沿海諸港的PSC檢查中化學品船船舶缺陷信息為背景,運用Apriori算法對其缺陷數(shù)據(jù)進行研究分析,通過生成頻繁項目集,從中提取符合條件的關(guān)聯(lián)規(guī)則。研究結(jié)果表明,該方法能夠準確、直觀地總結(jié)出船舶缺陷信息的關(guān)聯(lián)性,為我國PSC檢查提供有效的參考依據(jù)。

【關(guān)鍵詞】 港口國監(jiān)督(PSC);Apriori;關(guān)聯(lián)規(guī)則;船舶缺陷

0 引 言

1978年,“AMOCO CADIZ”輪觸礁事故促成了港口國監(jiān)督(PSC)制度的形成。國際海事組織(IMO)強調(diào)落實公約標準的三重保障:IMO負責制定標準;船旗國負責實施標準;港口國負責監(jiān)督檢查。PSC是指港口國當局針對停泊于其港口的外國船舶,通過采取強制糾正或滯留等手段使船舶的技術(shù)狀況、操縱性要求、防污染設(shè)施以及船員工作條件等諸多方面逐漸符合有關(guān)國際海事公約及相關(guān)規(guī)定的制度。PSC是船旗國履約的有效補充,是保障海上安全和防止污染的最后一道防線,是公認的消除低于標準船舶、保證海上安全和保護海洋環(huán)境的有效手段。隨著相關(guān)國際海事公約修正案的生效,特別是2012年《STCW公約》馬尼拉修正案的實施,對PSC檢查產(chǎn)生了深遠的影響。由于PSC檢查人員對PSC制度的理解不盡相同,受本地環(huán)境、港口當局特別規(guī)定等因素的影響,各區(qū)域及各港口PSC檢查的側(cè)重點也不同,從而形成了各自獨有的特點。通過分析本區(qū)域以往大量的PSC檢查數(shù)據(jù),有助于PSC工作人員做好PSC檢查工作。本文依據(jù)近10年來東南沿海諸港的PSC檢查數(shù)據(jù),以化學品船為例,通過生成頻繁項目集,并基于從中提取符合條件的關(guān)聯(lián)規(guī)則,挖掘東南沿海諸港PSC檢查工作中化學品船的船舶缺陷關(guān)系,為PSC檢查提供有效的參考依據(jù)。

1 PSC檢查的一般程序

目前,我國各檢查站點的PSC檢查程序、判斷標準均不一致,且每個時期的側(cè)重點也不同,但總體遵循一定的規(guī)則。初次檢查(包括船舶文書的有效性檢查以及關(guān)鍵性設(shè)備及操作檢查)中,未發(fā)現(xiàn)明顯缺陷,則檢查結(jié)束;若發(fā)現(xiàn)缺陷,則記錄缺陷。缺陷嚴重并足以構(gòu)成滯留的,則采取措施滯留船舶;缺陷并不構(gòu)成滯留,但PSC工作人員懷疑船舶可能存在嚴重缺陷且發(fā)現(xiàn)明顯依據(jù),則進行詳細檢查。在詳細檢查中發(fā)現(xiàn)嚴重缺陷,且足以構(gòu)成滯留的,應采取措施滯留船舶。在船舶糾正缺陷后,申請復查,經(jīng)PSC工作人員復查合格后,解除船舶滯留。對一般缺陷,PSC檢查員給出處理意見,如需復查,經(jīng)復查合格后,船舶可以開航。針對每次檢查的書面記錄,均須導入PSC數(shù)據(jù)庫,形成電子記錄。

2 基于Apriori算法的數(shù)據(jù)關(guān)系挖掘

2.1 Apriori算法

2.1.1 算法思想

就本文而言,某一艘船舶被檢測出的所有缺陷代表記錄,一種缺陷代表一個項目,那么Tcount即為東南沿海諸港近10年來對化學品船進行PSC檢查中存在缺陷的記錄總數(shù);xcount為PSC檢查記錄中存在x缺陷的記錄數(shù),(x,y)count為PSC檢查記錄中同時存在x和y缺陷的記錄數(shù)。

Apriori算法的主要挖掘功能表現(xiàn)為:

(1)從項目集合中找出k-頻繁項目集,其中,k代表項目集中項目的數(shù)量為k個;

(2)從頻繁項目集合中生成滿足最低置信度及支持度的關(guān)聯(lián)規(guī)則。

2.1.2 算法步驟

Apriori算法是一種寬度優(yōu)先算法,其步驟為:

(1)掃描記錄T,提取每條記錄中出現(xiàn)的項目,若該項目為首次出現(xiàn),則加入候選1-頻繁項目集的集合C1,并將該項目的計數(shù)值設(shè)置為1;若該項目在集合C1中已經(jīng)存在,則該項目的計數(shù)值再加1,掃描完記錄集T即得到候選1-頻繁項目集的集合C1。對于生成的項目集,通過刪除計數(shù)值小于的項目集,即可生成1-頻繁項目集的集合L1。

(2)假設(shè)(k-1)-頻繁項目集Lk-1已生成,則可通過Lk-1來生成Lk,將Lk-1與自身進行連接(Lk-1中的每個項目集與其他項目集相互連接),得到候選k-頻繁項目集的集合Ck。

(3)對集合Ck進行剪枝,從集合Ck中刪除所有(k-1)-子集不全包含在集合Lk-1中的項目集。

(4)在掃描記錄集T時,其中每條記錄包含集合Ck中的候選項目集,則將候選項目集的計數(shù)值加1(在進行掃描前,將計數(shù)值初始值設(shè)為0);在掃描集合Ck時,刪除計數(shù)值小于的項目集,即可得到k-頻繁項目集的集合Lk。

(5)重復步驟(2)至(4),直到集合Lk為空。

(6)對集合L1至Lk取并集,通過掃描數(shù)據(jù)庫,對每項進行計數(shù)得到最終的頻繁項目集L。

(7)在頻繁項目集中搜索滿足最小可信度的規(guī)則,并輸出滿足要求的所有規(guī)則。

2.2 基于Apriori算法的化學品船缺陷數(shù)據(jù)挖掘

2.2.1 PSC檢查數(shù)據(jù)庫的處理

本文選取東南沿海諸港10年來化學品船的PSC檢查缺陷數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)。為便于算法執(zhí)行,對PSC數(shù)據(jù)庫進行處理,將同一艘船舶的n條缺陷數(shù)據(jù)合并為一條包含所有缺陷的記錄;為提高數(shù)據(jù)處理的速度,將不相關(guān)船舶數(shù)據(jù)略去,僅保留最為重要的缺陷代碼及船型等數(shù)據(jù)記錄為便于記錄,PSC數(shù)據(jù)庫將船舶缺陷分為27類,并通過數(shù)字進行標識,船舶缺陷代碼及缺陷描述見表2。

由圖1和圖2可知,化學品船的高頻缺陷主要分布在缺陷代碼為05~20的范圍內(nèi),因此,通過Apriori算法搜索該區(qū)域內(nèi)的關(guān)聯(lián)規(guī)則較為適合。新建數(shù)據(jù)庫并將缺陷代碼在05~20范圍內(nèi)的記錄填充到該數(shù)據(jù)庫中,利用Visual Studio平臺進行運算。在設(shè)定minsup為0.3,minconf為0.7時,程序執(zhí)行結(jié)果見圖3。

3 結(jié)果分析

(1)通過對PSC數(shù)據(jù)庫中缺陷代碼項的聚合,以及觀察分析缺陷頻率分布,得出被檢測的化學品船的缺陷主要集中在缺陷代碼為05~20的范圍內(nèi),占所有缺陷比率的86%。

4 結(jié) 語

本文僅對PSC數(shù)據(jù)庫中的化學品船的船舶缺陷進行關(guān)系挖掘,但該方法對其他類型船舶及PSC數(shù)據(jù)庫中其他字段的缺陷關(guān)系挖掘同樣適用。

對于大數(shù)據(jù)的關(guān)系挖掘是一項非常龐大且復雜的系統(tǒng)工程。本文嘗試使用Apriori算法挖掘關(guān)聯(lián)規(guī)則,并相應地獲得一些結(jié)論,為化學品船PSC檢查提供一定的參考,以提高我國PSC檢查船舶缺陷的效率。數(shù)據(jù)關(guān)系挖掘算法相比傳統(tǒng)的概率計算方法更為快捷、高效、準確。利用Apriori算法進行船舶缺陷關(guān)系挖掘具有非常好的前景。

參考文獻:

[1] 袁建忠,蔡存強,胡志武.港口國監(jiān)督(PSC)決策支持算法[J].上海海事大學學報,2013,34(2):30-34.

[2] 陳超,曾向明.港口國檢查制度凸現(xiàn)的問題及其發(fā)展趨勢[J].中國航海,2006(4):78-81.

[3] 柴華昕,王勇.Apriori挖掘頻繁項目集算法的改進[J].計算機工程與應用,2007(24):158-161,171.

【摘 要】 為了提高我國港口國監(jiān)督(PSC)工作人員的工作效率,以近10年東南沿海諸港的PSC檢查中化學品船船舶缺陷信息為背景,運用Apriori算法對其缺陷數(shù)據(jù)進行研究分析,通過生成頻繁項目集,從中提取符合條件的關(guān)聯(lián)規(guī)則。研究結(jié)果表明,該方法能夠準確、直觀地總結(jié)出船舶缺陷信息的關(guān)聯(lián)性,為我國PSC檢查提供有效的參考依據(jù)。

【關(guān)鍵詞】 港口國監(jiān)督(PSC);Apriori;關(guān)聯(lián)規(guī)則;船舶缺陷

0 引 言

1978年,“AMOCO CADIZ”輪觸礁事故促成了港口國監(jiān)督(PSC)制度的形成。國際海事組織(IMO)強調(diào)落實公約標準的三重保障:IMO負責制定標準;船旗國負責實施標準;港口國負責監(jiān)督檢查。PSC是指港口國當局針對停泊于其港口的外國船舶,通過采取強制糾正或滯留等手段使船舶的技術(shù)狀況、操縱性要求、防污染設(shè)施以及船員工作條件等諸多方面逐漸符合有關(guān)國際海事公約及相關(guān)規(guī)定的制度。PSC是船旗國履約的有效補充,是保障海上安全和防止污染的最后一道防線,是公認的消除低于標準船舶、保證海上安全和保護海洋環(huán)境的有效手段。隨著相關(guān)國際海事公約修正案的生效,特別是2012年《STCW公約》馬尼拉修正案的實施,對PSC檢查產(chǎn)生了深遠的影響。由于PSC檢查人員對PSC制度的理解不盡相同,受本地環(huán)境、港口當局特別規(guī)定等因素的影響,各區(qū)域及各港口PSC檢查的側(cè)重點也不同,從而形成了各自獨有的特點。通過分析本區(qū)域以往大量的PSC檢查數(shù)據(jù),有助于PSC工作人員做好PSC檢查工作。本文依據(jù)近10年來東南沿海諸港的PSC檢查數(shù)據(jù),以化學品船為例,通過生成頻繁項目集,并基于從中提取符合條件的關(guān)聯(lián)規(guī)則,挖掘東南沿海諸港PSC檢查工作中化學品船的船舶缺陷關(guān)系,為PSC檢查提供有效的參考依據(jù)。

1 PSC檢查的一般程序

目前,我國各檢查站點的PSC檢查程序、判斷標準均不一致,且每個時期的側(cè)重點也不同,但總體遵循一定的規(guī)則。初次檢查(包括船舶文書的有效性檢查以及關(guān)鍵性設(shè)備及操作檢查)中,未發(fā)現(xiàn)明顯缺陷,則檢查結(jié)束;若發(fā)現(xiàn)缺陷,則記錄缺陷。缺陷嚴重并足以構(gòu)成滯留的,則采取措施滯留船舶;缺陷并不構(gòu)成滯留,但PSC工作人員懷疑船舶可能存在嚴重缺陷且發(fā)現(xiàn)明顯依據(jù),則進行詳細檢查。在詳細檢查中發(fā)現(xiàn)嚴重缺陷,且足以構(gòu)成滯留的,應采取措施滯留船舶。在船舶糾正缺陷后,申請復查,經(jīng)PSC工作人員復查合格后,解除船舶滯留。對一般缺陷,PSC檢查員給出處理意見,如需復查,經(jīng)復查合格后,船舶可以開航。針對每次檢查的書面記錄,均須導入PSC數(shù)據(jù)庫,形成電子記錄。

2 基于Apriori算法的數(shù)據(jù)關(guān)系挖掘

2.1 Apriori算法

2.1.1 算法思想

就本文而言,某一艘船舶被檢測出的所有缺陷代表記錄,一種缺陷代表一個項目,那么Tcount即為東南沿海諸港近10年來對化學品船進行PSC檢查中存在缺陷的記錄總數(shù);xcount為PSC檢查記錄中存在x缺陷的記錄數(shù),(x,y)count為PSC檢查記錄中同時存在x和y缺陷的記錄數(shù)。

Apriori算法的主要挖掘功能表現(xiàn)為:

(1)從項目集合中找出k-頻繁項目集,其中,k代表項目集中項目的數(shù)量為k個;

(2)從頻繁項目集合中生成滿足最低置信度及支持度的關(guān)聯(lián)規(guī)則。

2.1.2 算法步驟

Apriori算法是一種寬度優(yōu)先算法,其步驟為:

(1)掃描記錄T,提取每條記錄中出現(xiàn)的項目,若該項目為首次出現(xiàn),則加入候選1-頻繁項目集的集合C1,并將該項目的計數(shù)值設(shè)置為1;若該項目在集合C1中已經(jīng)存在,則該項目的計數(shù)值再加1,掃描完記錄集T即得到候選1-頻繁項目集的集合C1。對于生成的項目集,通過刪除計數(shù)值小于的項目集,即可生成1-頻繁項目集的集合L1。

(2)假設(shè)(k-1)-頻繁項目集Lk-1已生成,則可通過Lk-1來生成Lk,將Lk-1與自身進行連接(Lk-1中的每個項目集與其他項目集相互連接),得到候選k-頻繁項目集的集合Ck。

(3)對集合Ck進行剪枝,從集合Ck中刪除所有(k-1)-子集不全包含在集合Lk-1中的項目集。

(4)在掃描記錄集T時,其中每條記錄包含集合Ck中的候選項目集,則將候選項目集的計數(shù)值加1(在進行掃描前,將計數(shù)值初始值設(shè)為0);在掃描集合Ck時,刪除計數(shù)值小于的項目集,即可得到k-頻繁項目集的集合Lk。

(5)重復步驟(2)至(4),直到集合Lk為空。

(6)對集合L1至Lk取并集,通過掃描數(shù)據(jù)庫,對每項進行計數(shù)得到最終的頻繁項目集L。

(7)在頻繁項目集中搜索滿足最小可信度的規(guī)則,并輸出滿足要求的所有規(guī)則。

2.2 基于Apriori算法的化學品船缺陷數(shù)據(jù)挖掘

2.2.1 PSC檢查數(shù)據(jù)庫的處理

本文選取東南沿海諸港10年來化學品船的PSC檢查缺陷數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)。為便于算法執(zhí)行,對PSC數(shù)據(jù)庫進行處理,將同一艘船舶的n條缺陷數(shù)據(jù)合并為一條包含所有缺陷的記錄;為提高數(shù)據(jù)處理的速度,將不相關(guān)船舶數(shù)據(jù)略去,僅保留最為重要的缺陷代碼及船型等數(shù)據(jù)記錄為便于記錄,PSC數(shù)據(jù)庫將船舶缺陷分為27類,并通過數(shù)字進行標識,船舶缺陷代碼及缺陷描述見表2。

由圖1和圖2可知,化學品船的高頻缺陷主要分布在缺陷代碼為05~20的范圍內(nèi),因此,通過Apriori算法搜索該區(qū)域內(nèi)的關(guān)聯(lián)規(guī)則較為適合。新建數(shù)據(jù)庫并將缺陷代碼在05~20范圍內(nèi)的記錄填充到該數(shù)據(jù)庫中,利用Visual Studio平臺進行運算。在設(shè)定minsup為0.3,minconf為0.7時,程序執(zhí)行結(jié)果見圖3。

3 結(jié)果分析

(1)通過對PSC數(shù)據(jù)庫中缺陷代碼項的聚合,以及觀察分析缺陷頻率分布,得出被檢測的化學品船的缺陷主要集中在缺陷代碼為05~20的范圍內(nèi),占所有缺陷比率的86%。

4 結(jié) 語

本文僅對PSC數(shù)據(jù)庫中的化學品船的船舶缺陷進行關(guān)系挖掘,但該方法對其他類型船舶及PSC數(shù)據(jù)庫中其他字段的缺陷關(guān)系挖掘同樣適用。

對于大數(shù)據(jù)的關(guān)系挖掘是一項非常龐大且復雜的系統(tǒng)工程。本文嘗試使用Apriori算法挖掘關(guān)聯(lián)規(guī)則,并相應地獲得一些結(jié)論,為化學品船PSC檢查提供一定的參考,以提高我國PSC檢查船舶缺陷的效率。數(shù)據(jù)關(guān)系挖掘算法相比傳統(tǒng)的概率計算方法更為快捷、高效、準確。利用Apriori算法進行船舶缺陷關(guān)系挖掘具有非常好的前景。

參考文獻:

[1] 袁建忠,蔡存強,胡志武.港口國監(jiān)督(PSC)決策支持算法[J].上海海事大學學報,2013,34(2):30-34.

[2] 陳超,曾向明.港口國檢查制度凸現(xiàn)的問題及其發(fā)展趨勢[J].中國航海,2006(4):78-81.

[3] 柴華昕,王勇.Apriori挖掘頻繁項目集算法的改進[J].計算機工程與應用,2007(24):158-161,171.

【摘 要】 為了提高我國港口國監(jiān)督(PSC)工作人員的工作效率,以近10年東南沿海諸港的PSC檢查中化學品船船舶缺陷信息為背景,運用Apriori算法對其缺陷數(shù)據(jù)進行研究分析,通過生成頻繁項目集,從中提取符合條件的關(guān)聯(lián)規(guī)則。研究結(jié)果表明,該方法能夠準確、直觀地總結(jié)出船舶缺陷信息的關(guān)聯(lián)性,為我國PSC檢查提供有效的參考依據(jù)。

【關(guān)鍵詞】 港口國監(jiān)督(PSC);Apriori;關(guān)聯(lián)規(guī)則;船舶缺陷

0 引 言

1978年,“AMOCO CADIZ”輪觸礁事故促成了港口國監(jiān)督(PSC)制度的形成。國際海事組織(IMO)強調(diào)落實公約標準的三重保障:IMO負責制定標準;船旗國負責實施標準;港口國負責監(jiān)督檢查。PSC是指港口國當局針對停泊于其港口的外國船舶,通過采取強制糾正或滯留等手段使船舶的技術(shù)狀況、操縱性要求、防污染設(shè)施以及船員工作條件等諸多方面逐漸符合有關(guān)國際海事公約及相關(guān)規(guī)定的制度。PSC是船旗國履約的有效補充,是保障海上安全和防止污染的最后一道防線,是公認的消除低于標準船舶、保證海上安全和保護海洋環(huán)境的有效手段。隨著相關(guān)國際海事公約修正案的生效,特別是2012年《STCW公約》馬尼拉修正案的實施,對PSC檢查產(chǎn)生了深遠的影響。由于PSC檢查人員對PSC制度的理解不盡相同,受本地環(huán)境、港口當局特別規(guī)定等因素的影響,各區(qū)域及各港口PSC檢查的側(cè)重點也不同,從而形成了各自獨有的特點。通過分析本區(qū)域以往大量的PSC檢查數(shù)據(jù),有助于PSC工作人員做好PSC檢查工作。本文依據(jù)近10年來東南沿海諸港的PSC檢查數(shù)據(jù),以化學品船為例,通過生成頻繁項目集,并基于從中提取符合條件的關(guān)聯(lián)規(guī)則,挖掘東南沿海諸港PSC檢查工作中化學品船的船舶缺陷關(guān)系,為PSC檢查提供有效的參考依據(jù)。

1 PSC檢查的一般程序

目前,我國各檢查站點的PSC檢查程序、判斷標準均不一致,且每個時期的側(cè)重點也不同,但總體遵循一定的規(guī)則。初次檢查(包括船舶文書的有效性檢查以及關(guān)鍵性設(shè)備及操作檢查)中,未發(fā)現(xiàn)明顯缺陷,則檢查結(jié)束;若發(fā)現(xiàn)缺陷,則記錄缺陷。缺陷嚴重并足以構(gòu)成滯留的,則采取措施滯留船舶;缺陷并不構(gòu)成滯留,但PSC工作人員懷疑船舶可能存在嚴重缺陷且發(fā)現(xiàn)明顯依據(jù),則進行詳細檢查。在詳細檢查中發(fā)現(xiàn)嚴重缺陷,且足以構(gòu)成滯留的,應采取措施滯留船舶。在船舶糾正缺陷后,申請復查,經(jīng)PSC工作人員復查合格后,解除船舶滯留。對一般缺陷,PSC檢查員給出處理意見,如需復查,經(jīng)復查合格后,船舶可以開航。針對每次檢查的書面記錄,均須導入PSC數(shù)據(jù)庫,形成電子記錄。

2 基于Apriori算法的數(shù)據(jù)關(guān)系挖掘

2.1 Apriori算法

2.1.1 算法思想

就本文而言,某一艘船舶被檢測出的所有缺陷代表記錄,一種缺陷代表一個項目,那么Tcount即為東南沿海諸港近10年來對化學品船進行PSC檢查中存在缺陷的記錄總數(shù);xcount為PSC檢查記錄中存在x缺陷的記錄數(shù),(x,y)count為PSC檢查記錄中同時存在x和y缺陷的記錄數(shù)。

Apriori算法的主要挖掘功能表現(xiàn)為:

(1)從項目集合中找出k-頻繁項目集,其中,k代表項目集中項目的數(shù)量為k個;

(2)從頻繁項目集合中生成滿足最低置信度及支持度的關(guān)聯(lián)規(guī)則。

2.1.2 算法步驟

Apriori算法是一種寬度優(yōu)先算法,其步驟為:

(1)掃描記錄T,提取每條記錄中出現(xiàn)的項目,若該項目為首次出現(xiàn),則加入候選1-頻繁項目集的集合C1,并將該項目的計數(shù)值設(shè)置為1;若該項目在集合C1中已經(jīng)存在,則該項目的計數(shù)值再加1,掃描完記錄集T即得到候選1-頻繁項目集的集合C1。對于生成的項目集,通過刪除計數(shù)值小于的項目集,即可生成1-頻繁項目集的集合L1。

(2)假設(shè)(k-1)-頻繁項目集Lk-1已生成,則可通過Lk-1來生成Lk,將Lk-1與自身進行連接(Lk-1中的每個項目集與其他項目集相互連接),得到候選k-頻繁項目集的集合Ck。

(3)對集合Ck進行剪枝,從集合Ck中刪除所有(k-1)-子集不全包含在集合Lk-1中的項目集。

(4)在掃描記錄集T時,其中每條記錄包含集合Ck中的候選項目集,則將候選項目集的計數(shù)值加1(在進行掃描前,將計數(shù)值初始值設(shè)為0);在掃描集合Ck時,刪除計數(shù)值小于的項目集,即可得到k-頻繁項目集的集合Lk。

(5)重復步驟(2)至(4),直到集合Lk為空。

(6)對集合L1至Lk取并集,通過掃描數(shù)據(jù)庫,對每項進行計數(shù)得到最終的頻繁項目集L。

(7)在頻繁項目集中搜索滿足最小可信度的規(guī)則,并輸出滿足要求的所有規(guī)則。

2.2 基于Apriori算法的化學品船缺陷數(shù)據(jù)挖掘

2.2.1 PSC檢查數(shù)據(jù)庫的處理

本文選取東南沿海諸港10年來化學品船的PSC檢查缺陷數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)。為便于算法執(zhí)行,對PSC數(shù)據(jù)庫進行處理,將同一艘船舶的n條缺陷數(shù)據(jù)合并為一條包含所有缺陷的記錄;為提高數(shù)據(jù)處理的速度,將不相關(guān)船舶數(shù)據(jù)略去,僅保留最為重要的缺陷代碼及船型等數(shù)據(jù)記錄為便于記錄,PSC數(shù)據(jù)庫將船舶缺陷分為27類,并通過數(shù)字進行標識,船舶缺陷代碼及缺陷描述見表2。

由圖1和圖2可知,化學品船的高頻缺陷主要分布在缺陷代碼為05~20的范圍內(nèi),因此,通過Apriori算法搜索該區(qū)域內(nèi)的關(guān)聯(lián)規(guī)則較為適合。新建數(shù)據(jù)庫并將缺陷代碼在05~20范圍內(nèi)的記錄填充到該數(shù)據(jù)庫中,利用Visual Studio平臺進行運算。在設(shè)定minsup為0.3,minconf為0.7時,程序執(zhí)行結(jié)果見圖3。

3 結(jié)果分析

(1)通過對PSC數(shù)據(jù)庫中缺陷代碼項的聚合,以及觀察分析缺陷頻率分布,得出被檢測的化學品船的缺陷主要集中在缺陷代碼為05~20的范圍內(nèi),占所有缺陷比率的86%。

4 結(jié) 語

本文僅對PSC數(shù)據(jù)庫中的化學品船的船舶缺陷進行關(guān)系挖掘,但該方法對其他類型船舶及PSC數(shù)據(jù)庫中其他字段的缺陷關(guān)系挖掘同樣適用。

對于大數(shù)據(jù)的關(guān)系挖掘是一項非常龐大且復雜的系統(tǒng)工程。本文嘗試使用Apriori算法挖掘關(guān)聯(lián)規(guī)則,并相應地獲得一些結(jié)論,為化學品船PSC檢查提供一定的參考,以提高我國PSC檢查船舶缺陷的效率。數(shù)據(jù)關(guān)系挖掘算法相比傳統(tǒng)的概率計算方法更為快捷、高效、準確。利用Apriori算法進行船舶缺陷關(guān)系挖掘具有非常好的前景。

參考文獻:

[1] 袁建忠,蔡存強,胡志武.港口國監(jiān)督(PSC)決策支持算法[J].上海海事大學學報,2013,34(2):30-34.

[2] 陳超,曾向明.港口國檢查制度凸現(xiàn)的問題及其發(fā)展趨勢[J].中國航海,2006(4):78-81.

[3] 柴華昕,王勇.Apriori挖掘頻繁項目集算法的改進[J].計算機工程與應用,2007(24):158-161,171.

猜你喜歡
關(guān)聯(lián)規(guī)則
數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應用
基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù)的研究與應用
面向用戶需求的自適應學習系統(tǒng)個性化學習路徑推薦研究
工業(yè)大數(shù)據(jù)挖掘分析及應用前景研究
基于Apriori算法的高校學生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
基于關(guān)聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
基于關(guān)聯(lián)規(guī)則的中醫(yī)肺癌數(shù)據(jù)挖掘應用研究
數(shù)據(jù)挖掘在超市大數(shù)據(jù)中的應用