陳貽平 徐立云 樓科文
缸體是多面多孔的箱體類零件,工藝復雜多樣,一直是發(fā)動機生產中的難點,其加工精度和一致性直接影響汽車性能。以往企業(yè)在進行缸體加工工藝設計時,主要依靠工藝人員的經驗和智慧[1]。工藝人員的經驗信息隱藏在每次決策實例中,人們希望這種決策經驗信息以更容易被理解的形式表示出來。因此,從已有的成功案例和經驗中提取工藝規(guī)則,有利于提高工藝決策效率和質量。
粗糙集理論[2-3]是進行數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的有效手段之一,它直接從給定集合的描述出發(fā),通過不可分辨關系和等價類確定給定問題的近似域,從而找出該問題的內在規(guī)律。在規(guī)則提取方面,文獻[4]提出了一種基于粗糙集理論的決策規(guī)則提取方法,通過分析故障實例,獲取了故障診斷規(guī)則。文獻[5]應用擴展粗糙集對工藝信息表進行數(shù)據(jù)挖掘提取工藝偏好知識。文獻[6]在構建工藝數(shù)據(jù)集市的基礎上,建立了基于粗糙集屬性約簡的行業(yè)工藝知識發(fā)現(xiàn)方法。文獻[7]在產品設計本體模型的基礎上,利用粗糙集和信息技術從知識使用日志中抽取了知識推送規(guī)則。文獻[8]采用粗糙集理論規(guī)則學習算法,用于優(yōu)化變量約束范圍的規(guī)則提取,對切削參數(shù)進行優(yōu)化。但傳統(tǒng)粗糙集基于確定的等價關系進行規(guī)則提取,容易忽略工藝數(shù)據(jù)中潛在的規(guī)則。其次,在實際生產過程中,缸體加工工藝不是一成不變的[9],而上述研究者都把訓練樣本作為一種靜態(tài)數(shù)據(jù)來處理,當數(shù)據(jù)不斷擴大時,其準確性和適應性會大大下降。
本文將缸體加工工藝數(shù)據(jù)進行粗糙化處理,將處理后的數(shù)據(jù)建立加工工藝決策表,采用變精度粗糙集數(shù)據(jù)挖掘方法,從決策表中提取隱含、潛在的加工工藝規(guī)則。同時,提出缸體案例規(guī)則庫的更新方法,從而使缸體加工工藝決策更準確和快速,滿足產品工藝設計要求。
缸體加工工藝規(guī)則的提取本質上是一個模式分類與識別問題[10],通過粗糙集理論的等價關系可以對對象集進行分類。工藝信息系統(tǒng)是工藝實例庫的抽象描述,它是工藝對象集與工藝屬性集之間的紐帶,也是工藝規(guī)則提取的信息基礎。工藝決策信息系統(tǒng)則是將工藝信息系統(tǒng)中的工藝屬性分為工藝條件屬性和工藝決策屬性兩類,通過兩類屬性之間的關系獲取工藝規(guī)則。
設四元組S=(U,A,f,V)是工藝信息決策系統(tǒng)。其中,U為工藝實例樣本集,稱為論域,U={X1,X2,…,Xn},是各種特征的加工工藝實例,對于缸體而言,主要是孔、面和一些輔助特征的加工;A表示加工工藝屬性集,A={a1,a2,…,am},A=C∪D,C∩D≠?,C={a1,a2,…,am-1},表示工藝決策條件屬性集,其元素多樣,例如孔徑、深度、粗糙度、表面質量、平面度和加工精度等;D={am},表示加工工藝決策屬性集,即特征的加工方法,例如孔加工的鉆、擴、鉸和平面加工的銑、磨等;V表示A的值域;f為映射函數(shù):f:U×A→V,表示對每個工藝實例對象的各屬性賦予一個信息值。
定義1 設A為加工工藝屬性集,A在加工工藝實例集上確定了一個不可分辨關系,記作IND(A),表示為:
按照條件屬性C和決策屬性D對缸體加工工藝實例樣本集的劃分,稱為條件類和決策類,分別記為:
分別稱為由C與D決定的不可區(qū)分關系。對于B??C,給出對象空間的等價關系:
從而得到樣本空間U上的集合劃分U/RB:
式中,B(x)=(fb(x);b∈B)是屬性,[x]B是具有屬性B(x)的等價類。對于任意缸體加工工藝實例樣本X?U,存在它關于RB的上近似和下近似:
分類精度:γ(X)=|B(X)|/|U|。γ(X)反映了可能正確的知識在現(xiàn)有知識中的百分比。
Ziarko[11]在標準粗糙集模型的基礎上引進正確分類率β(0.5<β≤1)概念,提出變精度粗糙集模型,即允許一定程度的錯誤分類的存在,并通過設置閾值參數(shù),放松標準粗糙集理論對近似邊界的嚴格定義。對于不一致性較弱的數(shù)據(jù),有利于從邊界數(shù)據(jù)中發(fā)現(xiàn)潛在規(guī)則[12-13]。
定義2 對于某一X?U和U上的一個不可區(qū)分關系B?A,給定閥值β(0.5<β≤1),則稱:
為X的B的下β近似;
為X的B的上β近似。則:
β正域:
β負域:
β邊界域:
圖1所示為變精度粗糙集的概念示意圖,隨著β減小,變精度粗糙集的近似邊界區(qū)域變窄,即變精度粗糙集的不確定區(qū)域變小。由于分類精度與正確分類率呈負相關,β的取值應根據(jù)實際情況而定。
圖1 變精度粗糙集概念示意圖
影響缸體加工工藝決策的工藝條件屬性很多,如:尺寸大小、加工精度、粗糙度和材料等。其中,尺寸大小,如孔徑、深度等為連續(xù)型屬性;加工精度,如IT9、IT10為離散型屬性;材料,如HT200、HT250為字符型屬性。首先要將工藝屬性數(shù)據(jù)進行離散化處理,列出挖掘對象的條件屬性C和決策屬性D,得到樣本集(論域)的屬性值列表。工藝知識表達方式應具有可解釋性,對工藝知識的處理不能脫離工藝語言本身的固有特征,而且還要考慮靈活的數(shù)學描述處理方式。缸體加工特征的工藝屬性預處理如下。
連續(xù)型屬性:孔徑、孔深、深徑比等屬性為連續(xù)型屬性,根據(jù)屬性值的分布情況,對均勻分布的屬性采用等寬分箱的離散化方法,取盡可能少的斷點將屬性空間劃分為盡量少的子空間,而對非均勻分布的屬性,則采用根據(jù)分布情況的自定義法進行離散[14]。
離散型屬性:粗糙度和加工精度是離散型屬性,可根據(jù)相應的國標或行業(yè)標準,通過模糊化處理成數(shù)值形式。
字符型屬性:主要是加工材料、加工資源和加工方法等,也可通過模糊化處理成數(shù)值形式。
布爾型屬性:主要是有無倒角,是否為螺紋孔等,可直接進行模糊處理,轉化成數(shù)值形式。
屬性約簡是粗糙集的理論的核心內容之一[15],缸體加工工藝屬性的約簡,是為了刪去冗余屬性,從眾多紛繁復雜的工藝規(guī)則中提取核心規(guī)則。變精度粗糙集求解屬性約簡只能采用啟發(fā)式的約簡算法,而不同啟發(fā)式約簡算法在于對屬性重要性的定義[13]。屬性信息量表明該屬性包含的信息的多少,信息量越大,則其分類能力越強;屬性重要度反映決策屬性分類對該屬性的依賴程度,重要度越大,則該屬性越關鍵。本文將屬性信息量和屬性重要度進行加權得到的屬性依賴度,進而對屬性的重要性進行定義。
定義3 條件屬性信息量:
其中,|U|為論域中缸體加工案例的數(shù)量;|Xi|為根據(jù)某類等價關系劃分的某個等價類所包含的案例個數(shù)。定義4 條件屬性重要度:
其中,|Di|為決策類的某個等價類;|posC(Di)|為某決策類的等價類正域所包含的案例數(shù)。
定義5 條件屬性C關于D的依賴度:
其中,ω為權重系數(shù),當ω=1時,表示只考慮屬性信息量;當ω=0時,表示只考慮屬性重要度。
定義6 令A為加工工藝屬性集,a∈A,若IND(A)=IND(A-{a}),則稱a為A中不必要的;否則a為A中必要的。如果a∈A都為A中必要的,則稱A是獨立的;否則成A是依賴的。
定義7 設Q?P,如果Q是獨立的,且IND(Q)=IND(P),則稱Q為P的一個約簡,記作red(P)。顯然,P有多個約簡。P中所有的必要屬性組成的集合稱為P的核,記作core(P)。核與約簡有如下關系:core(P)=∩red(P)。
定義 8 記DP(C,D,β)={CβD1,CβD2,…,CβD|U/D|},DP 為所有決策類β下近似構成的集合,是各決策類關于U/C的概率分布,稱DP為決策類下近似分布。
本文采用基于核屬性的啟發(fā)式約簡算法,首先對缸體加工所有的條件屬性集C的依賴度大小排序,依賴度最高的條件屬性必然存在于核中;再依次將其它條件屬性加入到依賴度最高的條件屬性中,直到整個集合關于決策屬性集D的下近似分布等于DP(C,D,β)。算法流程如下:
輸入:缸體加工工藝信息決策系統(tǒng)S=(U,A=C∪D,f,V),U為論域,C為工藝條件屬性集,D為決策屬性集。正確分類率β,權重系數(shù)ω,C關于D的依賴度sig(C,D,β),C關于D的下近似分布為DP(C,D,β)。
輸出:條件屬性約簡red(C,D,β)
Step1 計算屬性依賴度,以依賴度對屬性進行排序,假設順序為:
sig(C1,D,β)>sig(C2,D,β)>…>sig(Cm-1,D,β)
Step2 設置初始約簡集:
red(C,D,β)=C1
Step3 根據(jù)屬于的依賴度大小,依次加入到初始約簡集中,直到整個集合關于決策屬性集D的下近似分布等于DP(C,D,β):
缸體工藝決策表經屬性約簡后,留下精簡的工藝規(guī)則。采用支持度和準確度對工藝規(guī)則進行評價:
規(guī)則支持度:
規(guī)則準確度:
其中,S為規(guī)則前件,T為規(guī)則后件,X表示條件屬性滿足S的樣本,Y表示決策屬性滿足T的樣本,U為樣本全集。支持度表示缸體加工工藝樣本集中滿足該規(guī)則的樣本比例,如果支持度太小,規(guī)則就不具有代表性,設置最小支持度閥值σ,只保留大于閥值的工藝規(guī)則,可以減少規(guī)則的數(shù)目,提高提取規(guī)則的質量。準確度可作為規(guī)則發(fā)生矛盾時的評判依據(jù)。
目前,對規(guī)則更新的研究主要集中在規(guī)則集的更新方面,一般只考慮新增案例與原始規(guī)則的沖突包含和重復關系,忽略了新增案例與原始數(shù)據(jù)庫的屬性約簡表的關系。同時,傳統(tǒng)規(guī)則更新方法在處理新案例時,只考慮單次新案例的影響,但工藝數(shù)據(jù)庫是動態(tài)積累的,傳統(tǒng)方式不能體現(xiàn)這個積累過程。因此,本文在進行新舊規(guī)則更新時,對滿足最小支持度的“淘汰規(guī)則”做保留處理,而不是簡單剔除,隨著案例庫的不斷更新,“淘汰規(guī)則”可能被重新利用。
定義9 對于缸體加工工藝決策表S=(U,A=C∪D,f,V),B為C的一個約簡B?C,新案例X加入數(shù)據(jù)庫后,對于y??U,可以區(qū)分新案例X。
本文從屬性約簡表和規(guī)則集兩方面進行考慮,工藝規(guī)則集的更新產生的影響分為四種情況,圖2為新增案例決策流程,四種情況的處理方案如下所述。
圖2 新增案例決策流程
情況A:新增規(guī)則與原始規(guī)則未產生矛盾,同時原始規(guī)則可以覆蓋新增規(guī)則,規(guī)則集R不變。
情況B:新增規(guī)則與原始規(guī)則未產生矛盾,原始規(guī)則集不能覆蓋新增規(guī)則,將新規(guī)則直接添加到規(guī)則集,更新規(guī)則集為R′。
情況C:新增規(guī)則與原始規(guī)則有矛盾,例如:原始規(guī)則A和新增規(guī)則B的規(guī)則前件完全相同,但是規(guī)則后件不同,計算新規(guī)則的支持度,若不滿足最小支持度,σ,原始規(guī)則集不變,新規(guī)則直接淘汰;若滿足最小支持度,再計算比較新舊規(guī)則的準確度,取準確度大的規(guī)則,更新規(guī)則集,準確度小的規(guī)則作為備用規(guī)則儲存在備用規(guī)則集RS。實例庫不斷增大,當某備用規(guī)則支持度小于σ時,剔除該備用規(guī)則。若備用規(guī)則支持度大于規(guī)則集中與之矛盾的規(guī)則,替換原該規(guī)則更新規(guī)則集為R′。
情況D:原始約簡集不能區(qū)分新案例,更新案例庫,重新計算屬性約簡,并提取規(guī)則。
為方便說明問題,本文僅以缸體一階孔為例來進行規(guī)則提取和更新,表1列出多種型號缸體中統(tǒng)計出的20個孔的工藝特征信息。
表1 缸體加工案例
缸體加工工藝案例庫中的工藝信息數(shù)據(jù)根據(jù)本文提出的預處理方法進行處理。對于工藝案例中缺失的數(shù)據(jù)按照最低加工要求進行處理,比如“3”號孔的加工精度和粗糙度要求缺失,說明其加工精度和表面質量要求不高,就按照IT8以下和Ra 12.5處理。表2為工藝數(shù)據(jù)處理的對照表。
表2 工藝屬性—數(shù)學表達對照表
獲得加工工藝決策表,如表3所示。U為論域表示孔的集合,C1表示孔徑,C2表示深度,C3表示深徑比,C4表示加工精度,C5表示粗糙度,C6表示材料,C7表示是否為螺紋孔,D表示加工路線。例如,X2(21123212)表示論域中的第二個孔,其孔徑在10~20mm,深度小于30mm,深徑比在0~1,加工精度為IT8,粗糙度為Ra3.2,材料為HT200,非螺紋孔,其加工路線為鉆—擴—鉸。
表3 加工工藝決策表
決策屬性D對缸體加工工藝實例樣本集的劃分為:
條,,件屬性C對缸體加工工藝實例樣本集的劃分為:
為了達到一定的分類精度,根據(jù)分類精度和正確分類率的關系,結合實際情況,本文取β=0.7,則各決策類β下近似分布DP=(C,D,β)為:
按照式(3)對各條件屬性依賴度進行計算,取ω=0.5,依賴度計算結果如表4所示。
表4 依賴度計算結果
由計算結果可知,Sig(C4)>Sig(C5)>Sig(C1)>Sig(C3)>Sig(C2)>Sig(C6)。因此,核屬性取C4。根據(jù)條件屬性依賴度的大小依次將各條件屬性添加至核屬性,分別計算條件類。首先將C3添加至核屬性,即red(C,D,β)=C4∪C3,DP(red(C,D,β),D,β) ≠ DP(C,D,β),C4∪ C3不 是屬性的約簡。重復以上操作,直到添加到C3時,DP(red(C,D,β),D,β)=DP(C,D,β)。最后屬性約簡為 {C1,C3,C4,C5},屬性約簡結果如表5所示。
表5 屬性約簡結果
經屬性約簡后的決策表可以看作是一個規(guī)則集合,每條決策規(guī)則都精準地對應該決策表中的一個實例。計算每條規(guī)則的支持度和準確度,取σ=0.03保留支持度不小于最低支持度閥值的規(guī)則;對于有矛盾的規(guī)則,保留準確度較大的,同時將準確度較小,但支持度不小于支持度閥值σ的規(guī)則作為備用規(guī)則保存;若準確度相同,將這些規(guī)則都作為備用規(guī)則保存。由此獲得以下11條工藝規(guī)則,得到工藝規(guī)則集R,同時有2條準確度相同,支持度達到閥值,但是有矛盾的規(guī)則,構成備用規(guī)則集RS。
表6 規(guī)則集
采用該企業(yè)某新缸體的10個一階孔作為加工案例對原有規(guī)則集進行更新,表7為新增孔案例,表8為新增孔的工藝決策表。
表7 新增孔案例
條件屬性子集B={C1,C3,C4,C5},根據(jù)定義9的描述,對于,即約f(x,a)≠f(y,a),f(D,a)≠f(y,D)即約簡屬性可以區(qū)分新案例,獲得的新案例規(guī)則集RN如表9所示。
規(guī)則o)、q)、r)屬于情況A,新增規(guī)則未與原始規(guī)則沖突,且原始規(guī)則集包含新規(guī)則,規(guī)則集R不變,修改支持度和準確度;規(guī)則n)屬于情況B,新增規(guī)則未與原始規(guī)則沖突,且原始規(guī)則集不包含新規(guī)則,將n)直接添加到規(guī)則集;規(guī)則p)屬于情況C,新增規(guī)則未與原始規(guī)則沖突,但是符合備用規(guī)則集中規(guī)則m),使其準確度和支持度分別增大至0.67和0.10,將規(guī)則m)添加到規(guī)則集。更新后的加工工藝規(guī)則集如表10所示。更新后,規(guī)則更加細化,新增的規(guī)則可以覆蓋更多的工藝案例,提高了規(guī)則集的精度。
表8 新增工藝決策表
表9 新增加規(guī)則集
表10 新規(guī)則集
Machining Line Planner(MLP)是Siemens公司開發(fā)的發(fā)動機缸體、缸蓋工藝規(guī)劃軟件,可以通過接口對其規(guī)則庫進行提取和更新,滿足企業(yè)的實際生產需求。
首先將更新后的規(guī)則分別添加到MLP規(guī)則庫中,如圖3所示。利用提取的工藝規(guī)則,計算不同屬性孔特征的加工路線,得到的實驗結果如表11所示。例如,34號孔的孔徑為10mm,深徑比為1.1,加工精度為U8,粗糙度為Ra1.6,其工藝屬性對應工藝規(guī)則“a)IF(C1,1)∧(C3,1)∧(C4,2)∧(C5,4)∧THEN D=2”,輸出加工路線為鉆-擴-鉸,與實際加工情況一致。
圖3 規(guī)則庫
表11 實例驗證結果
采用變精度粗糙集理論對缸體加工工藝規(guī)則進行提取和更新,克服了傳統(tǒng)工藝設計單純依靠經驗知識的局限性。通過將現(xiàn)有7個工藝屬性的缸體加工工藝信息進行分析和簡化,提取了隱藏在工藝信息里的加工規(guī)則,以直觀的方式描述出來,提高了工藝規(guī)則提取的效率和規(guī)則的準確性,為箱體類零件的加工工藝設計提供借鑒。
[1]秦寶榮.智能CAPP系統(tǒng)的關鍵技術研究[D].南京:南京航空航天大學,2003.
[2]Fan Y,Bill Tseng T,Chern C,et al. Rule Induction Based on an Incremental Rough Set[J].Expert Systems with Applications,2009,36(9):11439-11450.
[3]Pawlak Z,Skowron A. Rudiments of Rough Sets[J].Information Sciences,2007,177(1):3-27.
[4]黃文濤,趙學增,王偉杰,等.基于粗糙集理論的故障診斷決策規(guī)則提取方法[J].中國電機工程學報,2003,(11):154-158.
[5]王忠浩,邵新宇,張國軍,等.基于擴展粗糙集的工藝偏好知識發(fā)現(xiàn)[J].機械工程學報,2005,(7):84-89.
[6]薄洪光,劉曉冰,馬躍,等.基于粗糙集的鋼鐵行業(yè)工藝知識發(fā)現(xiàn)方法[J].計算機集成制造系統(tǒng),2009,(1):135-141.
[7]吉祥,顧新建,代風,等.基于本體和粗糙集的產品設計知識推送技術[J].計算機集成制造系統(tǒng),2013,(1):7-20.
[8]蔣亞軍,婁臻亮,李明輝.基于模糊粗糙集理論的模具數(shù)控切削參數(shù)優(yōu)化[J].上海交通大學學報,2005,(7):1115-1118.
[9]Guo S,Wang Z Y, Wu Z C, et al. A Novel Dynamic Incremental Rules Extraction Algorithm Based on Rough Set Theory[C]. International Conference on Machine Learning and Cybernetics. 2005,(3):1902-1907.
[10]王金濤,謝友柏.油液故障診斷系統(tǒng)知識發(fā)現(xiàn)的包含度方法[J].機械工程學報,2003,(9):58-61.
[11]Ziarko W. Variable Precision Rough Set Model[J].Journal of Computer & System Sciences,1993,46(1):39-59.
[12]黎文航.基于變精度粗糙集理論的焊接動態(tài)過程知識建模方法研究[D].上海:上海交通大學,2007.
[13]陳昊,楊俊安,莊鎮(zhèn)泉.變精度粗糙集的屬性核和最小屬性約簡算法[J].計算機學報,2012,(5):1011-1017.
[14]李遠遠,云俊.基于粗糙集的指標體系優(yōu)化及評價方法研究[J].浙江大學學報(理學版),2010,(4):411-415.
[15]米據(jù)生,吳偉志,張文修.基于變精度粗糙集理論的知識約簡方法[J].系統(tǒng)工程理論與實踐,2004,(1):76-82.