◆何子琳 趙忠堯 姜 波
(1.中國移動通信集團北京有限公司 北京 100007;2.北京飲冰科技有限公司 北京 100087)
企業(yè)網(wǎng)信息分類模型與物聯(lián)網(wǎng)實踐研究
◆何子琳1趙忠堯2姜 波2
(1.中國移動通信集團北京有限公司 北京 100007;2.北京飲冰科技有限公司 北京 100087)
本文介紹了一種適用于企業(yè)內(nèi)網(wǎng)系統(tǒng)的信息分類模型,充分考慮到企業(yè)內(nèi)網(wǎng)與目前傳統(tǒng)互聯(lián)網(wǎng)在信息分類方面的差別,從信息管理者、信息發(fā)送者、信息接收者三個信息用戶角色出發(fā),分析討論了信息分類準則的選擇依據(jù),在此基礎(chǔ)上提出了用戶感知且易于動態(tài)擴展的信息分類模型。通過結(jié)合某家企業(yè)內(nèi)網(wǎng)IT架構(gòu)現(xiàn)狀,舉例說明了用戶感知可擴展的二層信息分類模型的分類方法并在最后給出了一種基于SOA消息總線架構(gòu)的模型實踐可行方案。該分類模型能夠滿足不同的用戶需求,具有很好的動態(tài)性能。
企業(yè)內(nèi)網(wǎng);信息分類模型;用戶感知;動態(tài)擴展
隨著企業(yè)人員規(guī)模、業(yè)務(wù)需求的不斷增長,企業(yè)內(nèi)部需要通過大量各種類型的業(yè)務(wù)系統(tǒng)對復(fù)雜的業(yè)務(wù)流程進行支撐。以某企業(yè)為例,企業(yè)內(nèi)部 IT架構(gòu)經(jīng)過多年的建設(shè)已經(jīng)形成了數(shù)十個系統(tǒng)的規(guī)模,涵蓋門戶應(yīng)用、ERP、OA、業(yè)務(wù)支撐系統(tǒng)、經(jīng)營分析系統(tǒng)等,各系統(tǒng)之間協(xié)同工作,支撐公司內(nèi)部管理、外部運營等各項業(yè)務(wù)。
然而,如此眾多的業(yè)務(wù)系統(tǒng)會產(chǎn)生大量的信息,如待辦、通知、提醒、告警等信息,企業(yè)員工需要花精力對這些信息進行篩選,這不僅浪費了員工的時間,降低工作效率,同時某些員工真正迫切需要的信息往往被淹沒,那么如何能夠通過一種合理的信息分類機制與方法,從如此眾多的信息中提取出企業(yè)用戶真正感興趣、關(guān)心的信息,從而進一步提高工作效率,將是本文的研究重點。通過上述描述可以看出,信息分類對于企業(yè)內(nèi)網(wǎng)信息化管理尤其重要,與此同時,信息的分類又要滿足用戶對于信息的快速檢索與獲取,因此需要找到一種合理的企業(yè)IT系統(tǒng)信息分類標(biāo)準,以滿足企業(yè)管理要求。
分類是指人們把事物劃分成不同的類別,并且確定這些類別之間的包含與互斥關(guān)系。信息分類的方法有很多種,目前,信息分類的研究更多的是集中在互聯(lián)網(wǎng)網(wǎng)站信息分類中,通過網(wǎng)站信息科學(xué)合理的分類,能夠很好地方便用戶檢索到其需要的信息,大大增強了網(wǎng)站的用戶體驗感。文獻[1]給出了網(wǎng)絡(luò)信息分類的綜述,提出了網(wǎng)絡(luò)信息分類的意義與挑戰(zhàn),文獻[2]中系統(tǒng)分析了網(wǎng)絡(luò)信息分類的體系結(jié)構(gòu),從信息體系結(jié)構(gòu),文本分類,信息檢索,web工程,網(wǎng)站設(shè)計五個方面介紹了網(wǎng)絡(luò)信息分類體系結(jié)構(gòu)。文獻[3-6]分別給出了網(wǎng)絡(luò)信息分類的方法與模型。文獻[7]中,作者給出了企業(yè)內(nèi)部信息分類體系的基本框架及其系統(tǒng)的實現(xiàn)框架,其分類體系結(jié)構(gòu)僅僅簡單地定義了相關(guān)信息分類,且其靜態(tài)分類方法并不適用于目前中國企業(yè)內(nèi)部更新速度如此之快的業(yè)務(wù)模式,因此并不具有很強的參考意義。
從上述文獻成果可以看出,傳統(tǒng)的網(wǎng)絡(luò)信息分類方法固然能夠滿足其要求,但是企業(yè)信息內(nèi)網(wǎng)與傳統(tǒng)網(wǎng)絡(luò)有著本質(zhì)的不同,其最大的不同就在于企業(yè)內(nèi)網(wǎng)系統(tǒng)數(shù)據(jù)信息業(yè)務(wù)類別更新速度快以及受眾類型的不一致。例如,企業(yè)內(nèi)網(wǎng)不會像一個新聞網(wǎng)站一樣,其受眾均是新聞閱讀者,或者像一個圖書館信息系統(tǒng),其受眾是圖書閱覽者,企業(yè)內(nèi)網(wǎng)的信息受眾通常來自于各個部門,因此需要找出一種信息的分類方法,滿足企業(yè)內(nèi)網(wǎng)信息的需求,這也正是本文的研究重點。
定義1 企業(yè)內(nèi)網(wǎng)信息:指面向系統(tǒng)用戶的信息,其必須是通過人類可理解的文字,數(shù)字與格式所組織成的信息,如字符串、表格、圖片、視頻、音頻等。
從企業(yè)內(nèi)網(wǎng)信息的使用者來看,其擁有以下三類用戶角色。
定義2 信息發(fā)起者:信息的發(fā)起者,此處可以包含系統(tǒng)本身與實際操作業(yè)務(wù)系統(tǒng)的使用者。
定義3信息接收者:信息的接收者,此處僅指實際接收業(yè)務(wù)系統(tǒng)信息的使用者。
定義4 信息管理者:對信息進行統(tǒng)一管理的用戶。
信息分類問題的研究目的有如下兩個方面:
. 使企業(yè)內(nèi)部的信息更加有序規(guī)整地存儲,便于統(tǒng)一管理;
. 使信息能夠更快,更準確地傳達給信息接收者,方便閱讀以及第一時間獲取到信息中有價值的信息。
那么,對于信息的類別劃分存在著不同維度,即存在著不同的分類標(biāo)準,如圖1所示。
圖1 同一信息的不同分類標(biāo)準
如圖1所示,從信息內(nèi)容上分,可以分為業(yè)務(wù)類信息、營銷類信息、技術(shù)類信息、管理類信息;從信息優(yōu)先級上分,可以分為特急信息、緊急信息、一般信息;從信息關(guān)注程度上劃分,可以分為最受關(guān)注信息、一般信息、不受關(guān)注信息;從信息發(fā)布的時間先后來分,可以分為近1周信息、近2周信息等等。
由此可以看出,從不同的角度可以得到不同的類別,并且不同的人從不同的角度去觀察同一個信息都會有自己的一種分類準則。本課題信息分類機制的研究定義如下:
定義5 信息分類問題:給定一組信息集合I = {I1, I2, … In},需要尋找一組可擴展的信息分類準則C={C1,C2,…,Cm},m為分類準則數(shù)量,并將其進行組合形成一種分類機制Λ,ΛC使其滿足上述兩個目的:
. 使企業(yè)內(nèi)網(wǎng)系統(tǒng)信息更加有序規(guī)整地存儲,便于統(tǒng)一管理;
. 使信息能夠更快,更準確的傳達給信息接收用戶,方便閱讀以及第一時間獲取到信息中有價值的信息。
這里不妨假設(shè)方便信息統(tǒng)一管理的評價指標(biāo)為α,信息傳達的準確性用評價指標(biāo)β表示,由此可以看出,信息分類問題最終可以歸結(jié)為一個多目標(biāo)(此處為2個)優(yōu)化問題,其數(shù)學(xué)表達式如公式(1)所示。
max α
max β
從公式(1)可以看出,該多目標(biāo)問題由于其限制條件的不確定性,因此對于不同企業(yè)而言,其內(nèi)網(wǎng)信息分類的通用數(shù)學(xué)模型如上,并且本文將提出一種求解上述模型的方法,并不給出某一個具體的優(yōu)化解。
對于尋找一組信息分類評判依據(jù),分類標(biāo)準的選擇受到很多因素的影響,絕大多數(shù)是通過人的主觀判斷去選擇的。然而,通過仔細分析我們可以看出,兩個目標(biāo):信息管理便利性α與信息傳達準確性β均與一個定量因素有關(guān),即是分類機制Λ中的評判準測的數(shù)量m,即
其中,∝為正比例符號,符號左邊正比例與公式右邊,公式(2)與(3)分別說明,信息管理的便攜性正比例與評判準則的數(shù)量,但是信息傳達的準確性卻反比于評判準則數(shù)量。圖2顯示了α,β與m三者之間數(shù)量關(guān)系,在三維空間中表示。從圖2可以看出,兩個目標(biāo)之間隨著 m的變化,其結(jié)果呈現(xiàn)出截然相反的變化趨勢,特別注意的是,α,β與m之間的比例關(guān)系可以是線性的也可以是非線性的(通常為非線性的)。
圖2 信息分類標(biāo)準數(shù)量與兩個目標(biāo)的關(guān)系
上述關(guān)系是不難解釋的。首先考察坐標(biāo)系β-O-m,即分類準則數(shù)量與信息管理便利性之間的關(guān)系,信息分類評判準則數(shù)量m越多,對于一個信息的描述的完整性越好,越充分,越容易定位該信息,因此對于用戶而言,用戶能夠感知到該信息的概率也越大;其次考察坐標(biāo)系α-O-m,即分類準則數(shù)量與信息管理便利性之間的關(guān)系,評判準則數(shù)量 m越多,對于信息的統(tǒng)一管理便利性則越差,因為不論是采用何種數(shù)據(jù)結(jié)構(gòu),如樹狀、圖狀,不同的分類維度會提高信息分類的維護成本,尤其是針對企業(yè)內(nèi)網(wǎng)的業(yè)務(wù)系統(tǒng)所產(chǎn)生的信息,因為企業(yè)(尤其是當(dāng)今中國企業(yè))的業(yè)務(wù)發(fā)展與變化非常之快。
針對上述分析,一種較為原始的想法是尋找到α,β與m三者間的一個最佳契合點,即在三維空間α-β-m中尋找一個最佳點S’= (α’, β’, m’),該 S’中的分類評判準則數(shù)量 m’既能夠滿足管理的便利性α’,同時又能對一個信息進行較為完整的描述β’。當(dāng)然,針對不同企業(yè)內(nèi)部的不同情況,即公式(1)中的約束條件,總能夠找到這個相對于某一個具體企業(yè)的最優(yōu)點S’,只是求解這個最優(yōu)點的方法有所不同(不同企業(yè)的管理者的主觀判斷不同),但是不管如何,這個點通過某些方法是能夠找到的,只是尋找S’的方法不盡相同,我們無法找到一個通用普適的方法,因此尋找最優(yōu)值的方法不在本文討論范圍之內(nèi),這里特此說明。
上述我們已經(jīng)討論了公式(1)中兩個目標(biāo)α,β與一元變量-Λ中的評判準測的數(shù)量m之間的關(guān)系,并且討論了最佳契合點即是需要我們?nèi)ふ业狞c。但是,上述的最佳契合點并不完全滿足定義5,其違背了分類評判標(biāo)注可擴展的原則,即若能尋找到該契合點,則Λ中的m是不會改變的,這意味著整套信息分類機制中,信息的分類是靜態(tài)的,而不是動態(tài)的,這對于現(xiàn)代化企業(yè)而言,是不切合實際的,沒有解決信息管理便利性與信息傳輸準確性之間的矛盾。
解決上述問題的方法是將α,β與m三者間的關(guān)系從不同的信息用戶視角分解。通過分析可知,信息管理便利性α與信息傳達準確性β兩者分別是從兩個不同的角度去觀察同一個問題。信息管理便利性α是從系統(tǒng)的角度去看信息分類問題,而信息傳達準確性β則是從用戶的角度去看信息分類問題,如圖3所示。
圖3 基于不同信息用戶角色的分類準則
從圖3中可以看出,三個不同類型的線段分別表示不同的分類準則集合 Λs,Λm,Λr,對于信息管理者而言,其所關(guān)心的僅僅是按照信息的客觀屬性這一個分類準則 Λm(如信息是是屬于多媒體信息或者文本的等),如系統(tǒng)監(jiān)控類、新聞資訊類、平臺支撐類等;而對于信息用戶而言(發(fā)起或接收者),其所關(guān)心的除了按照信息客觀屬性分類以外,還需要有自己的差異化分類準則,即Λs+Λm,從而更好地對某條信息進行描述與精確定位,如信息發(fā)起用戶,其關(guān)心發(fā)起信息的目標(biāo)受眾是誰,因此對于該類用戶而言,可以按照目標(biāo)群體的類別對信息進行劃分;而信息接收用戶,其并不關(guān)心這個信息是發(fā)給他自己或是發(fā)給其它人的,而關(guān)心的是該信息對其本身是否有價值,其分類準則是根據(jù)其興趣進行劃分的,即Λr+Λm。
通過上述分析可得,企業(yè)內(nèi)網(wǎng)信息分類需從不同用戶的角度對分類準則進行描述,這樣對于信息管理者而言,由于按照信息的客觀屬性準則進行信息分類,分類數(shù)量 m相對較為穩(wěn)定,利于管理,而對于用戶而言,分類標(biāo)準可擴展并且可配置,增加了其靈活可擴展性。
根據(jù)3.1節(jié)中的分析,企業(yè)內(nèi)網(wǎng)信息分類機制應(yīng)采用完全分離的兩層,分別為信息管理分類層與信息用戶分類層。對于信息管理分類層,其信息分類準則不僅對于信息管理者有意義,對于信息用戶同樣也有意義;對于信息用戶分類層,其僅對用戶有意義,而對于信息系統(tǒng)的管理者,其無需關(guān)心[8,9]。分類機制總體模型如圖4所示。
圖4 兩層信息分類模型
從圖4說明如下,信息分類機制模型分為兩個層次,第一層為信息客觀屬性分類標(biāo)準C,直接根據(jù)這個標(biāo)準,將信息進行類別劃分,得到類別1,2,……,其分類不僅被信息的管理者關(guān)注,同時被信息用戶關(guān)注;第二層為可擴展的信息分類標(biāo)準平臺,其上維護著信息收/發(fā)用戶自己感興趣的信息分類標(biāo)準C1,C2,… …,根據(jù)不同的分類標(biāo)準,會得到不同的信息分類,如類1.1,1.2……。信息管理者盡管對第一層的信息分類感興趣,但是其需要對整個信息分類機制的分類策略進行管理。
由于第一層與第二層間的具有聯(lián)系,如對于信息收/發(fā)用戶而言,其既關(guān)注第一層也關(guān)注第二層,因此需要在第一層與第二層之間建立組合關(guān)系將這兩層分類進行組合配置。根據(jù)圖3中的分類準則定義,圖4的2層分類模型可以用圖5進行簡化。
這種分類機制模型是滿足定義5中的兩個目標(biāo)的。首先,采用層類別評判標(biāo)準的管理是從不同用戶的角度出發(fā)的,能夠從不同層面為不同用戶提供分類服務(wù),尤其是對于信息本身的管理而言,其僅需要關(guān)心根據(jù)信息客觀屬性的分類標(biāo)準進行分類后的信息類別,不論是在類別查找、刪除、修改,還是根據(jù)類別對信息進行歸檔,都十分便捷,尤其是信息歸檔處理,其分類標(biāo)準是一維的,因此管理起來尤其方便。
圖5 兩層信息分類模型樹狀表示
其次,通過提供第二層的可擴展的信息分類標(biāo)準平臺,其能夠根據(jù)不同用戶的需要,進行分類評判標(biāo)準的擴展與動態(tài)管理,這增強了一個信息的描述完整性。
最后,將兩層進行獨立開,并通過在兩層間的組合關(guān)系的配置,增強了各種信息類別標(biāo)準與信息客觀屬性間類別的配置靈活性,是一種松耦合的設(shè)計,不論是從維護還是從二次擴充開發(fā)的角度,都具有一定的優(yōu)勢。
基于3.2節(jié)中提出的分類機制模型并結(jié)合某家企業(yè)內(nèi)網(wǎng)IT系統(tǒng)信息,給出如下參考分類準測并舉例。
分類準則m:根據(jù)信息客觀屬性進行分類。
目前該企業(yè)IT系統(tǒng)信息可以分為以下九類,如表1所示。
表1 分類準則m的分類結(jié)果
m.02 自媒體發(fā)布類m.03 系統(tǒng)變更類m.04 業(yè)務(wù)數(shù)據(jù)類m.05 待辦類m.06 通知類m.07 新聞資訊類m.08 生活資訊類m.09 其它
類別編碼中,第一位 m表示其為信息管理類別編碼,最后兩位表示其順序編號,編號采用2位十進制數(shù)表示,為了便于管理,建議該層分類數(shù)最多不超過2位數(shù)。
第二層根據(jù)信息用戶的角度去進行分類準則制定。
分類準則s.01:根據(jù)信息接收用戶范圍分類。
表2 分類準則s.01的分類結(jié)果
用戶信息分類編碼不同于信息管理分類編碼,其采用三段式編碼,即首位s表示其為信息發(fā)送用戶的信息分類(接收用戶為r),中間一位表示分類準則編號,每個分類準則后面為兩位分類編號。
分類準則r.01:根據(jù)信息的發(fā)布時間分類。
盜用別人思想、算法或結(jié)論。學(xué)術(shù)論文講究創(chuàng)新和研究結(jié)論,如果沒有研究成果或創(chuàng)新性的東西,該論文是沒有發(fā)表意義的。經(jīng)常有作者在沒有研究成果的情況下,為了發(fā)表論文,盜用別人的思想或算法或結(jié)論,占為己有,在參考文獻中刻意地回避引用參考文獻,特別是英文參考文獻。
表3 分類準則r.01的分類結(jié)果
分類準則r.02:根據(jù)信息的關(guān)注度分類。
表4 分類準則r.02的分類結(jié)果
根據(jù)用戶感知的兩層信息分類機制模型,信息分類機制的技術(shù)解決方案應(yīng)用框架設(shè)計如下圖6所示。
圖6 原型設(shè)計
從圖6可以看出,信息分類管理中心解決方案應(yīng)包含三個模塊:
. 分類策略配置中心模塊:用于存儲信息分類策略與配置;
. 分類配置管理子系統(tǒng):用于信息共享中心,是管理員配置信息分類策略與配置的入口;
. 與業(yè)務(wù)系統(tǒng)信息集成的消息總線:用戶統(tǒng)一傳輸各個業(yè)務(wù)系統(tǒng)間的消息。
方案向集成于SOA信息總線上的業(yè)務(wù)系統(tǒng)提供兩個服務(wù)接口。這里我們將第一層(信息管理層)按照信息客觀屬性準則分類的模塊稱為信息分類器,其目的在于對信息進行分類,便于信息管理者對信息進行存儲管理;將第二層(信息用戶層)的各個分類準則叫做信息過濾器,其作用是為信息用戶的信息打上分類標(biāo)簽。因此兩個服務(wù)組件接口分別為:分類器服務(wù)組件接口;過濾器服務(wù)組件接口。通過這兩個服務(wù)組件,一條消息對應(yīng)著一個信息管理層的分類,但是可以對應(yīng)著多個信息用戶層的分類。
不論是各個業(yè)務(wù)系統(tǒng)中的信息發(fā)送模塊還是信息接收模塊均需要調(diào)用分類器服務(wù)組件接口,而對于過濾器服務(wù)組件,根據(jù)其業(yè)務(wù)系統(tǒng)的特點以及接收與發(fā)送方的特點,用戶可以自行選擇與分類器想配套的過濾器進行組合。與此同時,信息過濾器組件還提供用戶可配置分類準則與分類接口,供用戶自行配置。
本文從對信息分類問題進行了系統(tǒng)化的定義,明確系統(tǒng)信息的研究范圍,給出信息分類機制的現(xiàn)狀調(diào)研與用戶感知可擴展的信息分類機制研究。在調(diào)研相關(guān)研究現(xiàn)狀的基礎(chǔ)上,提出了一種用戶感知可擴展的信息分類機制,從不同用戶角度考慮,將信息分類機制分為兩層分類模型進行分析,分別從信息管理、信息用戶兩個方面抽象出信息分類器與信息過濾器,通過兩者間的靈活配置與組合,能夠同時滿足信息管理者、信息發(fā)送者、信息接收者三個不同角色的需要。
最后,結(jié)合信息分類機制理論以及SOA的軟件構(gòu)建思想,給出了一種可行的分類機制解決方案。本文下一步的研究工作將具體深入研究消息過濾器與消息分類器間的過濾算法以及如何提高消息分類準確率,并且建立一套合理的信息分類評價體系。
[1]Mai JE. Classification of the Web: challenges and inqu iries[J].Knowledge Organization,2004.
[2]吳勝.網(wǎng)站信息分類體系優(yōu)化及應(yīng)用[D].南京林業(yè)大學(xué),2009.
[3]崔艷華.網(wǎng)絡(luò)信息分類體系的研究[J].圖書館學(xué)刊,2006.
[4]陳樹年.網(wǎng)絡(luò)信息的自動分類問題[J].圖書館雜志,2001.
[5]程曉林.網(wǎng)站分類法的比較研究[J].晉圖學(xué)刊,2006.
[6]陳樹年.網(wǎng)絡(luò)信息分類法研究[J].現(xiàn)代圖書情報技術(shù),2002.
[7]黃錦德.企業(yè)信息化建設(shè)中的信息分類及編碼規(guī)劃[C].全國冶金自動化信息網(wǎng),2012.
[8]何偉明.計算機網(wǎng)絡(luò)技術(shù)安全與網(wǎng)絡(luò)防御策略研討[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017.
[9]張亞輝.計算機網(wǎng)絡(luò)存在的安全漏洞及應(yīng)急響應(yīng)技術(shù)研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2016.
北京市科技計劃專項課題計劃(Z17010101514)資助。