路文海 劉書(shū)明 楊 翼
(國(guó)家海洋信息中心,天津 300171)
海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)是我國(guó)海洋信息化的重要內(nèi)容,對(duì)推動(dòng)我國(guó)海洋事業(yè)發(fā)展和生態(tài)文明建設(shè)具有重要作用。近年來(lái),隨著我國(guó)海洋生態(tài)環(huán)境監(jiān)測(cè)體系的基本建成,每年執(zhí)行環(huán)境狀況、環(huán)境風(fēng)險(xiǎn)、環(huán)境監(jiān)管、公益服務(wù)等四大類二十多項(xiàng)監(jiān)測(cè)與評(píng)價(jià)任務(wù),獲取和積累了海量海洋生態(tài)環(huán)境保護(hù)信息,對(duì)我國(guó)海洋環(huán)境保護(hù)管理的輔助決策和科學(xué)研究等工作發(fā)揮了重要支撐作用。但是,因?yàn)楹Q笊鷳B(tài)環(huán)境保護(hù)信息具有多來(lái)源、多層次、多時(shí)態(tài)、多格式和多學(xué)科的基本特點(diǎn),隨著信息量幾何級(jí)地增長(zhǎng),僅憑現(xiàn)有的人工模式進(jìn)行管理勢(shì)必難以為繼。因此,只有通過(guò)深入推進(jìn)海洋生態(tài)環(huán)境保護(hù)信息化建設(shè),實(shí)現(xiàn)海洋生態(tài)環(huán)境保護(hù)信息采集、傳輸和管理的數(shù)字化、智能化、網(wǎng)絡(luò)化,才能從大量繁雜的生態(tài)環(huán)境信息中發(fā)現(xiàn)趨勢(shì)、把握重點(diǎn),使生態(tài)環(huán)境保護(hù)各項(xiàng)工作體現(xiàn)時(shí)代性、把握規(guī)律性、賦予創(chuàng)造性,推動(dòng)各類海洋環(huán)境問(wèn)題的有效解決。對(duì)海洋生態(tài)環(huán)境保護(hù)信息進(jìn)行分類與編碼是實(shí)現(xiàn)信息存儲(chǔ)、交換、集成與共享的關(guān)鍵步驟,是海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)的基礎(chǔ)性工作,制定我國(guó)海洋生態(tài)環(huán)境保護(hù)信息分類與編碼標(biāo)準(zhǔn)體系已十分緊迫。
海洋生態(tài)環(huán)境保護(hù)信息分類與編碼不僅項(xiàng)具有基礎(chǔ)性、綜合性、復(fù)雜性的特征,還具有很強(qiáng)的科學(xué)性,需要正確的理論與方法指導(dǎo)。當(dāng)前,從國(guó)家到地方,從政府到企業(yè)都在開(kāi)展信息分類和編碼的研究和制訂工作[1-7],為海洋生態(tài)環(huán)境保護(hù)信息分類與編碼積累了有許多值得借鑒的經(jīng)驗(yàn)。本文從海洋生態(tài)環(huán)境保護(hù)信息的基本特征和管理、應(yīng)用的需求出發(fā),結(jié)合其他領(lǐng)域信息分類編碼的研究成果,提出了我國(guó)海洋生態(tài)環(huán)境保護(hù)信息分類與編碼的原則、方法,確定了我國(guó)海洋生態(tài)環(huán)境保護(hù)信息五級(jí)類目的分類體系,并對(duì)其編寫(xiě)了代碼。
信息分類就是把大的信息集合劃分成小的信息集合,是根據(jù)事物的特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立起一定的分類系統(tǒng)和排列順序,以便管理和使用。劃分的結(jié)果稱為分類項(xiàng),或稱類目[8-9]。編碼是在信息分類的基礎(chǔ)上,用一種易于被計(jì)算機(jī)和人識(shí)別的符號(hào)體系給分類結(jié)果賦予代碼的過(guò)程。分類是人類認(rèn)識(shí)世界的工具,它把客觀對(duì)象按照一定的概念組織起來(lái),成為一個(gè)有條理的、便于理解的系統(tǒng),編碼所用的標(biāo)識(shí)系統(tǒng)要能準(zhǔn)確反映分類系統(tǒng)的邏輯關(guān)系。
信息分類的基本方法有線分類法和面分類法。線分類法也稱為層級(jí)分類法,這種方法將編碼對(duì)象按選定的屬性或規(guī)則(作為分類的劃分基礎(chǔ))逐次地分成若干層次類別,并排成一個(gè)有層次、逐級(jí)展開(kāi)的分類體系[10]。在這個(gè)體系中,同位類類目之間存在并列關(guān)系,下位類與上位類類目之間存在隸屬關(guān)系。同位類類目不重復(fù)、不交叉。面分類法是將編碼對(duì)象的若干屬性或特征視為若干個(gè)“面”,每個(gè)面中又可分成許多彼此獨(dú)立的若干類目。使用時(shí),可根據(jù)需要將這些“面”的類目組合在一起,形成一個(gè)復(fù)合類目。各面之間是平行的,沒(méi)有隸屬關(guān)系。不同面內(nèi)的類目沒(méi)有交叉和重復(fù)。面的位置有嚴(yán)格的固定位置,具體位置根據(jù)實(shí)際需要確定。實(shí)踐證明線分類法和面分類法各有優(yōu)、缺點(diǎn)。線分類法雖簡(jiǎn)單實(shí)用,但由于其要求類目間有嚴(yán)格的上下級(jí)隸屬關(guān)系,不利于在復(fù)雜系統(tǒng)中應(yīng)用。面分類法雖然可以處理復(fù)雜對(duì)象,但對(duì)復(fù)雜對(duì)象中某一具體方面的層次關(guān)系反映不夠。
由于要表達(dá)事物的復(fù)雜程度不同,信息編碼時(shí)一般不采用單一的代碼符號(hào)來(lái)標(biāo)識(shí)信息,而往往用一組符號(hào)來(lái)表示,就形成了代碼符號(hào)與符號(hào)之間的關(guān)系,符號(hào)間的關(guān)系就是編碼系統(tǒng)的結(jié)構(gòu)。根據(jù)編碼目的的要求,一般將編碼結(jié)構(gòu)分為幾個(gè)碼段,包括分類標(biāo)識(shí)碼和特征碼,分類標(biāo)識(shí)碼又可以分為分類碼和標(biāo)識(shí)碼,特征碼也可以按特征進(jìn)一步分段,如圖1 所示。每一信息的編碼根據(jù)需要可以保持完整的結(jié)構(gòu),也可以按需要保留部分結(jié)構(gòu)。
圖1 編碼系統(tǒng)總體結(jié)構(gòu)
編碼結(jié)構(gòu)主要有5 種[11]。①鏈?zhǔn)浇Y(jié)構(gòu):其代碼之間是并列關(guān)系,每一碼位的代碼有其固定不變的含義,與前后碼位無(wú)關(guān)。②樹(shù)式結(jié)構(gòu):編碼后雖然也按順序線性排列,但是它的每一個(gè)代碼與上位代碼是隸屬關(guān)系,在一組代碼中相同的碼位與碼值由于上一碼位碼值的不同就會(huì)有不同的含義,整個(gè)編碼系統(tǒng)構(gòu)成一種樹(shù)狀結(jié)構(gòu)。③矩陣結(jié)構(gòu):代碼之間存在有矩陣關(guān)系,在一組代碼中幾個(gè)碼位按矩陣聯(lián)用。④混合結(jié)構(gòu):由于在應(yīng)用中各種結(jié)構(gòu)均有各自的優(yōu)缺點(diǎn),所以一個(gè)實(shí)用的編碼系統(tǒng)可以根據(jù)需要靈活地采用各種結(jié)構(gòu)。⑤柔性編碼結(jié)構(gòu):整個(gè)編碼系統(tǒng)無(wú)固定的碼位,描述的事物復(fù)雜,碼位就多,反之則少。
3.2.1 分類原則
①科學(xué)性原則:按照海洋生態(tài)環(huán)境保護(hù)信息最穩(wěn)定的屬性及其中存在的邏輯關(guān)聯(lián)作為信息分類的依據(jù),并考慮信息的特征與發(fā)展。②實(shí)用性原則:海洋生態(tài)環(huán)境保護(hù)信息隨著海洋科學(xué)和信息技術(shù)的發(fā)展不斷變化和更新,因此,在進(jìn)行分類時(shí),類目設(shè)置要全面、實(shí)用,受關(guān)注的、重要的海洋生態(tài)環(huán)境信息作為一級(jí)、二級(jí)類目列出,突出重點(diǎn)、檢索方便。③穩(wěn)定性原則:分類時(shí),結(jié)合我國(guó)多年來(lái)海洋生態(tài)環(huán)境保護(hù)信息工作積累的成果,并考慮一些部門(mén)正在采用的分類與編碼。④可擴(kuò)展性原則:在類目的擴(kuò)展上預(yù)留空間,保證分類體系有一定彈性,可在本分類體系上進(jìn)行延拓細(xì)化。在保持分類體系的前提下,允許在最后一級(jí)分類下制定適用的分類細(xì)則。⑤兼容性原則:與國(guó)內(nèi)已有的相關(guān)信息分類標(biāo)準(zhǔn)相協(xié)調(diào),保持繼承性和實(shí)際實(shí)用的延續(xù)性,同時(shí)也與相關(guān)國(guó)際標(biāo)準(zhǔn)相符。⑥針對(duì)性原則:為了方便查找,對(duì)一些重要和適用頻率較高的類目單獨(dú)列出,有針對(duì)性地進(jìn)行分類。⑦業(yè)務(wù)服務(wù)于管理原則:以海洋生態(tài)環(huán)境保護(hù)管理和海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)需求為導(dǎo)向,業(yè)務(wù)信息中能滿足管理決策需求的類目單獨(dú)列出,突出業(yè)務(wù)信息的應(yīng)用性。
3.2.2 基本類型框架
海洋生態(tài)環(huán)境保護(hù)信息可以按數(shù)據(jù)來(lái)源、使用目的、數(shù)據(jù)特征等多種方式分類。考慮到目前輔助管理決策、信息系統(tǒng)運(yùn)行和科研支撐的實(shí)際需要,結(jié)合海洋生態(tài)環(huán)境保護(hù)信息種類繁雜、綜合性強(qiáng)等特點(diǎn),采用面分類法與線分類法相結(jié)合的方法對(duì)海洋生態(tài)環(huán)境保護(hù)信息進(jìn)行分類較為適宜,對(duì)屬性層次分明、隸屬關(guān)系明確的信息使用線分類法,否則重點(diǎn)考慮采用面分類法。
綜合考慮上述因素,將海洋生態(tài)環(huán)境保護(hù)信息,按照數(shù)據(jù)獲取方式和在信息系統(tǒng)中應(yīng)用對(duì)象的不同,分成海洋生態(tài)環(huán)境監(jiān)測(cè)與調(diào)查、海洋生態(tài)環(huán)境保護(hù)管理和海洋生態(tài)環(huán)境保護(hù)輔助信息3 個(gè)一級(jí)類目。海洋生態(tài)環(huán)境監(jiān)測(cè)與調(diào)查按照數(shù)據(jù)在海洋生態(tài)環(huán)境保護(hù)活動(dòng)中產(chǎn)生的階段,又分成3 個(gè)二級(jí)類目,海洋生態(tài)環(huán)境保護(hù)管理則根據(jù)行政管理的業(yè)務(wù)劃分了14 個(gè)二級(jí)類目,海洋生態(tài)環(huán)境保護(hù)輔助信息按照數(shù)據(jù)來(lái)源和應(yīng)用層次的不同分成了6 個(gè)二級(jí)類目。這樣就形成了表1 所示的海洋生態(tài)環(huán)境保護(hù)信息基本類型框架。
3.2.3 類型細(xì)分
列出海洋生態(tài)環(huán)境保護(hù)信息基本類型框架后,須在此框架下進(jìn)行信息實(shí)體類型以及實(shí)體屬性的細(xì)化分類,不僅為信息系統(tǒng)的數(shù)據(jù)庫(kù)建設(shè)奠定基礎(chǔ),而且使得數(shù)據(jù)存儲(chǔ)、管理更加明確。在細(xì)化分類層面上,本文進(jìn)一步根據(jù)信息產(chǎn)生的階段、數(shù)據(jù)類型、應(yīng)用對(duì)象等特征將海洋生態(tài)環(huán)境保護(hù)信息分到五級(jí)類目。其中,四級(jí)類目代表具體的信息實(shí)體,對(duì)應(yīng)信息系統(tǒng)數(shù)據(jù)庫(kù)中的表、文檔和圖片等,例如海水水質(zhì)監(jiān)測(cè)表。五級(jí)類目為信息實(shí)體的屬性,表現(xiàn)在數(shù)據(jù)庫(kù)中就是數(shù)據(jù)表的字段,例如海水水質(zhì)監(jiān)測(cè)站位位置、監(jiān)測(cè)時(shí)期等。三級(jí)類目多數(shù)情況是四級(jí)類目的歸納概括。因篇幅所限,本文只列出了表2所示的海洋生態(tài)環(huán)境保護(hù)信息類型細(xì)劃分的一個(gè)實(shí)例。
類型細(xì)分的結(jié)果和基本類型框架一起構(gòu)成海洋生態(tài)環(huán)境保護(hù)信息的五級(jí)分類體系。
表1 海洋生態(tài)環(huán)境保護(hù)信息基本類型框架
表2 海洋生態(tài)環(huán)境保護(hù)信息類型細(xì)劃分實(shí)例
3.3.1 編碼原則①唯一性:在一個(gè)分類體系中,每一個(gè)海洋生態(tài)環(huán)境保護(hù)信息類目?jī)H有一個(gè)代碼,一個(gè)代碼僅表示一個(gè)海洋生態(tài)環(huán)境保護(hù)信息類目,也就是說(shuō)代碼數(shù)值必須與指定的信息類目一一對(duì)應(yīng)。②合理性:代碼結(jié)構(gòu)與分類體系相適應(yīng)。③可擴(kuò)展性:預(yù)留有適當(dāng)?shù)暮髠淇臻g,以適應(yīng)不斷擴(kuò)充的信息需要。④簡(jiǎn)明性:代碼結(jié)構(gòu)盡量簡(jiǎn)明,在保證提供一定信息的前提下,盡可能縮短代碼長(zhǎng)度,以節(jié)省計(jì)算機(jī)處理時(shí)間和存儲(chǔ)空間,降低代碼的出錯(cuò)率。⑤穩(wěn)定性:海洋生態(tài)環(huán)境保護(hù)信息類目的代碼一經(jīng)確定,未經(jīng)許可,任何單位和個(gè)人不得隨意改變,以保持編碼體系的完整性、嚴(yán)肅性和權(quán)威性。⑥無(wú)含義性:海洋生態(tài)保護(hù)環(huán)境信息分類代碼中的每一位數(shù)字不表示任何與海洋生態(tài)環(huán)境相關(guān)的特定信息。⑦規(guī)范性:代碼的類型、結(jié)構(gòu)以及編寫(xiě)格式統(tǒng)一。
3.3.2 類型編碼
對(duì)應(yīng)前節(jié)海洋生態(tài)環(huán)境保護(hù)信息的五級(jí)分類體系,編寫(xiě)代碼亦分為五級(jí),即一級(jí)類目、二級(jí)類目、三級(jí)類目、四級(jí)類目和五級(jí)類目,代碼結(jié)構(gòu)見(jiàn)圖2。類目代碼用阿拉伯?dāng)?shù)字表示,同級(jí)類采用線性的十進(jìn)制方法進(jìn)行排序,每層代碼均采用2 位阿拉伯?dāng)?shù)字,即01-99。一級(jí)類目代碼由第一層代碼組成,二級(jí)及以上類目代碼加本層代碼組成。可見(jiàn)海洋生態(tài)環(huán)境保護(hù)信息代碼結(jié)構(gòu)分為三段:大類碼、實(shí)體碼、信息特征碼,即代碼結(jié)構(gòu)為大類碼+實(shí)體碼+信息特征碼。前4 層在系統(tǒng)中唯一標(biāo)識(shí)信息實(shí)體(數(shù)據(jù)庫(kù)的表),最后一段是實(shí)體屬性特征,即實(shí)體屬性(字段)的枚舉。
3.3.3 擴(kuò)展編碼
圖2 代碼結(jié)構(gòu)圖
針對(duì)海洋生態(tài)環(huán)境保護(hù)信息多學(xué)科領(lǐng)域整合和共享要求,以及保證信息的安全,在信息類型劃分的基礎(chǔ)上還應(yīng)區(qū)分信息的數(shù)據(jù)類型、數(shù)據(jù)格式、所屬學(xué)科和安全級(jí)別等方面的特征,這些特征作為擴(kuò)展編碼,與類型碼共同使用。擴(kuò)展編碼與類型編碼相似,同樣用十進(jìn)制阿拉伯?dāng)?shù)字方法進(jìn)行排序,每類代碼采用1 或2 位阿拉伯?dāng)?shù)字。需要說(shuō)明的是擴(kuò)展碼主要針對(duì)第四級(jí)類目使用。
表3 擴(kuò)展編碼一覽
海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)是我國(guó)海洋信息化的重要內(nèi)容,對(duì)推動(dòng)我國(guó)海洋事業(yè)發(fā)展和生態(tài)文明建設(shè)具有重要作用。近年來(lái),隨著我國(guó)海洋生態(tài)環(huán)境監(jiān)測(cè)體系的基本建成,每年執(zhí)行環(huán)境狀況、環(huán)境風(fēng)險(xiǎn)、環(huán)境監(jiān)管、公益服務(wù)等四大類二十多項(xiàng)監(jiān)測(cè)與評(píng)價(jià)任務(wù),獲取和積累了海量海洋生態(tài)環(huán)境保護(hù)信息,對(duì)我國(guó)海洋環(huán)境保護(hù)管理的輔助決策和科學(xué)研究等工作發(fā)揮了重要支撐作用。但是,因?yàn)楹Q笊鷳B(tài)環(huán)境保護(hù)信息具有多來(lái)源、多層次、多時(shí)態(tài)、多格式和多學(xué)科的基本特點(diǎn),隨著信息量幾何級(jí)地增長(zhǎng),僅憑現(xiàn)有的人工模式進(jìn)行管理勢(shì)必難以為繼。
建立科學(xué)合理的海洋生態(tài)環(huán)境保護(hù)信息分類系統(tǒng)并編寫(xiě)代碼,是海洋生態(tài)環(huán)境保護(hù)信息化建設(shè)的關(guān)鍵步驟,也是對(duì)海洋生態(tài)環(huán)境進(jìn)行科學(xué)管理、保護(hù)和研究的重要基礎(chǔ)和前提,雖然目前我國(guó)已有學(xué)者開(kāi)展此方面的研究,但直到現(xiàn)在也沒(méi)有一個(gè)能為所有學(xué)者和管理者都認(rèn)同的分類原則和分類系統(tǒng)。本文討論的分類體系和編碼方法,從管理和信息化建設(shè)的角度出發(fā),考慮了海洋生態(tài)環(huán)境保護(hù)信息的基本情況、特點(diǎn)和實(shí)踐經(jīng)驗(yàn)。但由于海洋生態(tài)環(huán)境保護(hù)信息是具有多來(lái)源、多層次、多時(shí)態(tài)、多格式和多學(xué)科特點(diǎn)的海量數(shù)據(jù),對(duì)它的分類和編碼具有很強(qiáng)的理論性、邏輯性,同時(shí)又強(qiáng)調(diào)實(shí)用性,是一項(xiàng)復(fù)雜的系統(tǒng)工程。因此,本文給出的分類與編碼難免還存在一些不足與缺點(diǎn),例如對(duì)于四類級(jí)目中數(shù)據(jù)類型為非報(bào)表數(shù)據(jù)的信息,彼此間五級(jí)類目具有大量相同屬性信息,造成五級(jí)類目重名率較高。還有就是在海洋生態(tài)環(huán)境保護(hù)信息應(yīng)用層次上,管理部門(mén)和業(yè)務(wù)部門(mén)間存在明顯區(qū)別,如何同時(shí)滿足兩個(gè)應(yīng)用層次的需求,并實(shí)現(xiàn)在兩個(gè)層次間的信息共享和互通,也是一個(gè)需要進(jìn)一步研究的方面。在以后編制海洋生態(tài)環(huán)境保護(hù)信息分類編碼標(biāo)準(zhǔn)時(shí),應(yīng)盡快制定國(guó)家標(biāo)準(zhǔn),使海洋生態(tài)環(huán)境保護(hù)信息分類體系規(guī)范化,在規(guī)范化分類基礎(chǔ)上編制標(biāo)準(zhǔn)編碼,并依此實(shí)現(xiàn)海洋生態(tài)環(huán)境保護(hù)信息化。
[1]楊安生.企業(yè)精細(xì)化管理要科學(xué)運(yùn)用信息分類與編碼[J].現(xiàn)代情報(bào),2007,07:197-199.
[2]陳良貴,陳巳康,趙勇.上海城市交通基礎(chǔ)信息分類與編碼研究[J].城市公用事業(yè),2008,03:33-36+67.
[3]張育潤(rùn),江洲.生物信息資源分類與編碼標(biāo)準(zhǔn)化研究[J].標(biāo)準(zhǔn)科學(xué),2009,03:21-23.
[4]吳伯杰,李功強(qiáng),秦士存.通用編碼分類系統(tǒng)工具軟件的研究開(kāi)發(fā)[J].機(jī)械設(shè)計(jì)與制造,1999,01:10-11.
[5]張茂震,宋鐵英,唐小明,黃水生,劉鵬舉,謝陽(yáng)生.森林資源信息分類編碼方法[J].福建林學(xué)院學(xué)報(bào),2005,25(2):147-152.
[6]崔麗娟,張曼胤,何春光.中國(guó)濕地分類編碼系統(tǒng)研究[J].北京林業(yè)大學(xué)學(xué)報(bào),2007,29(3):87-92.
[7]何建邦,李新通,畢建濤,曹彥榮.資源環(huán)境信息分類編碼及其與地理本體關(guān)聯(lián)的思考[J].地理信息世界,2003,01(5):6-11.
[8]王丙義.信息分類與編碼[M].北京:國(guó)防工業(yè)出版社,2003:22-25.
[9]陳宗舜.制造業(yè)信息化與信息編碼.北京:清華大學(xué)出版社,2003:87-90.
[10]周建勤,張鐸.物流信息分類編碼標(biāo)準(zhǔn)體系探討[J].物流技術(shù),2000,(2):372-391.
[11]張丹,企業(yè)信息編碼及其管理系統(tǒng)的研究與開(kāi)發(fā)[D].南京:南京航空航天大學(xué),2007:12-13.