国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

海洋領域信息數(shù)據庫平臺構建研究——以浙江海洋學院圖書館建庫為例

2011-12-23 05:56董民輝
海洋信息技術與應用 2011年4期
關鍵詞:海洋數(shù)據庫模塊

董民輝

(浙江海洋學院舟山市 316000)

海洋領域信息數(shù)據庫平臺構建研究
——以浙江海洋學院圖書館建庫為例

董民輝

(浙江海洋學院舟山市 316000)

從數(shù)據、應用邏輯到語義3 個層次建立規(guī)范的海洋信息管理系統(tǒng),實現(xiàn)相關海洋信息的采集、存貯、檢索、分析、交換和集成等,提出通過 TPI 系統(tǒng)解決海洋領域信息資源的集成和共享問題。

海洋領域 海洋信息數(shù)據庫 數(shù)據庫建設

1 海洋資源是數(shù)據庫建設的基礎

隨著經濟的高速增長,陸域資源、能源、空間的壓力日益加劇,人類已將經濟發(fā)展的重心逐漸移向海洋。聯(lián)合國《21世紀議程》指出:海洋是全球生命支持系統(tǒng)的一個基本組成部分,也是有助于實現(xiàn)可持續(xù)發(fā)展的寶貴財富。世界海洋經濟增長迅速,海洋產值每十年就翻一番,增長速度遠高于同期 GDP 的增長。海洋經濟在世界經濟中的比重已達 10% 左右,預計到2050年,將上升到 20% 。海洋經濟已成為沿海各國(地區(qū))國民經濟的重要組成部分[1]。

20世紀90年代以來,信息化浪潮席卷全球,世界各國都紛紛以信息技術作為新科技的先鋒。特別是發(fā)達國家,以信息化帶動工業(yè)化,帶動管理領域和經濟領域,取得顯著效果。海洋是藍色國土,利用信息化促進海洋管理、海洋科研和海洋開發(fā)的快速發(fā)展,可實現(xiàn)海洋強國戰(zhàn)略。

涉海類高等院校目前把海洋特色專業(yè)建設成省級甚至國家級的重要學科,各高校圖書館也都根據自身特點和資源收藏,形成豐富的文獻館藏。怎樣更好地發(fā)揮館藏優(yōu)勢,為讀者、教學和科研提供更好的服務;怎樣整合現(xiàn)有資源,開發(fā)新資源,提高資源利用率;怎樣將具有特色的海洋信息資源數(shù)字化和共享,是目前面臨的最迫切的問題。其可行辦法是走特色化辦館之路,在現(xiàn)有資源的前提下,充分挖掘自身優(yōu)勢,融合學院、教學及科研。海洋信息化管理工作主要由 3個部分組成:基礎數(shù)據庫、專題數(shù)據庫、運行實現(xiàn)信息管理共享平臺。通過這些技術,最大限度地開發(fā)和利用共享信息資源,從而提高管理效率和經濟效益。

2 海洋領域數(shù)據庫內容[2]

數(shù)據由空間數(shù)據和非空間數(shù)據兩部分組成,前者包括各種地理電子圖件,后者即屬性數(shù)據和文檔資料??臻g型數(shù)據分矢量數(shù)據和柵格數(shù)據。

2.1 基礎數(shù)據庫分類

海洋地理空間數(shù)據庫主要包括海域地理數(shù)據、海岸帶地理數(shù)據、海岸帶地形數(shù)據、海岸帶地貌數(shù)據、海洋地質數(shù)據、海底地貌數(shù)據等基礎地理信息數(shù)據。

海洋資源數(shù)據庫主要包括海島資源數(shù)據、漁場資源數(shù)據、漁港空間分布數(shù)據、港口碼頭資源數(shù)據、鹽場資源數(shù)據、海產品資源數(shù)據、旅游資源數(shù)據等數(shù)據。

海洋環(huán)境數(shù)據庫主要包括物理海洋數(shù)據、海洋氣象數(shù)據、海洋化學數(shù)據、海洋生物數(shù)據等。

海況及海洋災害數(shù)據庫包括氣象、海況信息、歷史海洋災害信息以及各種海洋災害的應對預案信息。

港口航運發(fā)布信息數(shù)據庫主要包括港客運和貨運以及其他有關港口航運所發(fā)布的相關信息。

海洋科技及產業(yè)信息數(shù)據庫包括政府對外招商、經濟合作交流信息,通過各種渠道發(fā)布的各類海洋科技及產業(yè)信息及海洋科研院所的信息。

海洋旅游發(fā)布信息數(shù)據庫包括旅游局發(fā)布的有關海洋旅游的各類信息。

2.2 專題數(shù)據庫分類

海域使用信息數(shù)據庫主要包括海域使用登記信息、年檢信息等。

海岸帶管理數(shù)據庫主要包括海岸帶工程,海岸帶功能區(qū)劃,海岸帶利用狀況,淺海、灘涂利用等信息。

漁業(yè)管理信息數(shù)據庫包括海洋農牧化建設信息、漁業(yè)示范基地、魚苗及其審核信息、漁業(yè)經濟、魚情預報、漁業(yè)法規(guī)、水產品生產等信息。

漁業(yè)產業(yè)數(shù)據庫主要包括水產養(yǎng)殖、捕撈、水產品加工等企業(yè)的各方面信息;漁業(yè)產品信息、漁業(yè)生產信息、漁業(yè)招商引資信息等。

海洋法規(guī)數(shù)據庫主要包括海洋執(zhí)法、海洋環(huán)境保護、海洋生產等方面的相關法律法規(guī)。

漁業(yè)電臺數(shù)據庫主要包括電臺設備,船舶電臺的數(shù)量、頻段、內容等管理信息。

漁業(yè)船舶數(shù)據庫主要包括用于水產養(yǎng)殖、遠洋捕撈、近海捕撈等所有漁船的信息。

漁港數(shù)據庫主要包括漁業(yè)港口的所有信息,規(guī)模、水深、設施等。

漁業(yè)資源數(shù)據庫主要包括遠洋及近海的漁業(yè)資源、水產品養(yǎng)殖信息、魚群洄游信息等。

水生野生動植物數(shù)據庫主要包括列入保護范圍的水生野生動植物的信息,種群、數(shù)量、聚集地等。

安全生產數(shù)據庫主要包括漁業(yè)企業(yè)、水產養(yǎng)殖企業(yè)、水產品加工企業(yè)的安全生產信息。

海洋污染事故數(shù)據庫主要包括海洋污染歷史數(shù)據、海洋污染分類、海洋污染應急預案等信息。

海洋工程數(shù)據庫主要包括待建、在建、已建的各類海洋工程的詳細信息以及工程場地周邊敏感水域的信息。

海洋保護區(qū)數(shù)據庫主要包括各類海洋保護區(qū)的信息。

漁業(yè)病蟲害數(shù)據庫主要包括漁業(yè)病蟲害的信息、防治辦法信息,以及國際各種漁業(yè)病蟲害的最新信息。

水產品防疫檢測數(shù)據庫主要包括水產品檢驗檢疫的信息。

3 海洋信息數(shù)據庫管理平臺的現(xiàn)狀和問題

海洋基礎信息積累與數(shù)據庫建設,是海洋信息資源開發(fā)利用的重要環(huán)節(jié)。只有具備了豐富、有效、及時的信息,海洋信息化工作才有基礎。海洋基礎數(shù)據的積累和數(shù)據庫的建設應立足于全面、系統(tǒng)的原則,廣泛收集各種有關信息,以滿足海洋管理、科研、教學、推廣及基層漁民等各層次、各部門的需要。浙江海洋學院圖書館數(shù)據庫平臺將廣泛收集該校建校以來承擔的各類項目的成果、論文、專利等相關文檔、原始數(shù)據、圖件等,建設科學研究基礎信息數(shù)據庫;設計科研基礎信息元數(shù)據結構,建立元數(shù)據庫;開發(fā) B/S模式元數(shù)據導航查詢系統(tǒng),實現(xiàn)科學研究基礎信息的瀏覽、查詢及下載功能。

近年來,該館十分重視數(shù)據庫平臺的建設,圖書資料的數(shù)字化正在加緊進行中。如館內各種文獻數(shù)據庫的建庫、更新、維護與服務;圖書館書目數(shù)據庫的自動化建設;圖書館信息檢索,圖書資料的回溯建庫;外文原版圖書的全文數(shù)字化加工處理等工作正在積極運作中。目前已經建立了 3 000 多種海洋以及淡水魚類、蝦類、貝類、藻類等海洋生物的基本資料數(shù)據庫。同時,建立了水產養(yǎng)殖新品種的引進資料數(shù)據庫;水產瀕危動物資料數(shù)據庫;水產名貴、珍稀水生動物數(shù)據庫;種質資源數(shù)據庫;養(yǎng)殖技術數(shù)據庫,水產質量官方評價數(shù)據庫等。

過去的十余年中,我國先后開發(fā)了一系列海洋相關應用軟件,大大提高了海洋觀測、預報的效率和精確度。在海洋信息化系統(tǒng)應用過程中,也暴露出一些問題,體現(xiàn)在:(1)數(shù)據資源共享程度低,海洋觀測數(shù)據來源廣泛、形式異構,難以實現(xiàn)共享;(2)系統(tǒng)整合程度低,各部門系統(tǒng)獨立開發(fā),彼此間服務和功能相關性差,難以發(fā)揮整體效益;(3)功能復用程度低,相同功能的系統(tǒng)模塊重復開發(fā)現(xiàn)象普遍;(4)跨領域協(xié)同困難,部門間數(shù)據表達和服務流程存在較大差異,導致領域內協(xié)同業(yè)務體系建設難以推進。[3]

目前,我國海洋信息數(shù)據庫種類繁多,如海洋水產數(shù)據庫、海洋運輸數(shù)據庫、海洋油氣業(yè)數(shù)據庫、國內海洋綜合經濟數(shù)據庫等。但由于沒有總體平臺,缺乏統(tǒng)一的數(shù)據存貯、交換格式。在進行海洋信息的綜合查詢或統(tǒng)計中會出現(xiàn)問題。因此,迫切需要建立一個規(guī)范的海洋信息系統(tǒng)平臺,通過實現(xiàn)海洋信息化管理,制定一系列標準和技術規(guī)范來統(tǒng)一各種技術流程和系統(tǒng)中以數(shù)字形式存在的各種信息,達到海洋信息的資源共享及信息服務的社會化,為海洋生產單位對海洋開發(fā)和科研活動提供準確、權威的數(shù)據資料。

4 海洋類信息數(shù)據庫平臺的構建研究

4.1 TPI 系統(tǒng)介紹

TPI 系統(tǒng)即清華同方專業(yè)數(shù)據庫制作管理系統(tǒng),是清華同方光盤股份有限公司在積累了信息資源建設領域的大量寶貴經驗的基礎上,為大中小型信息服務機構開發(fā)的一個以內容管理為核心的數(shù)字圖書館解決方案。TPI 是基于非結構化文檔管理而開發(fā)的大型智能內容管理系統(tǒng)。該系統(tǒng)以 FTS 全文檢索數(shù)據庫為核心,集成了字典管理(FDT)、內容發(fā)布系統(tǒng)(CPS)、元數(shù)據標引(ME)、類工具(CF)、檢查工具(CKT)、光盤出版工具(CDPT)等模塊。采用流行的 B/S 瀏覽器的檢索方式和先進的 3 層 C/S 架構,能夠同時管理文字、圖片、多媒體等信息并提供全文檢索服務,支持網頁的動態(tài)發(fā)布,是一個面向內容管理的數(shù)字圖書開發(fā)平臺。TPI 系統(tǒng)針對數(shù)字圖書建設提供了一條捷徑,特別是其高性能的全文數(shù)據庫系統(tǒng),先進的信息發(fā)布系統(tǒng),支持標準的檢索協(xié)議,完全兼容普遍使用的 CNMARC 標準,支持Z39.50協(xié)議,動態(tài)實時信息處理,可利用COM 實現(xiàn)二次開發(fā)以及高性能的全文檢索引擎,是解決目前數(shù)字圖書館資源建設的專業(yè)化軟件。

4.2 TPI的功能

利用TPI系統(tǒng)在資源存儲方面支持各種格式的文本和圖片、視音頻文件處理技術,完成數(shù)據存儲。在資源管理方面,將數(shù)據庫同時建立多種導航樹以支持多種分類體系。導航樹直接和分類結果一一對應,用戶可以在 Web 上直接按照導航樹檢索。支持角色管理和用戶管理,方便定義不同用戶的權限,使數(shù)據庫操作同時具備方便性和安全性等特性。分布式檢索系統(tǒng)把分布在不同地理位置的獨立自主的多個 TPI 數(shù)據庫服務器聯(lián)結為一個集群系統(tǒng)。各自獨立的 TPI 系統(tǒng)可以建立特色數(shù)據庫,可控制其他用戶訪問資源。分布式檢索系統(tǒng)提供跨服務器、跨平臺的分布式檢索,用戶通過該系統(tǒng)可以極大地共享整個集群數(shù)據庫中的信息,實現(xiàn)分布式、多層次、多類型、特色型的資源共享。

TPI 內容發(fā)布系統(tǒng)將加工的數(shù)據發(fā)布到互聯(lián)網上,使之可被用戶瀏覽和檢索。發(fā)布提供多種發(fā)布模板:CNKI 期刊風格、GOOGLE 風格、EI 風格、OCLC 風格、圖片風格等。支持用戶基于數(shù)據庫字段的個性化發(fā)布定制;支持多種數(shù)據庫間數(shù)據記錄之間的關聯(lián)、跳轉、校驗、下拉選擇;為數(shù)據庫同時建立多種導航樹,支持多種分類體系并存;支持為一條記錄關聯(lián)多個全文數(shù)據或多種媒體數(shù)據的連接功能,該功能為發(fā)布多圖片新聞、多附件通知等應用提供技術保障。

4.3 利用 TPI 建設海洋領域信息數(shù)據庫方案

方案主要包括5 方面建設內容:數(shù)據采集模塊、數(shù)據遷移模塊、資源管理模塊、資源發(fā)布模塊、信息檢索模塊。各模塊協(xié)調工作,實現(xiàn)軟件系統(tǒng)的所有功能。其中資源管理模塊包括全文檢索管理系統(tǒng)和內容管理系統(tǒng)。

4.3.1 數(shù)據采集模塊

數(shù)據采集模塊的主要功能是實時采集、監(jiān)控網站內容,對采集的海洋類信息進行過濾和自動分類,將需要的內容及時發(fā)布,實現(xiàn)信息檢索。比如定向抓取某些網站的數(shù)據,用戶只需設定要抓取站點的首頁地址,程序就會按設定的站點下載相應的網頁并傳給后臺處理程序做進一步的處理。根據設定的更新周期定期對各站點上新發(fā)布的網頁或者更新的網頁進行及時抓取。

圖1 應用系統(tǒng)的功能模塊圖

對于館內長期積累的海洋文獻紙質文檔,如技術文檔和政府報告,通過掃描、OCR 識別、編改、標引、分類、檢查、入庫進行加工,提供全文檢索;對于大量電子文檔,如 Word、PDF 等文檔,通過整編、標引、分類、檢查、入庫進行加工,即可提供全文檢索。

4.3.2 數(shù)據遷移模塊

通過數(shù)據遷移模塊將數(shù)據轉換成KBASE 數(shù)據源。數(shù)據來源主要是:(1)關系數(shù)據庫(SQLServer、Oracle、IBM DB2 等);(2)專用數(shù)據庫,如國內某些廠商提供的數(shù)據庫;(3)文件系統(tǒng):可能是文本、XML、Word 文檔、PDF 及PPT 文件等。這些信息有不同的安全訪問級別、對不同的用戶需控制其訪問內容,要求做到文檔級別的安全性管理;(4)數(shù)據采集模塊采集的頁面信息;(5)非結構化數(shù)據:Lotus Domino、Microsoft Exchange。

4.3.3 資源管理模塊

資源管理模塊包括全文檢索管理系統(tǒng)和內容管理系統(tǒng)。全文檢索管理系統(tǒng)為用戶提供全文數(shù)據存儲和全文檢索管理功能。它是以管理非結構化數(shù)據對象為主,具備智能信息處理能力,以中文信息處理為特色的專用數(shù)據庫管理系統(tǒng),該系統(tǒng)需要對異構數(shù)據源提供統(tǒng)一訪問和統(tǒng)一管理手段,直接支持 Z35.90 協(xié)議、OpenURL 協(xié)議、OAI協(xié)議,提供通用數(shù)據訪問網關,可統(tǒng)一訪問所有Web 數(shù)據源。內容管理系統(tǒng)是建立在全文檢索管理系統(tǒng)之上的實際應用系統(tǒng),為用戶提供對數(shù)據庫的信息管理、用戶管理、權限管理、分類導航、記錄管理、數(shù)字對象 DOI 管理等功能。

4.3.4 信息檢索模塊

該模塊是用戶有效利用平臺的重要環(huán)節(jié),各種不同種類的數(shù)據庫可以有自己的檢索風格,也可以與其他數(shù)據庫形成統(tǒng)一的跨庫檢索。

4.3.5 資源發(fā)布模塊

資源發(fā)布模塊是系統(tǒng)對外服務的窗口,其內容應包含:統(tǒng)一異構檢索、支持標準的 OpenURL、Z39.50、Portlet、SAML、Web Services、ILL協(xié)議,含多種發(fā)布風格,支持多種導航等功能。

系統(tǒng)的業(yè)務流程包括數(shù)據采集、數(shù)據遷移、資源管理、資源發(fā)布、信息檢索等。

圖2 基本業(yè)務流程圖

互聯(lián)網上的頁面信息通過數(shù)據采集模塊得到數(shù)據并存放到 KBase 數(shù)據庫中;專用數(shù)據庫、關系數(shù)據庫和文件等其他數(shù)據通過數(shù)據遷移模塊轉換為該數(shù)據庫的資源。通過統(tǒng)一認證管理模塊對數(shù)據設置分級權限,資源管理模塊進行統(tǒng)一管理,應用資源發(fā)布模塊將信息發(fā)布到 Web 上,配合信息檢索模塊實現(xiàn)資源的檢索功能。

該方案的特點:自主研發(fā)的大型國產文檔數(shù)據庫性能優(yōu)異。安全與標準共存,自主研發(fā)數(shù)據庫擁有良好的安全性,同時也支持眾多國際標準協(xié)議,并提供完善的二次開發(fā)的標準接口 SDK,指揮調度、圖像監(jiān)控等第三方程序可輕松利用接口 SDK 與服務器端進行數(shù)據的交互;統(tǒng)一管理與統(tǒng)一維護,無須第三方數(shù)據庫系統(tǒng),在降低成本的同時,更便于統(tǒng)一培訓、統(tǒng)一管理、統(tǒng)一維護;專業(yè)性能優(yōu)越,數(shù)據庫單庫容量可達 8T,記錄條數(shù)可達 40億×40 億條;數(shù)據檢索查詢速度業(yè)界領先,可達 500 G/秒;擁有眾多特有功能,如復合字段,支持自定義。

B/S 與 C/S 架構相結合。提供門戶網站,通過 TPI 的建庫發(fā)布,即可提供政務、辦公、信息采集處理等一體化的綜合性門戶網站;強大功能與易用性并重;支持靈活的C/S架構;TPI 系統(tǒng)的客戶端可使用桌面程序與服務器建立 C/S 連接,進行數(shù)據的交互和處理。

細節(jié)功能齊全強大。Web 在線提交可提交附件,支持任何格式的文件;支持自動發(fā)布數(shù)據庫,隨時更改發(fā)布樣式,可動態(tài)發(fā)布網站,體現(xiàn)特色支持;對已有紙質文檔進行掃描加工,通過OCR 進行圖形文字識別并入庫;覆蓋文本、圖片、音頻、視頻等各種媒體類型。

海洋信息是海洋科研、教學、工程設計、規(guī)劃管理、環(huán)境測報及評價、海洋經濟可持續(xù)發(fā)展和軍事海洋環(huán)境條件保證等的主要依據,海洋科學數(shù)據的收集、處理和數(shù)據庫建設對于以海洋經濟為支柱產業(yè)的社會具有科學意義和緊迫需求。因此 TPI 完全符合海洋信息綜合管理平臺的各項功能和支持各類海洋數(shù)據標準、規(guī)范的處理。

[1]徐長樂,朱元秀.上海市進一步推進海洋經濟發(fā)展的若干戰(zhàn)略思考[J]. 科學,2011(1):21-25.

[2]高惠瑛,陳天恩,莫善軍.海洋資源信息化工程中的數(shù)據庫構建模式[J]. 海洋科學,2004(7):31-35.

[3]楊鵬,王文俊,董存祥. 海洋領域信息集成與共享研究[J].計算機工程與應用,2010(26):194-197.

2011年6月23日

猜你喜歡
海洋數(shù)據庫模塊
28通道收發(fā)處理模塊設計
“選修3—3”模塊的復習備考
愛的海洋
第一章 向海洋出發(fā)
數(shù)據庫
數(shù)據庫
數(shù)據庫
數(shù)據庫
集成水空中冷器的進氣模塊
易门县| 石屏县| 宁安市| 开江县| 梨树县| 会宁县| 望奎县| 略阳县| 东至县| 甘谷县| 天祝| 尖扎县| 五原县| 南京市| 延津县| 南召县| 衡东县| 浠水县| 沅江市| 三门峡市| 闸北区| 阿瓦提县| 石阡县| 松滋市| 南宫市| 华坪县| 长寿区| 农安县| 兰州市| 万安县| 遵化市| 苍梧县| 龙泉市| 特克斯县| 南川市| 泰顺县| 邹平县| 开封县| 米易县| 连平县| 麻栗坡县|