劉偉,丁長(zhǎng)松,梁楊
湖南中醫(yī)藥大學(xué)管理與信息工程學(xué)院,湖南 長(zhǎng)沙 410208
中藥種質(zhì)資源信息系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
劉偉,丁長(zhǎng)松,梁楊
湖南中醫(yī)藥大學(xué)管理與信息工程學(xué)院,湖南 長(zhǎng)沙 410208
中藥種質(zhì)資源信息系統(tǒng)是為了提高中藥種質(zhì)資源的管理效率,整合并分析中藥種質(zhì)資源數(shù)據(jù),實(shí)現(xiàn)中藥種質(zhì)資源的信息化管理,更好地為科研機(jī)構(gòu)、政府、企業(yè)以及藥農(nóng)等服務(wù),系統(tǒng)包含信息庫(kù)、文獻(xiàn)庫(kù)、基因庫(kù)3個(gè)數(shù)據(jù)庫(kù),13個(gè)功能模塊。該系統(tǒng)既有助于對(duì)中藥種質(zhì)資源相關(guān)數(shù)據(jù)的管理,又便于數(shù)據(jù)的集成、分析和統(tǒng)計(jì),進(jìn)而挖掘數(shù)據(jù)中潛在的規(guī)律和模式,并提供靈活的數(shù)據(jù)比對(duì)和可視化等功能,具有重要的實(shí)用價(jià)值和研究?jī)r(jià)值。
中藥;種質(zhì)資源;信息系統(tǒng);數(shù)據(jù)庫(kù)
種質(zhì)資源又稱(chēng)遺傳資源或基因資源,是生物資源的重要組成部分。中藥種質(zhì)資源是中藥材引種栽培和資源保護(hù)的基礎(chǔ),是實(shí)施“中藥材生產(chǎn)質(zhì)量管理規(guī)范”(GAP)的保證,也是確保下游產(chǎn)品等效性與安全性以及促進(jìn)中藥行業(yè)可持續(xù)發(fā)展的基石。中藥種質(zhì)資源的基礎(chǔ)數(shù)據(jù)、文獻(xiàn)資料及基因數(shù)據(jù)等對(duì)于中藥行業(yè)的可持續(xù)發(fā)展具有重要意義。
由于中藥種質(zhì)資源數(shù)據(jù)規(guī)模較為龐大,采用傳統(tǒng)人工管理方法查詢(xún)和處理信息的效率較低,難以實(shí)現(xiàn)對(duì)種質(zhì)資源實(shí)體庫(kù)中數(shù)據(jù)的實(shí)時(shí)調(diào)查、統(tǒng)計(jì)分析和相關(guān)查詢(xún),不能科學(xué)、高效、直觀地提取和呈現(xiàn)數(shù)據(jù)中存在的信息,也無(wú)法全面、真實(shí)地記錄中藥種質(zhì)資源的生態(tài)環(huán)境及地理分布等信息;此外,文獻(xiàn)庫(kù)、信息庫(kù)和基因庫(kù)相互獨(dú)立,不利于信息的整合和關(guān)聯(lián)分析,也無(wú)法提供數(shù)據(jù)的可視化、數(shù)據(jù)比對(duì)、數(shù)據(jù)挖掘等功能。因此,建設(shè)功能完善、設(shè)計(jì)合理、操作簡(jiǎn)便的中藥種質(zhì)資源信息系統(tǒng)及相應(yīng)的文獻(xiàn)庫(kù)、信息庫(kù)和基因庫(kù)的意義重大,一方面有利于中藥種質(zhì)資源的管理,另一方面有利于相關(guān)數(shù)據(jù)的集成、分析和統(tǒng)計(jì),進(jìn)而挖掘潛在的規(guī)律和模式,并提供靈活的數(shù)據(jù)比對(duì)和可視化等功能。
中藥種質(zhì)資源信息系統(tǒng)的建設(shè),可實(shí)現(xiàn)對(duì)中藥種質(zhì)資源信息的集中管理和資源數(shù)據(jù)的共享,為研究者和生產(chǎn)者全面了解中藥種質(zhì)的特性、拓寬優(yōu)質(zhì)資源和遺傳基因的使用范圍、培育優(yōu)質(zhì)高產(chǎn)的中藥材提供新的手段,對(duì)中藥行業(yè)的發(fā)展大有裨益。作為第三批湖南省高等學(xué)?!?011協(xié)同創(chuàng)新中心”——湖湘中藥資源保護(hù)與利用協(xié)同創(chuàng)新中心之中藥種質(zhì)資源實(shí)體庫(kù)相配套的信息系統(tǒng),是由湖南中醫(yī)藥大學(xué)藥學(xué)院中藥鑒定與資源實(shí)驗(yàn)室和湖南中醫(yī)藥大學(xué)管理與信息工程學(xué)院信息系聯(lián)合開(kāi)發(fā)的一套中藥種質(zhì)資源信息系統(tǒng)(Germplasm Resources Information System for Chinese Medicines,GRIS-CM),該系統(tǒng)集中藥種質(zhì)資源基礎(chǔ)信息、地理分布信息、數(shù)量與質(zhì)量信息、專(zhuān)家信息、市場(chǎng)信息、商業(yè)信息、文獻(xiàn)數(shù)據(jù)、基因數(shù)據(jù)于一體,可為中藥種質(zhì)資源提供專(zhuān)業(yè)、全面的信息服務(wù),具有重要的科研價(jià)值和社會(huì)價(jià)值。茲就GRIS-CM相關(guān)情況介紹如下。
1.1 系統(tǒng)核心功能分析
GRIS-CM主要用戶(hù)包括相關(guān)政府部門(mén)工作人員、種質(zhì)資源研究人員、藥農(nóng)和藥企。系統(tǒng)管理員可以為注冊(cè)用戶(hù)分配相應(yīng)的功能權(quán)限,在默認(rèn)情況下,所有用戶(hù)都能夠?qū)崿F(xiàn)對(duì)中藥種質(zhì)資源數(shù)據(jù)的查詢(xún)、瀏覽、統(tǒng)計(jì)和比較等操作。
GRIS-CM提供了包括中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)查詢(xún)比對(duì)模塊(提供數(shù)據(jù)查詢(xún)、對(duì)比分析、照片及視頻顯示等功能)、中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)分析模塊(提供數(shù)據(jù)統(tǒng)計(jì)分析、可視化顯示統(tǒng)計(jì)結(jié)果、種質(zhì)資源地圖、種質(zhì)資源Web GIS等功能)、中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)管理模塊、中藥種質(zhì)資源市場(chǎng)及商業(yè)信息應(yīng)用模塊等13個(gè)基礎(chǔ)功能模塊。詳見(jiàn)圖1。
圖1 GRIS-CM基礎(chǔ)功能模塊結(jié)構(gòu)圖
1.2 系統(tǒng)架構(gòu)設(shè)計(jì)
GRIS-CM采用多層B/S(Browser/Server,瀏覽器/服務(wù)器)架構(gòu),系統(tǒng)整體架構(gòu)包括5層,分別是數(shù)據(jù)層(包含3個(gè)具有關(guān)聯(lián)性的中藥種質(zhì)資源數(shù)據(jù)庫(kù),分別用于存儲(chǔ)中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)、文獻(xiàn)數(shù)據(jù)及基因數(shù)據(jù))、數(shù)據(jù)訪(fǎng)問(wèn)層(實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)進(jìn)行增、刪、改、查等基本操作)、數(shù)據(jù)處理層(基于數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等技術(shù),提供數(shù)據(jù)分析和應(yīng)用研究功能)、業(yè)務(wù)邏輯層(實(shí)現(xiàn)信息系統(tǒng)的業(yè)務(wù)功能)和用戶(hù)接口層(為用戶(hù)提供數(shù)據(jù)查詢(xún)、顯示、分析、統(tǒng)計(jì)等操作界面)。詳見(jiàn)圖2。
圖2GRIS-CM整體架構(gòu)圖
另以圖2中的分層架構(gòu)作為基礎(chǔ),對(duì)每一層進(jìn)行詳細(xì)設(shè)計(jì)。數(shù)據(jù)庫(kù)設(shè)計(jì)中每一個(gè)關(guān)系均滿(mǎn)足第三范式的要求,盡量減少冗余的數(shù)據(jù)。由于不同的中藥需使用不同屬性描述其種質(zhì)資源,因此,在設(shè)計(jì)中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)庫(kù)時(shí),針對(duì)每一種中藥都創(chuàng)建了相應(yīng)的關(guān)系表,不同中藥種質(zhì)資源基礎(chǔ)數(shù)據(jù)表中的字段有所異同,用于完整地保存每一種中藥的種質(zhì)資源數(shù)據(jù)。
2.1 技術(shù)實(shí)現(xiàn)方案
GRIS-CM基于Oracle公司的主流軟件開(kāi)發(fā)平臺(tái)Java EE,以及Microsoft公司的主流數(shù)據(jù)庫(kù)管理系統(tǒng)Microsoft SQL Server。采用主流面向?qū)ο缶幊陶Z(yǔ)言Java實(shí)現(xiàn)系統(tǒng)功能,以JSP+Servlet+JavaBean實(shí)現(xiàn)系統(tǒng)的表示層(View)、控制層(Controller)和模型層(Model);Web應(yīng)用的服務(wù)器端部署在Linux操作系統(tǒng)上,服務(wù)器中間件采用Apache Tomcat;數(shù)據(jù)庫(kù)部署在Windows操作系統(tǒng);Web應(yīng)用系統(tǒng)通過(guò)JDBC與數(shù)據(jù)庫(kù)互聯(lián);用戶(hù)界面層主要采用JSP、HTML、CSS實(shí)現(xiàn),部分富客戶(hù)端功能使用了HTML5&CSS3及JavaScript(jQuery+JSON)等技術(shù)。詳見(jiàn)圖3。
圖3 GRIS-CM技術(shù)實(shí)現(xiàn)方案
2.2 系統(tǒng)物理結(jié)構(gòu)
GRIS-CM物理架構(gòu)(部署結(jié)構(gòu))分為3層:數(shù)據(jù)庫(kù)服務(wù)器負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和管理,獨(dú)立數(shù)據(jù)庫(kù)服務(wù)器可提高系統(tǒng)整體運(yùn)行性能、安全性和可靠性,數(shù)據(jù)庫(kù)服務(wù)器需要較大的物理存儲(chǔ)空間,配備較大存儲(chǔ)容量硬盤(pán);應(yīng)用服務(wù)器負(fù)責(zé)業(yè)務(wù)功能程序的執(zhí)行、數(shù)據(jù)分析及挖掘相關(guān)程序,應(yīng)用服務(wù)器需要具有較強(qiáng)的計(jì)算能力,需要配備較大的內(nèi)存和主頻高的處理器;客戶(hù)端瀏覽器負(fù)責(zé)數(shù)據(jù)的輸入和呈現(xiàn),瀏覽器端負(fù)責(zé)Web頁(yè)面的顯示和JavaScript程序的執(zhí)行,在實(shí)現(xiàn)過(guò)程中需要考慮客戶(hù)端瀏覽器的兼容性和客戶(hù)端PC機(jī)的分辨率,表示層支持常用瀏覽器的各個(gè)版本。
2.3 功能界面示例
GRIS-CM集中藥種質(zhì)資源數(shù)據(jù)管理、查詢(xún)、分析、挖掘等功能于一體,為中藥種質(zhì)資源提供全面的、專(zhuān)業(yè)的信息服務(wù),并整合Web GIS、文獻(xiàn)庫(kù)、基因庫(kù),更好地為各類(lèi)用戶(hù)提供服務(wù),系統(tǒng)操作簡(jiǎn)單,使用方便,界面人性化程度高。GRIS-CM為用戶(hù)提供了功能強(qiáng)大、內(nèi)容豐富的種質(zhì)資源查詢(xún)功能,如圖4所示杜仲種質(zhì)資源查詢(xún)界面。
圖4 杜仲種質(zhì)資源查詢(xún)界面
GRIS-CM整合了中藥種質(zhì)資源基礎(chǔ)信息庫(kù)、文獻(xiàn)庫(kù)和基因庫(kù),提供中藥種質(zhì)資源基礎(chǔ)信息、地理分布信息、數(shù)量與質(zhì)量信息、專(zhuān)家信息、市場(chǎng)信息、商業(yè)信息、文獻(xiàn)數(shù)據(jù)、基因數(shù)據(jù)等的研究與應(yīng)用平臺(tái)。該系統(tǒng)目前尚處于中藥種質(zhì)資源整理和數(shù)據(jù)收集錄入階段,主要用戶(hù)為中藥種質(zhì)資源研究人員,待數(shù)據(jù)量達(dá)到一定規(guī)模后,即可面向藥企、藥農(nóng)等相關(guān)單位和個(gè)人用戶(hù)開(kāi)放。該系統(tǒng)現(xiàn)有湖南省中藥種質(zhì)資源數(shù)據(jù)共600多條,包括山銀花、杜仲、夏枯草、魚(yú)腥草、茯苓、玉竹、丹參、枸杞子8種中藥的種質(zhì)資源數(shù)據(jù)。
在后續(xù)工作中,將進(jìn)一步對(duì)中藥種質(zhì)資源數(shù)據(jù)進(jìn)行數(shù)據(jù)分析和挖掘研究,對(duì)中藥種質(zhì)資源數(shù)據(jù)進(jìn)行聚類(lèi)、分類(lèi)、關(guān)聯(lián)分析和異常數(shù)據(jù)檢測(cè),進(jìn)而挖掘潛在的規(guī)律和模式,建立相應(yīng)的種質(zhì)資源的評(píng)價(jià)及性狀篩選等模型,為中藥種質(zhì)資源提供更加完整有效的信息支撐服務(wù)。此外,還將進(jìn)一步對(duì)系統(tǒng)中的數(shù)據(jù)進(jìn)行擴(kuò)充,增加新種類(lèi)的中藥以及相關(guān)種質(zhì)資源數(shù)據(jù),擬在
年內(nèi),配合在建的中藥種質(zhì)資源實(shí)體庫(kù),存儲(chǔ)中藥5種質(zhì)資源數(shù)據(jù)10000份以上。同時(shí),將針對(duì)不同類(lèi)型的中藥,制定相應(yīng)的種質(zhì)資源數(shù)字化標(biāo)準(zhǔn),為中藥種
資源信息提供更為形象的富媒體形式的存儲(chǔ)和呈現(xiàn),質(zhì) 充分利用圖片、視頻等格式來(lái)形象、直觀地表達(dá)和描述種質(zhì)資源信息。
總之,功能完善、設(shè)計(jì)合理、易于使用的GRIS-CM將有助于提升中藥種質(zhì)資源管理和研究的效率,進(jìn)而實(shí)現(xiàn)中藥種質(zhì)資源數(shù)據(jù)存儲(chǔ)的標(biāo)準(zhǔn)化、管理的數(shù)字化和分析的智能化。
(修回日期:2016-03-22;編輯:梅智勝)
Design and Implementation of Germplasm Resources Information System for Chinese Medicines
LIU Wei,DING Chang-song,LIANG Yang
(School of Management and Information Engineering, Hunan University of Chinese Medicine,Changsha 410208,China)
Germplasm Resources Information System for Chinese Medicines(GRIS-CM)is designed and realized for improving the management efficiency of the germplasm resources for Chinese materia medica.The system integrates and analyzes the germplasm resources data,realizes information management of the germplasm resources for Chinese materia medica,and provides better services for scientific research institutions,governments, enterprises and medicinal herb growers.It contains 3 databases and 13 function modules,including the basic information base,literature library and gene bank.GRIS-CM can help manage the related data of germplasm resources for Chinese materia medica,and is better for data integration,analysis and statistics to find the rules and patterns.GRIS-CM provides flexible data comparison and visualization functions,and has significant practical value and research value.
Chinese materia medica;germplasm resources;information system;database
10.3969/j.issn.1005-5304.2017.05.002
R2-05
:A
:1005-5304(2017)05-0005-03
2016-02-29)