姚建華 徐雯麗 李佳 黃迎 凌敏 胡靜 蔣舒仰 周紅 高映新
1 中國科學(xué)院上海有機(jī)化學(xué)研究所 (上海 200032)
2 環(huán)保部環(huán)境研究總院新化學(xué)品登記中心 (北京 100012)
綜述
化學(xué)品信息管理與環(huán)境保護(hù)
姚建華1徐雯麗1李佳1黃迎1凌敏1胡靜1蔣舒仰1周紅1高映新2
1 中國科學(xué)院上海有機(jī)化學(xué)研究所 (上海 200032)
2 環(huán)保部環(huán)境研究總院新化學(xué)品登記中心 (北京 100012)
隨著人類社會的發(fā)展,人們對物質(zhì)的種類需求越來越多、數(shù)量越來越大。由于已有的天然資源已不能滿足這樣的需求,必須使用大量的人造制品來彌補(bǔ)這樣的空缺,而人造制品中的絕大部分是化學(xué)類物質(zhì)。這些化學(xué)物質(zhì)在極大地滿足了人類社會需求的同時,也給人類賴以生存的環(huán)境造成了一定的污染。為此,必須應(yīng)用有效的方法管理化學(xué)品,以保證人類能夠安全有效使用化學(xué)品的同時確保生活環(huán)境的安全。隨著計算機(jī)技術(shù)的發(fā)展,計算機(jī)信息管理系統(tǒng)幾乎承擔(dān)了所有領(lǐng)域的信息管理工作。目前,在化學(xué)領(lǐng)域,用于化學(xué)信息管理的系統(tǒng)有:SciFinder、ISIS/Base、ELN和CISOC-ChIMS等?;瘜W(xué)品信息的有效管理,將對環(huán)境保護(hù)起到積極的作用。
信息管理 數(shù)據(jù)庫系統(tǒng) 化學(xué)品 環(huán)境保護(hù)
信息管理(Information management)是人類為了有效地開發(fā)和利用信息資源,以現(xiàn)代信息技術(shù)為手段,對信息資源進(jìn)行計劃、組織、領(lǐng)導(dǎo)和控制的社會活動。簡單地說,信息管理是指在整個管理過程中,人們收集、加工、輸入和輸出信息的總稱。信息管理是人類綜合采用技術(shù)、經(jīng)濟(jì)、政策、法律和人文的方法和手段對信息流進(jìn)行控制,以提高信息利用的效率,最大限度地實現(xiàn)信息使用價值為目的的一種活動。
化學(xué)品信息主要分為化學(xué)物質(zhì)的化學(xué)信息以及媒體形式的化學(xué)信息?;瘜W(xué)物質(zhì)的化學(xué)信息是使用科學(xué)的原理和方法通過實際測量得到的關(guān)于化學(xué)成分的一些信息,包括化學(xué)物質(zhì)的物理、化學(xué)性質(zhì),物質(zhì)中各個成分的含量比例以及化合物的結(jié)構(gòu)信息、分子間相互作用的關(guān)系、化學(xué)反應(yīng)、對環(huán)境的影響、化合物的生物活性參數(shù)等內(nèi)容。而媒體形式的化學(xué)信息則是指化學(xué)信息的記錄形式,包括圖書、期刊、數(shù)據(jù)庫、專利等,通過對化學(xué)信息的傳播使研究者能夠共享測量的原理、方法以及結(jié)果等化學(xué)物質(zhì)的化學(xué)信息。
目前,在環(huán)境保護(hù)領(lǐng)域,人們只關(guān)注已經(jīng)被確定為污染物的化學(xué)品及其相關(guān)信息、該類化學(xué)品的檢測、污染處理和控制方法。對于目前未被確定或未列入管控的化學(xué)品,并不關(guān)注。這是值得重視的現(xiàn)象。
隨著合成方法和技術(shù)的發(fā)展,化合物數(shù)量的增長速度已有很大的提高。目前,在美國化學(xué)文摘社登記的化合物已多達(dá)8800萬個。鑒于這樣的數(shù)量,傳統(tǒng)的人工管理方法已無法實現(xiàn)如此大量信息的有效管理。而計算機(jī)技術(shù)的發(fā)展,為實現(xiàn)化學(xué)品信息的高效管理和應(yīng)用提供了有效的技術(shù)。在此,我們認(rèn)為化學(xué)品的信息管理對環(huán)境保護(hù)具有積極的作用。
化學(xué)品信息的管理過程主要包括:化學(xué)品信息的采集;化學(xué)品信息的處理、加工;化學(xué)信息管理系統(tǒng)管理、信息的質(zhì)量控制等。
1.1 化學(xué)品信息的采集
化學(xué)品信息的采集是化學(xué)品管理過程中的第一步。由于化學(xué)品信息內(nèi)容的多樣性和信息來源的多樣性,我們需要對所需采集的化學(xué)品信息進(jìn)行分析,設(shè)計信息采集方案。
首先,我們將需要采集的數(shù)據(jù)進(jìn)行分析,查找已有的數(shù)據(jù)庫確定哪些內(nèi)容可以在現(xiàn)有的可得到的數(shù)據(jù)庫中查到?,F(xiàn)有數(shù)據(jù)庫中沒有的內(nèi)容,可以分別通過互聯(lián)網(wǎng)或者紙質(zhì)載體進(jìn)行數(shù)據(jù)查找。另外,也可以直接收集實驗數(shù)據(jù)。
由于計算機(jī)的普及以及網(wǎng)絡(luò)的發(fā)展,商業(yè)數(shù)據(jù)庫是我們的首選,它提供了多樣化的檢索方式,并且提供的信息是經(jīng)過校驗和處理的,內(nèi)容更可靠。而互聯(lián)網(wǎng)上免費的大型搜索引擎例如谷歌、百度等通常提供大量的命中結(jié)果,當(dāng)我們需要新的或者少見的化學(xué)品信息時,這些大型搜索引擎是很好的選擇,但其信息的來源并不十分可靠,處理這部分信息時需要謹(jǐn)慎。相對于在計算機(jī)上進(jìn)行的快速搜索,紙質(zhì)出版物的查找顯得費時又費力。而且由于紙質(zhì)出版物出版條件的復(fù)雜,它所提供的信息比網(wǎng)絡(luò)資源落后,并且有相當(dāng)一部分的紙質(zhì)出版物通過掃描、輸入等方式被放在互聯(lián)網(wǎng)上供人們在計算機(jī)上閱讀,所以紙質(zhì)載體的查詢是不被人們所重視的。
雖然紙質(zhì)載體的查詢不方便,信息相對于網(wǎng)絡(luò)較落后,但也有其存在的價值。由于它的出版是經(jīng)過層層篩查的,所以紙質(zhì)載體所攜帶的信息的可信度較高,其內(nèi)容很多是對某一方面問題的總結(jié)、概述。當(dāng)我們接觸一個新的領(lǐng)域或事物時,可以通過書本來了解它的概況、發(fā)展情況等信息。對于所要查找的化合物信息來說,當(dāng)一些內(nèi)容無法通過計算機(jī)找到時,我們可以查找一些化合物的工具書。
書的查找和網(wǎng)絡(luò)搜索是不同的,它不是通過關(guān)鍵詞來進(jìn)行查詢的,而要根據(jù)學(xué)科的分類一層一層地縮小科目的范圍來進(jìn)行查詢。這就需要我們掌握科目的分類系統(tǒng),從而找到相關(guān)書籍。
實驗數(shù)據(jù)價值眾所周知,為此收集和管理實驗數(shù)據(jù)的重要性顯而易見??梢姡靡延械男畔⒐芾硐到y(tǒng),建立相應(yīng)的數(shù)據(jù)庫,將有助于數(shù)據(jù)的管理,方便使用。
對于環(huán)境保護(hù)而言,化學(xué)品信息應(yīng)該包括以下幾類:化學(xué)品名稱、CAS號、化學(xué)結(jié)構(gòu)、相關(guān)物化性質(zhì)、化學(xué)品穩(wěn)定性、環(huán)境毒性和毒理學(xué)數(shù)據(jù)等。
1.2 化學(xué)品信息的處理、加工
由于查詢的載體、信息的來源不同,采集到的信息的顯示方式、儲存形式也是多種多樣的。所以我們需要對采集到的化學(xué)品信息進(jìn)行處理、加工,去除多余的、重復(fù)的信息,將需要的信息進(jìn)行編輯、轉(zhuǎn)換成電腦可識別、處理的信息,以便于我們使用化學(xué)信息管理系統(tǒng)對化學(xué)品信息進(jìn)行有效的管理?;瘜W(xué)品信息的處理包括化合物結(jié)構(gòu)的編輯、化合物性質(zhì)的預(yù)處理以及數(shù)據(jù)的規(guī)范化處理。
在大多數(shù)情況下,我們通過信息采集收集到的化合物結(jié)構(gòu)都是以圖片的形式存儲的,不能直接使用計算機(jī)進(jìn)行計算、編輯,自然無法很好地利用這些信息進(jìn)行管理。所以,要使用結(jié)構(gòu)編碼將化學(xué)結(jié)構(gòu)轉(zhuǎn)換成計算機(jī)可識別、計算的文件格式,以便在計算機(jī)中操作化學(xué)結(jié)構(gòu)。用于儲存分子結(jié)構(gòu)信息的文件格式有很多,例如Molfile是應(yīng)用較為廣泛的連接表格式的文件(見表1)。
通過不同渠道采集的化學(xué)品性質(zhì)的數(shù)據(jù)多種多樣,不同實驗條件下的結(jié)果不同。所以要對性質(zhì)數(shù)據(jù)進(jìn)行處理,盡量選取相同條件下的數(shù)據(jù),并注明實驗條件。除此以外,將不同來源的數(shù)據(jù)進(jìn)行篩選、整理,最終得到較為準(zhǔn)確、全面的數(shù)據(jù)。
在處理化學(xué)品的結(jié)構(gòu)和性質(zhì)時需要規(guī)范化的操作,包括統(tǒng)一的單位、制定選取數(shù)據(jù)的規(guī)則、統(tǒng)一的顯示方式等。
1.3 化學(xué)信息管理系統(tǒng)
對于處理好的大量的信息最有效的管理方法就是數(shù)據(jù)庫管理。在數(shù)據(jù)庫中可以對信息進(jìn)行輸入、搜索、輸出、編輯等操作。建立數(shù)據(jù)庫需要使用化學(xué)信息管理系統(tǒng)。
SciFinder是最常用的數(shù)據(jù)庫檢索系統(tǒng),用來訪問CAS出版的系列數(shù)據(jù)庫,其中Registry數(shù)據(jù)庫是世界上最大最全更新最快的物質(zhì)數(shù)據(jù)庫。ISIS/Base是一個基于桌面的化學(xué)信息管理系統(tǒng),利用ISIS/Base可以對化學(xué)結(jié)構(gòu)及相關(guān)的科學(xué)數(shù)據(jù)進(jìn)行存儲、搜尋和檢索等管理工作,也可以作為客戶端應(yīng)用程序通過網(wǎng)絡(luò)訪問服務(wù)端數(shù)據(jù)庫,是工業(yè)標(biāo)準(zhǔn)級的化學(xué)信息管理系統(tǒng)。ELN是一種復(fù)合式的電子實驗記錄系統(tǒng),主要用于實驗過程及結(jié)果的存儲、管理。CISOC-Ch IMS是中國科學(xué)院上海有機(jī)化學(xué)研究所自主研制并獲得中國軟件著作權(quán)的化學(xué)信息管理系統(tǒng)。它具有化學(xué)結(jié)構(gòu)檢索和文字檢索兩大檢索功能,可以進(jìn)行數(shù)據(jù)庫的維護(hù)、中文處理、圖形存貯,尤其是中文處理功能彌補(bǔ)了其他國外開發(fā)的化學(xué)信息管理系統(tǒng)在中文處理上的不足。
2003年,以色列化學(xué)家Arnon Shani發(fā)表了一篇題為《化學(xué)無處不在》的文章。文章闡述了化學(xué)與社會的關(guān)系,化學(xué)品的作用、與人類及環(huán)境的關(guān)系。一個具有一定應(yīng)用價值的化學(xué)品(如農(nóng)藥、醫(yī)藥、食品添加劑或顏料),同時也存在對人類健康不利或污染環(huán)境的可能性。有些化合物,可能在它剛剛出現(xiàn)時,是一種特殊功能的物質(zhì),人們只關(guān)注其功能,沒有意識到它對環(huán)境和人類健康的危險性。如香蘭素,哈爾曼博士和泰曼博士在1874年成功合成了該化合物,并被用作食品添加劑,聯(lián)合國糖農(nóng)組織/世界衛(wèi)生組織(FAO/WHO)在1992年規(guī)定:用于方便食品的罐頭、嬰兒食品和谷類食品的最高允許用量為70mg/kg。直到2005年,才有實驗報道,該化合物有致畸毒性。如溴代叔丁烷,在化學(xué)研究或化工生產(chǎn)中,是一種常用試劑,它的急性毒性為中低毒,但它有致畸和致癌毒性。
以上例子說明,化學(xué)品對人類健康和環(huán)境的不利影響,可能是在它被發(fā)現(xiàn)的若干年之后,才會被察覺和認(rèn)識,化學(xué)品與環(huán)境和人類健康有著極為密切的關(guān)系。
本文簡要介紹了化學(xué)信息學(xué)方法和技術(shù)實現(xiàn)化學(xué)品信息管理的方法,以及現(xiàn)有化學(xué)信息系統(tǒng)的狀況。目前,收錄與環(huán)境保護(hù)相關(guān)信息的化學(xué)品信息管理系統(tǒng)建設(shè)還處于初始階段,即主要以文字檢索來實現(xiàn)信息檢索,且系統(tǒng)中收錄與環(huán)境保護(hù)相關(guān)的信息還不能滿足環(huán)境保護(hù)工作的需求,如應(yīng)急污染處理、修復(fù)信息不完整等。
使用化學(xué)信息管理系統(tǒng)建立的化學(xué)品信息管理系統(tǒng),不僅可以用于信息查詢和信息管理,另外,還是建立化學(xué)品相關(guān)性質(zhì)預(yù)測系統(tǒng)不可缺失的信息資源。
目前,已建立的與環(huán)境相關(guān)的化學(xué)品性質(zhì)的數(shù)據(jù)庫有:化合物的酸堿離解常數(shù)數(shù)據(jù)庫、化合物疏水常數(shù)數(shù)據(jù)庫等。用戶可以通過網(wǎng)絡(luò),輸入提問結(jié)構(gòu)或相關(guān)性質(zhì)參數(shù),查詢對應(yīng)的性質(zhì)參數(shù)或化學(xué)結(jié)構(gòu)。利用數(shù)據(jù)庫中的數(shù)據(jù)資源與相關(guān)的數(shù)據(jù)分析技術(shù),已經(jīng)建立了化合物致癌毒性、致突變毒性、疏水常數(shù)預(yù)測和酸堿離解常數(shù)預(yù)測系統(tǒng)。用戶只需提交需預(yù)測的化合物的結(jié)構(gòu),預(yù)測系統(tǒng)即在線返回預(yù)測結(jié)果。以上提及的系統(tǒng),已在國家973項目和環(huán)保部的公益項目中體現(xiàn)出實際效應(yīng)。
Management of Chemical Information and Protection of Environment
Yao Jianhua Xu Wenli Li Jia Huang Ying Ling Min Hu Jing Jiang Shuyang Zhou Hong Gao Yingxin
With the development of human society,people need more and more kinds of substances and the quantity also becomes larger.As the nature resources can'tmeet the demands,many artificialmaterials have been used tomake up for the vacancy and mostof them are chemical substances.When these chemical substancesmeet the needs of human society,they also make pollution.Therefore,we should take measures to manage the chemicals effectively to ensure the chemicals can be used safely,and to ensure the safety of the living environment.With the development of the computer technology,the computer information management system almost undertakes the information management of all fields.At present,in the chemical field,the database systems,such as SciFinder,ISIS'Base,ELN and CISOC-ChIMSetc.are used in management of chem ical information.The effectivemanagement of chemicals information will play an important role in environment protection.
Informationmanagement;Database system;Chemicals;Environment protection
(略)
TP 3
2014年6月
姚建華 女 1963年生 研究員 獲法國巴黎第七大學(xué)博士學(xué)位 目前主要從事化學(xué)信息學(xué)及其應(yīng)用工作