国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

遼河流域水環(huán)境管理技術庫構建方法

2017-04-14 16:47夏廣鋒
電子技術與軟件工程 2017年6期
關鍵詞:語義分析遼河流域

遼河流域是我國七大流域之一,國家針對遼河流域的治理經(jīng)歷了漫長的過程,并得出了大量的技術成果。本文針對遼河流域水環(huán)境管理技術文檔的存儲現(xiàn)狀,設計了遼河流域水環(huán)境管理技術庫,并采用語義分析技術對庫內(nèi)的技術文檔進行分析,實現(xiàn)了自動提取知識規(guī)則,并將其存入知識規(guī)則庫。該方法提高了用戶對大量技術文檔的查閱效率和準確率。

【關鍵詞】遼河流域 技術庫 語義分析 知識規(guī)則庫

我國水環(huán)境管理涉及各部委及各省、市、自治區(qū)相應機構,基本上屬于分散型管理體制。鑒于我國的水環(huán)境特點和國情,加強對水環(huán)境有關方面的技術文檔的利用,建立一系列的數(shù)據(jù)庫表對其內(nèi)容進行存儲辨析,以實現(xiàn)智能提取文檔內(nèi)容,提高文檔檢索效率,加速推進水環(huán)境管理技術文檔的利用。針對遼河流域水環(huán)境管理現(xiàn)狀,本文提出了遼河流域水環(huán)境管理技術庫的構建方法。

1 技術庫構建方法研究

1.1 數(shù)據(jù)庫構建技術

在系統(tǒng)的設計和開發(fā)過程中,數(shù)據(jù)庫是系統(tǒng)的核心和基礎,把大量相關的數(shù)據(jù)存入系統(tǒng)所設計的數(shù)據(jù)庫中,可以按一定的模型組織起來,為這些數(shù)據(jù)的存儲、維護、檢索提供方便的操作,使系統(tǒng)可以方便、及時、準確地從數(shù)據(jù)庫中獲得所需的信息。在數(shù)據(jù)庫構建過程中,需要遵循以下基本原則:

(1)實現(xiàn)數(shù)據(jù)庫構建的標準化和規(guī)范化。

(2)對表中參數(shù)使用統(tǒng)一命名規(guī)則,并添加清晰易懂注釋信息。

(3)使用自定義域定義出現(xiàn)頻率高的字段,有利于調(diào)整和修改。

(4)設置常用的隱藏字段來滿足特殊需要, 使數(shù)據(jù)庫表的設計更加符合系統(tǒng)的具體應用。

1.2 語義分析技術

在一個社會網(wǎng)絡中常有節(jié)點之間的信息交流??梢詫@種社會網(wǎng)絡進行分析的一種強大的用來獲得和理解文本信息的技術被稱為語義分析技術。作為一個在人工智能和計算語言學的方法,它為知識推理和語言提供了一個結構和過程。

對此,將技術文檔中的句子提取出來,根據(jù)語義中包含的目標詞內(nèi)容進行語義類型的分析,并形成一種語義搭配,從而對傳統(tǒng)的檢索技術進行改進,找出語義相近的內(nèi)容,設計檢索系統(tǒng)可以檢索到相近的語句內(nèi)容。計算機的語義分析應用于技術文檔的分析,可以消除專家們在提煉文檔內(nèi)容過程中的主觀意見,計算機語義分析則客觀的檢索文檔中可能與檢索的關鍵詞相關的內(nèi)容。

由于檢索時需要選定目標詞匯,在系統(tǒng)設計過程中,根據(jù)用戶檢索不同目標詞,系統(tǒng)設置了記憶功能,對用戶感興趣的內(nèi)容進行整理歸納,并對新用戶進行推薦,節(jié)約了用戶再次對相同內(nèi)容查詢時檢索的時間。而隨著文檔數(shù)逐漸增多,文檔相關詞匯也在不斷增加,檢索系統(tǒng)不斷自我完善,區(qū)別文檔語義和詞義的精確度會有所提高。

2 水環(huán)境管理技術庫設計

在技術庫實現(xiàn)過程中,用戶可根據(jù)系統(tǒng)的功能,在文檔中自動提取技術文檔的參數(shù)值,并作為計算參數(shù)存入知識規(guī)則庫。系統(tǒng)可以根據(jù)文檔內(nèi)容自動分析文檔成分,并提出有價值的知識供使用者查閱及學習。

2.1 技術庫邏輯結構設計

遼河流域水環(huán)境管理技術庫的構建主要包括技術文檔信息表、關鍵字詞典表、本地化參數(shù)表及參數(shù)屬性表等試題。各實體的邏輯設計如下:

2.1.1 類別

根據(jù)“分區(qū)、分類、分級、分期”的基本理念,將技術庫文檔進行分類,將技術文檔數(shù)據(jù)規(guī)范化管理,更加高效科學。

2.1.2 技術文檔

技術文檔可以存儲在本數(shù)據(jù)表中,用戶可以通過查詢此數(shù)據(jù)表來查看技術文檔的詳細內(nèi)容。

2.1.3 關鍵字詞典

技術文檔通過檢索比對關鍵字詞典表篩選有用內(nèi)容和知識,系統(tǒng)可以對篩選內(nèi)容作進一步處理。

2.1.4 本地化參數(shù)

根據(jù)對上述系統(tǒng)的詳細分析,針對不同地域使用不同的數(shù)據(jù)進行計算,將數(shù)據(jù)更精確化,是計算結果更加準確。

2.1.5 參數(shù)屬性

每一個本地化參數(shù)對應一個或多個屬性,此數(shù)據(jù)表將用來存儲本地化參數(shù)的屬性。

2.2 技術庫物理結構設計

對技術文檔的主要相關內(nèi)容采用Oracle數(shù)據(jù)庫進行建表存儲,遼河流域水環(huán)境管理技術庫數(shù)據(jù)庫構建了以下屬性表:水環(huán)境管理技術文檔類別表(編號,類別名稱,類別描述),水環(huán)境管理技術文檔表(編號,名稱,描述,所屬類別,上傳時間,操作員,路徑),水環(huán)境管理技術關鍵字詞典表(編號,關鍵字,關鍵字描述,關鍵字等級),水環(huán)境管理技術本地化參數(shù)表(編號,文檔編號,參數(shù)名稱,參數(shù)描述,備注),水環(huán)境管理技術參數(shù)屬性表(編號,屬性編號,屬性值,參數(shù)表示區(qū)域)。

通過對項目需求的分析及前期設計,完成了技術庫表的建立,并建立了數(shù)據(jù)表之間的邏輯關系,實現(xiàn)了表之間的相互關聯(lián)。

3 水環(huán)境管理知識規(guī)則庫設計

根據(jù)水環(huán)境技術庫的要求,將技術文檔中各種內(nèi)容進行整理,并將那些較為重要的內(nèi)容存入輔助的知識規(guī)則庫。知識規(guī)則庫的設計是基于水環(huán)境管理的技術庫以及政策庫文檔的收集分析而形成的。系統(tǒng)管理員根據(jù)實際情況收集技術、政策文檔并上傳,并將實際內(nèi)容存儲于數(shù)據(jù)庫中,供分析模塊分析使用。通過對技術庫以及政策庫內(nèi)存儲的文檔進行分析,并將分析內(nèi)容進行整理,存入知識規(guī)則庫中。

系統(tǒng)通過使用者提交文檔,并對文檔內(nèi)容形式進行劃分,區(qū)別公式、表格以及文本等內(nèi)容,并對不同的內(nèi)容進行不同的處理方式。對文本內(nèi)容才去傳統(tǒng)的文本分析,提取有用的內(nèi)容并將這些內(nèi)容進行進一步的篩選處理,提供給用戶;對表格內(nèi)容,系統(tǒng)提取了表名并將表格內(nèi)容呈現(xiàn)給用戶;對于文檔中的公式內(nèi)容,文檔提取出了部分公式介紹內(nèi)容對公式進行注釋,同時提取保存公式內(nèi)容的圖片存入數(shù)據(jù)庫,而公式的存儲則需要人工協(xié)助錄入,實現(xiàn)對文檔的半智能分析。

4 結論

本文根據(jù)遼河流域現(xiàn)階段水環(huán)境管理現(xiàn)狀,通過對水環(huán)境相關的技術文檔進行整理存儲,并采用語義分析方法對存儲文檔進行分析,根據(jù)關鍵字詞典進行分析預測,將各種不規(guī)則的文檔內(nèi)容進行統(tǒng)一整理,提取表格、公式及關鍵文本等相關內(nèi)容,并將其存儲為知識規(guī)則,以便于用戶對關鍵技術的查閱和學習。

參考文獻

[1]孟偉.遼河流域水污染治理和水環(huán)境管理技術體系構建[J].中國工程科學,2013(03):4-10 .

[2]程麗麗.企業(yè)信息化建設中數(shù)據(jù)庫的結構設計應用[J].福建電腦,2008(07):41-42.

[3]李博湘.數(shù)據(jù)庫設計技巧[J].科技情報開發(fā)與經(jīng)濟,2006(19):237-238.

[4]王水利,黃廣君.基于語義分析的查詢擴展方法[J].計算機工程,2011(08):77-79.

[5]劉云峰,齊歡.中文信息的潛在語義分析[J].華南理工大學學報,2004.

作者簡介

夏廣鋒,現(xiàn)任職于遼寧省環(huán)境科學研究院,主要從事水污染及大氣污染治理方面研究工作。

付立冬,現(xiàn)任職于沈陽理工大學。主要研究方向為計算機應用技術。

吳赫,現(xiàn)為沈陽理工大學研究生。計算機應用技術專業(yè)。

作者單位

1.遼寧省環(huán)境科學研究院 遼寧省沈陽市 110161

2.沈陽理工大學信息科學與工程學院 遼寧省沈陽市 110159

猜你喜歡
語義分析遼河流域
遼寧省遼河流域石油煉制排放限值的制定
遼河流域水生態(tài)管理指標體系構建
優(yōu)化的NSGA-Ⅱ方法在遼河流域水資源綜合管理中的應用研究
遼河流域水文特性分析
中文短文本語法語義相似度算法
遼河流域水環(huán)境管理對策研究
遼河流域水污染治理技術評估軟件的開發(fā)與應用
东港市| 凤山县| 大姚县| 太保市| 陆良县| 台州市| 纳雍县| 金湖县| 开阳县| 友谊县| 汉源县| 镇雄县| 嘉峪关市| 芦山县| 武乡县| 平舆县| 英德市| 都匀市| 西畴县| 九寨沟县| 安龙县| 南川市| 镇平县| 全南县| 凌源市| 林周县| 祁东县| 高雄市| 八宿县| 松江区| 军事| 土默特右旗| 彭水| 敦化市| 西城区| 淅川县| 阳西县| 乃东县| 拉萨市| 筠连县| 大冶市|