国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的金屬材料環(huán)境適應性可視化系統(tǒng)構建研究

2021-03-10 08:50西南技術工程研究所劉青林光文軍羅杰
網信軍民融合 2021年2期
關鍵詞:三元組數據源金屬材料

◎西南技術工程研究所 劉青林 光文軍 羅杰

裝備環(huán)境適應性是指武器裝備對環(huán)境的適應能力,是武器系統(tǒng)在實際應用或服役環(huán)境下的性能和可靠性達到理想環(huán)境下的程度。隨著金屬材料在武器裝備設計制造中廣泛使用,新型合金材料和處理工藝不斷出現,材料使用或服役的環(huán)境條件復雜多變,采集和積累的金屬材料效應數據日漸繁雜冗余,這與科研設計人員面對多數據源如何快速獲取所需金屬材料相關性能、對金屬材料的環(huán)境適應性數據進行可視化對比以幫助選材優(yōu)材的需求逐漸出現矛盾,而知識圖譜技術的發(fā)展為此類“數據豐富,知識貧乏,可視化效果差”的問題提供了新的技術解決思路,且在互聯(lián)網上的開放知識圖譜(比如Wikipedia、Freebase、DBpedia、Microsoft Concept Graph)中存在大量不同領域的結構化數據,為金屬材料環(huán)境適應性可視化系統(tǒng)的構建與實現提供了高質量數據源,系統(tǒng)的實現將促進金屬材料領域知識的共享和交換,提高其利用價值。

一、總體思路

知識圖譜是由相互鏈接的知識點組成的關系網絡數據庫,是解決知識表達和存儲管理的一種數據組織模式,由谷歌公司于2012 年率先提出這一概念,獲得了前所未有的關注。本文利用從開放知識圖譜DBpedia 中抽取的金屬材料領域數據構建了一個領域本體作為可視化圖譜的數據源,再通過SQL Server 數據庫存儲及處理此數據源,最后利用D3.js 構建了金屬材料知識圖譜的可視化系統(tǒng),總體思路框架見圖1。

二、金屬材料領域知識圖譜構建方法

(一)數據獲取

圖1 總體思路框架

圖2 金屬材料知識圖譜構建流程

DBpedia 是世界上最大的多領域開放知識圖譜之一,它從維基百科(Wikipedia)的詞條里擷取出結構化的數據,以強化維基百科的搜索功能。本文利用網絡爬蟲采集獲取常用金屬材料的科技文獻報告與DBpedia 中抽取的金屬材料領域數據構建了一個領域本體作為可視化系統(tǒng)的數據源,在該本體有4300 多個三元組,其中包含763 個類,1541 個實例以及113 個屬性。將源數據按照材料牌號、處理工藝、服役環(huán)境、性能表現等方式進行數據預處理,構建金屬材料環(huán)境適應性信息,具體如表1 所示。

(二)可視化知識圖譜構建

本文通過Python + SQL Server + D3.js 的技術框架實現了面向常用金屬材料領域的知識圖譜,其主要構建流程如圖2。

金屬材料知識圖譜的構建過程主要分為數據源的采集與存儲、結構化數據的構建以及可視化系統(tǒng)的開發(fā)等三個步驟,對DBpedia 獲取數據通過Redis、Neo4j、SQL Server 等數據處理工具的清洗形成金屬材料知識圖,主要流程如下:

1、源數據的采集與存儲:本文采用Python 語言的Scrapy 爬蟲框架實現了互聯(lián)網文本數據的分布式爬取,將爬取得到的金屬材料文獻數據存入Redis 數據庫中。

2、結構化數據的構建:通過自動化腳本對Redis 中的數據進行進一步的數據清洗后保存至格式文件中,再將格式文件導入至Neo4j 圖形數據庫和SQL Server 關系型數據庫中。

3、可視化系統(tǒng)的構建:使用Python 3.7 版本的編程語言完成了爬蟲、數據清洗的處理,使用D3.js 實現數據的可視化。

(三)數據庫結構

本文通過SQL Server 關系型數據庫實現了金屬材料環(huán)境適應性數據的存儲及管理。數據庫包括四張表,其中MetallicMaterial、TreatmentProc 及EnvTest 三張實體表分別存儲了材料牌號和處理工藝、環(huán)境因素與試驗的相關信息,EnvSuitability 表則存儲了金屬材料知識圖譜中的事實三元組信息。其中MetallicMaterial 表、TreatmentProc 表與EnvTest表是多對多的關系,通過MetalBrand 和TreatmentProcID 兩個字段進行了表間關系的映射,EnvSuitability 表則存儲了知識圖譜中的三元組。

表1 常用金屬材料環(huán)境適應性信息表

圖3 數據庫結構

圖4 常用金屬材料的可視化圖譜

具體地說,在數據庫中EnvTest 和EnvSuitability 兩張表都表示了金屬材料環(huán)境適應性的試驗結果信息,EnvTest存儲了原始的數據,而EnvSuitability 則把關系映射為了三元組,即EnvSuitability 中的數據來自于EnvTest。在知識圖譜中的關系有兩種:一種稱作屬性(property),而另一種稱為關系(relation)。表EnvSuitability 只存儲實體間的關系,屬性由實體表檢索得到,在EnvSuitability表中的字段 type,就是用來區(qū)分三元組中的關系是實體間的關系還是實體的屬性,便于之后可視化系統(tǒng)的構建。

(四)可視化系統(tǒng)的設計與實現

本文的可視化系統(tǒng)以Django 框架搭建了Web Server,Web 前端則通過D3.js 實現了基于知識圖譜的金屬材料環(huán)境適應性數據可視化。該系統(tǒng)可以檢索不同牌號的金屬材料獲取相應的圖譜信息,并會根據數據的更新來調整有向圖版本。本文選取了常用的6 種金屬材料和其對應試驗環(huán)境下的效應數據進行可視化的演示,演示結果如圖4 所示,其中藍色的代表知識圖譜中的實體,紅色代表屬性,綠色的是實體和屬性之間的關系。

三、 總結與展望

本文通過屬性值融合的方法研究構建了異構多數據源的常用金屬材料環(huán)境適應性知識圖譜,以Python 編程語言中的Scrapy 爬蟲和Django Web 兩種框架搭建了“數據爬取-數據存儲-數據清洗-數據應用”的整套處理流程,并以D3.js 為基礎實現了金屬材料環(huán)境適應性數據的可視化。

隨著大數據技術的發(fā)展,對裝備環(huán)境適應性數據進行深度挖掘和可視化展示的研究成為一項全新的課題,通過對金屬材料環(huán)境適應性數據的分類和知識圖譜技術的運用,可以更為深入的了解和研究裝備提供數據支持,為科研試制人員在型號設計時進行材料選擇、優(yōu)化材料性能提供科學決策參考依據。

猜你喜歡
三元組數據源金屬材料
特征標三元組的本原誘導子
關于余撓三元組的periodic-模
把握考查角度 學好金屬材料
Web 大數據系統(tǒng)數據源選擇*
基于不同網絡數據源的期刊評價研究
負載型納米金屬材料的最新研究進展
沈陽宇金屬材料研究所
新型金屬材料在現代城市建設中的應用
基于三元組的擴頻碼構造及其性能分析
基于真值發(fā)現的沖突數據源質量評價算法