国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高原植物知識(shí)圖譜系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

2022-12-08 07:23:32史珂軒焦自程
現(xiàn)代計(jì)算機(jī) 2022年18期
關(guān)鍵詞:高原圖譜框架

史珂軒,焦自程

(西藏大學(xué)信息科學(xué)技術(shù)學(xué)院,拉薩 850000)

0 引言

隨著國(guó)內(nèi)的全面脫貧以及交通運(yùn)輸業(yè)的快速發(fā)展,高原地區(qū)的特殊地理風(fēng)貌逐漸向內(nèi)地民眾揭開(kāi)了神秘的面紗,但是對(duì)青藏高原地區(qū)特有的高原植物進(jìn)行調(diào)查后的結(jié)構(gòu)所知甚少。因?yàn)槠浞N類繁多、分布疏散、形態(tài)相似等特點(diǎn),使得高原植物的分析和辨識(shí)具有了一定的難度,讓非專業(yè)人士難從下手[1];以至于近些年,一些珍稀的高原植物因得不到有效的生態(tài)保護(hù),導(dǎo)致其消亡于歷史長(zhǎng)河中。至今為止,國(guó)內(nèi)外尚未有較為先進(jìn)的高原植物識(shí)別系統(tǒng)以及較為完整的高原植物知識(shí)圖譜統(tǒng),而現(xiàn)有的國(guó)內(nèi)外高原植物圖譜系統(tǒng)檢索冗余,特點(diǎn)不夠鮮明。雖然對(duì)于高原植物的囊括與介紹比較完整,但是缺乏檢索的直接性,最新物種的更新進(jìn)度較為緩慢。此外,國(guó)內(nèi)現(xiàn)有的一些植物圖譜和識(shí)別系統(tǒng),沒(méi)有顯著的識(shí)別特點(diǎn),多是針對(duì)生活中常見(jiàn)的普通、易辨認(rèn)的植物種類,沒(méi)有對(duì)高原植物做一個(gè)具有特殊地域性、特殊特征識(shí)別的內(nèi)容整理,不能滿足大多數(shù)用戶的需求[2]。

基于以上現(xiàn)象設(shè)計(jì)了一款能夠精確、簡(jiǎn)明索引高原植物,按植物種類進(jìn)行劃分,運(yùn)用高原植物特征進(jìn)行植物識(shí)別等多個(gè)功能的高原植物知識(shí)圖譜系統(tǒng),促進(jìn)高原植物的保護(hù)[3]。

1 平臺(tái)選用框架技術(shù)介紹

在平臺(tái)的前后端框架技術(shù)方面,后端開(kāi)發(fā)選用了Flask框架,主要為前端提供數(shù)據(jù)接口及服務(wù)器支撐;后臺(tái)管理模塊和前端模塊選擇了BootStrap,實(shí)現(xiàn)了數(shù)據(jù)及頁(yè)面視圖的雙向綁定更新。

1.1 Flask介紹

Flask是一個(gè)采用Python編寫的輕量級(jí)Web應(yīng)用框架。其WSGI工具箱采用Werkzeug,模板引擎則使用Jinja2。Flask使用BSD授權(quán)。其沒(méi)有默認(rèn)使用的數(shù)據(jù)庫(kù)、窗體驗(yàn)證工具。對(duì)于大多數(shù)小型網(wǎng)站的開(kāi)發(fā),使用SSH(Struts+Spring+Hibernat的一個(gè)JavaEE集成框架)即可以滿足需要。和其他輕量級(jí)框架相比,F(xiàn)lask框架有更好的擴(kuò)展性,這是其不可替代的的主要原因[4]。

1.2 BootStrap介紹

Bootstrap是美國(guó)Twitter公司的設(shè)計(jì)師Mark Otto和Jacob Thornton基于HTML、CSS、JavaScript合作開(kāi)發(fā)的簡(jiǎn)潔、直觀、強(qiáng)悍的前端開(kāi)發(fā)框架。Bootstrap提供了優(yōu)雅的HTML和CSS規(guī)范,即是由動(dòng)態(tài)CSS語(yǔ)言Less寫成。Less是一個(gè)CSS預(yù)處理器,使CSS具有動(dòng)態(tài)性,并能夠很方便地獲取數(shù)據(jù)的更新,實(shí)現(xiàn)頁(yè)面視圖與數(shù)據(jù)模型的交互[5]。

2 平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)

2.1 平臺(tái)總體設(shè)計(jì)

平臺(tái)使用MVC的編程模式和前后端分離的設(shè)計(jì)方式進(jìn)行開(kāi)發(fā)。對(duì)于前端,采用BootStrap框架將系統(tǒng)的各個(gè)可視化部分設(shè)計(jì)為一個(gè)個(gè)組件,通過(guò)具有相似功能的模塊直接調(diào)用組件就可以起到相同的效果,降低了代碼的復(fù)用性,節(jié)約開(kāi)發(fā)的時(shí)間成本,也有利于平臺(tái)內(nèi)容的動(dòng)態(tài)實(shí)現(xiàn)。對(duì)于后端,使用Flask框架做整合,并在WSGI中結(jié)合Neo4j圖數(shù)據(jù)庫(kù),實(shí)現(xiàn)對(duì)數(shù)據(jù)的增刪改查。

系統(tǒng)的整體結(jié)構(gòu)如圖1所示,其中,將可視化后的知識(shí)圖譜展示給用戶,主要是通過(guò)首頁(yè)的高原植物簡(jiǎn)介來(lái)完成,用戶可以大致了解高原植物的物種多樣性、使用價(jià)值以及保護(hù)意義;用戶可以通過(guò)圖譜的總體展示來(lái)了解每種植物的門類、各植物間的相互聯(lián)系和各植物的具體屬性;植物檢索可以幫助用戶認(rèn)識(shí)到具體植物的圖像信息、分布信息、醫(yī)學(xué)屬性等。面向后臺(tái)管理員的主要功能有圖數(shù)據(jù)庫(kù)中的關(guān)系數(shù)據(jù)、節(jié)點(diǎn)數(shù)據(jù)、屬性數(shù)據(jù)以及通過(guò)可視化接口實(shí)現(xiàn)對(duì)系統(tǒng)內(nèi)容的動(dòng)態(tài)增刪改查。

2.1.1 用戶模塊

用戶進(jìn)入圖譜首頁(yè)后可以看到高原植物的起源與歷史,大致認(rèn)識(shí)到高原植物的重要意義、瀕危程度以及生態(tài)保護(hù)的重要性。用戶可以看到圖譜的節(jié)點(diǎn)、關(guān)系和屬性圖示。在植物檢索模塊,用戶可以根據(jù)自己的需求進(jìn)行檢索,以獲取所需的具體植物信息。

2.1.2 后臺(tái)管理模塊

管理員可以通過(guò)系統(tǒng)的后臺(tái)管理實(shí)現(xiàn)對(duì)知識(shí)圖譜中的植物圖示進(jìn)行增刪改查的操作;可以根據(jù)植物種類的類別模塊進(jìn)行總體信息更新,也可以對(duì)某一具體植物信息進(jìn)行操作,并根據(jù)不同的需求分配不同的權(quán)限以此實(shí)現(xiàn)對(duì)不同數(shù)據(jù)信息的更新。

2.2 圖數(shù)據(jù)庫(kù)設(shè)計(jì)

本系統(tǒng)采用Neo4j圖數(shù)據(jù)庫(kù),為了更好、更高效地描述實(shí)體之間的關(guān)系,圖數(shù)據(jù)事務(wù)的設(shè)計(jì)嚴(yán)格遵循ACID性質(zhì),保證其原子性、一致性、隔離性和永久性的統(tǒng)一[6]。系統(tǒng)的圖數(shù)據(jù)庫(kù)如圖2所示。

系統(tǒng)根據(jù)圖1的整體設(shè)計(jì)得出的數(shù)據(jù)庫(kù)設(shè)計(jì)見(jiàn)表1。

表1 數(shù)據(jù)庫(kù)設(shè)計(jì)

2.3 重要技術(shù)實(shí)現(xiàn)

2.3.1 數(shù)據(jù)獲取

知識(shí)圖譜的數(shù)據(jù)獲取主要有兩種方式:一是半公開(kāi)或者公開(kāi)的數(shù)據(jù)集;二是抓取網(wǎng)絡(luò)上公開(kāi)的相關(guān)數(shù)據(jù)。系統(tǒng)結(jié)合兩種方式,以公開(kāi)數(shù)據(jù)集為主,以抓取網(wǎng)絡(luò)數(shù)據(jù)為補(bǔ)充,形成本系統(tǒng)的數(shù)據(jù)來(lái)源。引用openkg“大規(guī)模1.4億中文知識(shí)圖譜開(kāi)源下載”的數(shù)據(jù)集,對(duì)其進(jìn)行篩選獲得主要數(shù)據(jù),并對(duì)“中國(guó)植物志”中的半公開(kāi)數(shù)據(jù)進(jìn)行抓取作為數(shù)據(jù)的補(bǔ)充來(lái)源,因此確保了數(shù)據(jù)的完整性。

2.3.2 信息抽取

信息抽取主要涵蓋了實(shí)體抽取、關(guān)系抽取和屬性抽取。對(duì)于從openkg中獲取的公開(kāi)數(shù)據(jù)集,通過(guò)對(duì)其使用正則表達(dá)式(re函數(shù)庫(kù))進(jìn)行簡(jiǎn)單的數(shù)據(jù)篩選,就獲得了系統(tǒng)圖譜所需的候選知識(shí)單元;對(duì)于自行抓取的數(shù)據(jù)信息,采取Python中 的NumPy、Pandas、Matplotlib、Scipy等數(shù)據(jù)處理函數(shù)庫(kù)進(jìn)行數(shù)據(jù)的分析與處理,得到一系列離散的命名實(shí)體和實(shí)體間的關(guān)聯(lián)關(guān)系[7]。

2.3.3 知識(shí)融合

知識(shí)融合主要關(guān)鍵技術(shù)包括指代消解、實(shí)體消歧、實(shí)體鏈接和知識(shí)合并。通過(guò)信息抽取獲取的信息個(gè)體之間是扁平的,因此個(gè)體之間缺乏層次性和邏輯性,并且還存在冗余的信息碎片[8]。因此,需要知識(shí)融合技術(shù)將多個(gè)知識(shí)個(gè)體進(jìn)行整合,從而形成知識(shí)庫(kù)。通過(guò)設(shè)立encode_onehot方法對(duì)標(biāo)簽進(jìn)行編碼,對(duì)上述處理后的數(shù)據(jù)按照植物學(xué)的界門綱目科屬種進(jìn)行分類,同時(shí)對(duì)基于“實(shí)體-關(guān)系-實(shí)體”的三元組數(shù)據(jù)進(jìn)行數(shù)據(jù)整合,這只是合并過(guò)程中對(duì)三元組中的頂點(diǎn)、邊進(jìn)行任意多屬性的補(bǔ)充,從而形成最后的CSV數(shù)據(jù)文件,即property graph。

2.3.4 知識(shí)加工

知識(shí)加工主要包含以下三個(gè)方面:本體構(gòu)建、知識(shí)推理和質(zhì)量評(píng)估。將系統(tǒng)經(jīng)過(guò)上述步驟處理的知識(shí)進(jìn)行結(jié)構(gòu)化、網(wǎng)絡(luò)化,從而獲得完整的知識(shí)體系并確保了知識(shí)庫(kù)的質(zhì)量。將植物數(shù)據(jù)三元組中的節(jié)點(diǎn)按照植物類別和具體植物進(jìn)行本體的構(gòu)建,以此獲得本體的相似性。在知識(shí)圖譜的雛形構(gòu)建完成后,根據(jù)其自身屬性和鄰居信息對(duì)后續(xù)節(jié)點(diǎn)信息進(jìn)行節(jié)點(diǎn)分類,通過(guò)知識(shí)推理的方法獲取更為完整的植物知識(shí)圖譜系統(tǒng)。

3 結(jié)語(yǔ)

主要論述了基于neo4j圖數(shù)據(jù)庫(kù)和Flask框架的一個(gè)高原植物知識(shí)圖譜系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),重點(diǎn)介紹了項(xiàng)目的總體結(jié)構(gòu)設(shè)計(jì)以及圖數(shù)據(jù)庫(kù)的知識(shí)庫(kù)設(shè)計(jì)等內(nèi)容。通過(guò)采用知識(shí)融合、知識(shí)推理的技術(shù)來(lái)獲取完整、高效的知識(shí)庫(kù),最后通過(guò)BootStrap框架對(duì)高原植物知識(shí)庫(kù)進(jìn)行可視化顯示,基本達(dá)到了最終的目標(biāo)。

猜你喜歡
高原圖譜框架
框架
繪一張成長(zhǎng)圖譜
廣義框架的不相交性
高原往事
迸射
高原往事
高原往事
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
WTO框架下
法大研究生(2017年1期)2017-04-10 08:55:06
主動(dòng)對(duì)接你思維的知識(shí)圖譜
龙游县| 安徽省| 南平市| 凤翔县| 麻城市| 德州市| 成安县| 尉犁县| 合山市| 淳安县| 雷山县| 赞皇县| 莆田市| 郑州市| 博白县| 纳雍县| 沈阳市| 望江县| 南召县| 兴文县| 加查县| 靖远县| 探索| 四子王旗| 铁力市| 奉化市| 衡水市| 辉南县| 镶黄旗| 剑阁县| 枣强县| 花垣县| 昌江| 沂水县| 都安| 鄂州市| 宣武区| 南召县| 蓬安县| 武胜县| 岑巩县|