国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的民國繪畫平臺的設(shè)計(jì)與研究

2023-06-12 05:49趙偉男俎再泉康玉暉夏方方候霞
電腦知識與技術(shù) 2023年11期
關(guān)鍵詞:知識圖譜

趙偉男 俎再泉 康玉暉 夏方方 候霞

關(guān)鍵詞:知識圖譜;圖數(shù)據(jù)庫;Echarts圖表庫;漸進(jìn)式框架;Web開發(fā)

0 引言

隨著信息技術(shù)的高速發(fā)展,信息的傳播方式呈現(xiàn)出多元化的趨勢,新媒體成為文化傳播的新方式,它的應(yīng)用改變了以往人們只能被動接收信息的狀況、打破了文化傳播地域性的限制,人們能夠主動且迅速地獲取到文化內(nèi)容,同時(shí)將自己獲得的信息傳遞出去,使得文化的傳播更加廣泛[1]。

為適應(yīng)新時(shí)代文化傳播方式,線下博物館也開始了文物數(shù)字化的轉(zhuǎn)變。當(dāng)下,比較成熟的實(shí)現(xiàn)成果是博物館網(wǎng)站[2],但其中的內(nèi)容僅是對獨(dú)立的一個(gè)作品展覽介紹,沒有將眾多的內(nèi)在知識關(guān)聯(lián)起來,難以充分展現(xiàn)文化內(nèi)容和數(shù)據(jù)價(jià)值。知識圖譜技術(shù)能使獨(dú)立數(shù)據(jù)形成實(shí)體與實(shí)體之間的關(guān)聯(lián),作用在博物館數(shù)據(jù)集中,能充分展示出作品之間的深層次關(guān)系,從而豐富作品的展示形式。

本文提出一種基于知識圖譜技術(shù)來對民國繪畫、畫家信息進(jìn)行知識組織的方案,并設(shè)計(jì)了基于知識圖譜的書畫作品平臺。

1 書畫類知識圖譜數(shù)據(jù)模型構(gòu)建

1.1 數(shù)據(jù)獲取

數(shù)據(jù)獲取的主要任務(wù)是完成對民國畫作、作者數(shù)據(jù)信息的收集,數(shù)據(jù)來源包括百度百科、維基百科、Google學(xué)術(shù)等方面。但從網(wǎng)絡(luò)獲取的知識數(shù)據(jù)多是一些半結(jié)構(gòu)化的數(shù)據(jù),該形式不契合關(guān)系數(shù)據(jù)庫中數(shù)據(jù)表的強(qiáng)關(guān)聯(lián)性的結(jié)構(gòu),但是又包含分離語義元素的標(biāo)簽或數(shù)據(jù)字段的結(jié)構(gòu)。因此,本文采用爬蟲技術(shù)進(jìn)行數(shù)據(jù)爬取,對獲取的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行一定的處理,為后續(xù)抽取實(shí)體和實(shí)體關(guān)系形成知識圖譜做準(zhǔn)備。

從網(wǎng)站上爬取相應(yīng)數(shù)據(jù)需要用到解析技術(shù),本文數(shù)據(jù)解析采用了Beautiful Soup[3]技術(shù)來對DOM樹解析,例如使用如下方式對某一個(gè)知識節(jié)點(diǎn)進(jìn)行獲取。

Beautiful Soup技術(shù)主要是利用DOM樹的結(jié)構(gòu)化標(biāo)簽的特性,通過按照節(jié)點(diǎn)名稱搜索,屬性搜索,節(jié)點(diǎn)文本搜索等方式對標(biāo)簽進(jìn)行抽取,最后序列化到本地磁盤。

使用網(wǎng)絡(luò)爬蟲獲取的數(shù)據(jù)由于比較混亂,還不能作為實(shí)體以及關(guān)系抽取的數(shù)據(jù)源,因此需要對數(shù)據(jù)進(jìn)行清洗,即剔除不符合標(biāo)準(zhǔn)的數(shù)據(jù),對數(shù)據(jù)所屬類型進(jìn)行分類等。最終經(jīng)過一系列的操作,獲得了干凈的數(shù)據(jù)源,接下來所要做的操作便是對實(shí)體以及關(guān)系的抽取。

1.2 領(lǐng)域知識建模

知識領(lǐng)域建模需要對數(shù)據(jù)進(jìn)行實(shí)體以及實(shí)體間關(guān)聯(lián)的抽取。一般來講,相同的數(shù)據(jù)可以通過多種模式方法來定義,設(shè)計(jì)一個(gè)優(yōu)秀的模式可以避免數(shù)據(jù)的冗余,減少數(shù)據(jù)庫的存儲空間及維護(hù)的成本。

為此,通過對畫作、作者延伸知識的特征分析,總共抽取出7類實(shí)體和10類關(guān)系:

1) 實(shí)體類型:作者籍貫、作者、畫作、畫作風(fēng)格、畫作類型、題詩、鈐印7類實(shí)體。

2) 關(guān)系類型:作者徒弟關(guān)系、作者籍貫關(guān)系、作者創(chuàng)作鈐印關(guān)系、朋友關(guān)系、擅長風(fēng)格關(guān)系、作者代表作關(guān)系、畫作題詩關(guān)系、畫作所屬鈐印關(guān)系、畫作風(fēng)格關(guān)系、畫作類型關(guān)系。

本文構(gòu)建的知識圖譜示例如圖1所示。其中圓用來標(biāo)識實(shí)體,實(shí)體與實(shí)體間的關(guān)系由圖中的邊定義。例如“ 張大千”與“ 萬壽山昆明湖”的關(guān)系為“au?thor_representPainting_painting”,即張大千的代表作為萬壽山昆明湖。其他實(shí)體之間的關(guān)聯(lián)形成與上述情況類似。

2 基于知識圖譜的書畫作品平臺

2.1 系統(tǒng)設(shè)計(jì)

針對書畫作品展的需求,定義系統(tǒng)功能需求包含如下內(nèi)容:

1) 首頁使用山水畫,借助輪播圖技術(shù)展示。

2) 頭部功能模塊區(qū)域,定義“首頁”“畫作”“作者”“主題”四個(gè)模塊,點(diǎn)擊頁面跳轉(zhuǎn)至相應(yīng)的模塊區(qū)域。搜索模塊點(diǎn)擊后可輸入文字,點(diǎn)擊搜索按鈕后跳轉(zhuǎn)頁面。

3) 畫作瀏覽模塊,展示許多畫作的縮略圖,隨著頁面下滑不斷填入新的畫作,鼠標(biāo)懸浮顯示畫作基本信息,點(diǎn)擊跳轉(zhuǎn)詳情頁面。

4) 作者瀏覽模塊,展示許多作者的縮略圖,隨著頁面下滑不斷填入新的作者,鼠標(biāo)懸浮顯示作者基本信息,點(diǎn)擊跳轉(zhuǎn)詳情頁面。

5) 主題模塊,展示畫作的三種主題:“山水”“人物”“花鳥”,點(diǎn)擊某個(gè)主題跳轉(zhuǎn)至相應(yīng)畫作主題展示區(qū)域。

6) 畫作詳情模塊,主體區(qū)域展示畫作圖片,一旁注明畫作完整信息。此頁面中根據(jù)知識圖譜技術(shù)推薦與本畫作具有關(guān)聯(lián)的畫作列表,并提供“換一換”功能。

7) 作者詳情模塊,展示作者基本信息、作者畫作。實(shí)現(xiàn)一個(gè)中國地圖,地圖上注明作者生平所經(jīng)過地點(diǎn)、作畫地點(diǎn)。

本方案的核心目標(biāo)是“多關(guān)系圖”的信息可視化。結(jié)合知識圖譜的特征、技術(shù)原理和傳統(tǒng)信息可視化方法,可以將知識圖譜可視化的過程,歸納為“確定知識主題(主題層)-處理與分析數(shù)據(jù)(數(shù)據(jù)層)-構(gòu)建數(shù)據(jù)三元組(關(guān)系層)-進(jìn)行可視化映射(可視層)”四個(gè)步驟[4]。系統(tǒng)架構(gòu)如圖2所示。

系統(tǒng)原型的實(shí)現(xiàn),從開發(fā)流程上來說,大致可以歸為Neo4j數(shù)據(jù)庫設(shè)計(jì)與存儲(數(shù)據(jù)層與關(guān)系層)、后端數(shù)據(jù)接口的實(shí)現(xiàn)、前端布局與交互實(shí)現(xiàn)(可視層)三個(gè)部分內(nèi)容[5]。本文將從上述三個(gè)模塊展開論述。

2.2 Neo4j 數(shù)據(jù)庫的設(shè)計(jì)與存儲

最開始的數(shù)據(jù)集是非結(jié)構(gòu)化的,語義并不明確,通過構(gòu)建書畫類知識圖譜數(shù)據(jù)模型,人工定義實(shí)體與關(guān)系,再經(jīng)過幾輪數(shù)據(jù)清洗后,數(shù)據(jù)呈現(xiàn)出具有半結(jié)構(gòu)化層次結(jié)構(gòu)且語義清晰的數(shù)據(jù)集。將其分類存入csv文件中后,在Neo4j數(shù)據(jù)庫中進(jìn)行導(dǎo)入,最終實(shí)現(xiàn)了數(shù)據(jù)的存儲。

根據(jù)需要,數(shù)據(jù)庫中設(shè)計(jì)了“作者”“畫作”“題詩”“印章”“畫作類型”“地區(qū)”“畫作風(fēng)格”幾種實(shí)體,以及“作者祖籍”“畫作風(fēng)格”“作者朋友”“畫作題詩”“畫作印章”“畫作風(fēng)格”幾種關(guān)系。

利用上述節(jié)點(diǎn)與關(guān)系,構(gòu)建知識圖譜三元組,例如,“[ 作者”-“祖籍”-“地區(qū)”]、“[ 畫作”-“風(fēng)格”-“畫作”]等,最后將各個(gè)節(jié)點(diǎn)及關(guān)系數(shù)據(jù)存儲到數(shù)據(jù)庫中。存儲成功后,經(jīng)測試,此數(shù)據(jù)庫可以實(shí)現(xiàn)對畫作、作者及各種關(guān)系數(shù)據(jù)進(jìn)行快速檢索,為前端數(shù)據(jù)的快速響應(yīng)與推理提供保障。

2.3 后端數(shù)據(jù)接口的實(shí)現(xiàn)

伴隨著DOM操作庫與模板引擎的出現(xiàn),市面上的項(xiàng)目逐漸由原先的后端主導(dǎo)模式轉(zhuǎn)向富前端化,將更多的交互邏輯交由前端來實(shí)現(xiàn),后端只保留數(shù)據(jù)支持與運(yùn)維部署。此項(xiàng)目正是因?yàn)楦磺岸嘶?,后端僅實(shí)現(xiàn)為前端提供數(shù)據(jù)接口功能。

在使用的SSM(Spring+SpringMVC+MyBatis) 框架中,Spring負(fù)責(zé)創(chuàng)造bean容器;SpringMVC負(fù)責(zé)配置前端控制器;MyBatis負(fù)責(zé)與數(shù)據(jù)庫進(jìn)行交互,并取得原始數(shù)據(jù)。

數(shù)據(jù)請求處理流程如圖3所示。在請求發(fā)出后,前端控制器將請求分發(fā)給相應(yīng)的控制器(Controller) ,控制層調(diào)用模型處理業(yè)務(wù)(Service) ,在Service層調(diào)用持久層接口(dao) 取得數(shù)據(jù)庫原始數(shù)據(jù)。最終,在Ser?vice層將原始數(shù)據(jù)封裝為對象,通過第三方工具Jack?Son轉(zhuǎn)化為json格式響應(yīng)給前端。

2.4 頁面布局與交互實(shí)現(xiàn)

在結(jié)合系統(tǒng)功能需求并綜合考慮市面上成型網(wǎng)頁設(shè)計(jì)元素后,本項(xiàng)目共設(shè)立“主界面”“瀏覽畫作”“瀏覽作者”“畫作詳情”“作者詳情”五個(gè)關(guān)鍵界面,最終使用墨刀平臺進(jìn)行設(shè)計(jì)稿的設(shè)計(jì)。在設(shè)計(jì)稿實(shí)現(xiàn)前確定使用Vue框架開發(fā)單頁Web應(yīng)用來為頁面提供更快的訪問速度,使用Echarts圖標(biāo)庫來為數(shù)據(jù)呈現(xiàn)出更好的可視化效果。

1) 主界面

界面主體分為頭部區(qū)域與主體區(qū)域。頭部區(qū)域Logo部分點(diǎn)擊后跳轉(zhuǎn)頁面首頁,中間四個(gè)功能模塊點(diǎn)擊跳轉(zhuǎn)至相應(yīng)區(qū)域,右邊搜索圖標(biāo)點(diǎn)擊后彈出搜索框供文字鍵入,在搜索框中有文字的情況再次點(diǎn)擊搜索圖標(biāo)跳轉(zhuǎn)搜索結(jié)果頁面。主體區(qū)域選材為卷類型畫作關(guān)鍵部位截取,點(diǎn)擊后跳轉(zhuǎn)至相應(yīng)詳情界面,鼠標(biāo)懸浮畫作會彈出左右切換按鈕,默認(rèn)情況下每隔5s自動切換下一張。

2) 瀏覽界面

瀏覽界面分為瀏覽畫作與瀏覽畫家兩個(gè)界面,在頁面頭部分別點(diǎn)擊“民國繪畫”“民國畫家”進(jìn)入,兩頁面主體功能邏輯幾乎相同。因圖畫、作者圖片數(shù)據(jù)較多,為優(yōu)化頁面響應(yīng)速度,前端使用插件v-lazy實(shí)現(xiàn)圖片的懶加載,優(yōu)先加載頁面可視區(qū)域的圖片,另外,圖片均采用小于256kb的縮略圖。鼠標(biāo)懸浮在圖片上會顯示相應(yīng)圖片的名稱信息,點(diǎn)擊后跳轉(zhuǎn)至詳情頁面。

3) 詳情界面

詳情界面分為畫家、畫作兩個(gè)詳情界面,畫作詳情界面展示了畫作的完整圖片,其下注明畫作的相關(guān)信息,諸如畫作名稱、畫家、畫作規(guī)格等。在底部提供相關(guān)畫作推薦功能,根據(jù)構(gòu)建的“[ 畫作”-“關(guān)系”-“畫作”]三元組進(jìn)行內(nèi)容的提供。

作者詳情界面如圖4所示,主體區(qū)域分為左右兩個(gè)部分。右側(cè)部分為畫家的基本信息,通過上側(cè)導(dǎo)航欄可查看當(dāng)前畫家的畫作列表、生平。左側(cè)部分使用Echarts技術(shù)實(shí)現(xiàn)中國地圖,顯示畫家生平所經(jīng)歷之處,包括“祖籍”“游歷”“作畫”等地點(diǎn),配置data數(shù)據(jù)項(xiàng)來實(shí)現(xiàn)鼠標(biāo)懸浮在相關(guān)地區(qū)顯示畫家在此地的活動信息。

3 結(jié)束語

本文提出了一種基于知識圖譜的書畫類作品平臺,通過圖譜的內(nèi)在關(guān)聯(lián)進(jìn)行知識的快讀導(dǎo)航。從系統(tǒng)設(shè)計(jì)方案入手,闡述了實(shí)際開發(fā)中知識圖譜技術(shù)與前端框架的使用。系統(tǒng)后端通過對數(shù)據(jù)進(jìn)行圖譜構(gòu)建、存儲,實(shí)現(xiàn)數(shù)據(jù)接口,為前端提供結(jié)構(gòu)化數(shù)據(jù)及實(shí)體關(guān)系表;通過分析數(shù)據(jù)接口中的數(shù)據(jù),前端對數(shù)據(jù)進(jìn)行雙向綁定與動態(tài)渲染,搭建了用戶友好型展示界面,可為用戶進(jìn)行高效的知識導(dǎo)航。

本次工作對書畫類知識圖譜的構(gòu)建和應(yīng)用進(jìn)行了一次有效探索,后期工作還需深入開展。如數(shù)據(jù)中畫作、作者的數(shù)據(jù)還不夠豐富。未來考慮將收集更多的畫作、作者信息,去構(gòu)建更大的知識圖譜,從而使知識圖譜在Web應(yīng)用中展現(xiàn)出更大的活力,為其他研究人員及開發(fā)人員提供更有價(jià)值的參考。

猜你喜歡
知識圖譜
國內(nèi)酒店品牌管理研究進(jìn)展的可視化分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展
敖汉旗| 绵阳市| 三原县| 广灵县| 浪卡子县| 应城市| 平山县| 枝江市| 玛沁县| 定远县| 衡东县| 柞水县| 宽城| 明溪县| 清新县| 开江县| 惠水县| 栾城县| 大同县| 新民市| 阳曲县| 石柱| 交口县| 尖扎县| 宁陵县| 朝阳市| 禄丰县| 招远市| 滦平县| 株洲市| 汉中市| 通河县| 石渠县| 乌兰察布市| 边坝县| 建瓯市| 崇州市| 宁南县| 平塘县| 赤壁市| 兴国县|