国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“數(shù)字敦煌”資源庫架構(gòu)設(shè)計與實現(xiàn)

2020-06-15 05:49俞天秀吳健趙良丁曉宏葉青
敦煌研究 2020年2期
關(guān)鍵詞:系統(tǒng)架構(gòu)網(wǎng)絡(luò)拓撲資源庫

俞天秀 吳健 趙良 丁曉宏 葉青

內(nèi)容摘要:本文綜合考慮滿足高性能、高可用、可擴展和安全等需求,設(shè)計了從底層平臺硬件至上層用戶功能的分層架構(gòu),采用了動態(tài)資源與靜態(tài)資源分離、應(yīng)用服務(wù)器與數(shù)據(jù)庫分離、負載均衡和數(shù)據(jù)庫主從復制、緩存、應(yīng)用拆分和壓縮等技術(shù),實現(xiàn)了“數(shù)字敦煌”資源庫的系統(tǒng)功能,并優(yōu)化和提高了性能;開發(fā)了高精度圖像快速瀏覽、洞窟空間結(jié)構(gòu)構(gòu)建、元數(shù)據(jù)存儲與檢索等主要功能,最終“數(shù)字敦煌”資源庫通過互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)展示,達到全球共享的目的。

關(guān)鍵詞:數(shù)字敦煌;資源庫;系統(tǒng)架構(gòu);網(wǎng)絡(luò)拓撲

中圖分類號:K854.3 ?文獻標識碼:A ?文章編號:1000-4106(2020)02-0120-11

The Design and Implementation of the Framework for

the Database of“Digital Dunhuang”

YU Tianxiu1,2,3,4,5 WU Jian1,2,3,4 ZHAO Liang1,2,3,4 DING Xiaohong1,2,3,4 YE Qing6

(1. Cultural Heritage Digitization Institute, Dunhuang Academy, Dunhuang, Gansu 736200; 2. National Research Center for Conservation of Ancient Wall Paintings and Earthen Sites, Dunhuang, Gansu 736200;

3. Key Scientific Research Base for Conservation of Ancient Wall Paintings of SACH, Dunhuang,

Gansu 736200; 4. Key Laboratory for Conservation of Ancient Wall Paintings and Earthen Sites,

Gansu Province, Dunhuang, Gansu 736200; 5. College of Intelligence and Computing, Tianjian University,

Tianjin 300072; 6. Gansu Win Think Network Technology Co., Ltd. Lanzhou, Gansu 730000)

Abstract: This paper briefly introduces the Digital Dunhuang project, summarizes the present condition of domestic and overseas databases containing material about Dunhuang, and analyzes the characteristics and difficulties of constructing such a data bank. Considering the overall requirements of high performance, high availability, expandability, and security, a layered architecture beginning from the underlying hardware platform to the upper level of user function has been designed. The initial level of construction has realized the primary system functions of a Digital Dunhuang database and even optimized and improved several aspects of data storage and operation with methods such as the separation of dynamic and static resources, separation of application server and database, load balancing, a master-replica and cache of databases, application multifunctioning, and data compression. Many functions like the quick browsing of high resolution images, analysis of the spatial structure and construction of caves, metadata storage, and quick retrieval of information have all been developed with the goal of sharing the Digital Dunhuang database for both online and mobile use.

Keywords: Digital Dunhuang; database; system architecture; network topology

(Translated by WANG Pingxian)

一 “數(shù)字敦煌”項目概況

為了敦煌石窟的永久保存、永續(xù)利用,敦煌研究院20世紀90年代初開始數(shù)字化探索[1]。近30年組織實施的“數(shù)字敦煌”項目,包括敦煌石窟數(shù)字化、“數(shù)字敦煌”數(shù)字資產(chǎn)管理系統(tǒng)、永久存儲體系和資源庫四個方面。

敦煌石窟數(shù)字化,采用先進的數(shù)字化技術(shù)將敦煌石窟進行數(shù)字化。

“數(shù)字敦煌”數(shù)字資產(chǎn)管理系統(tǒng)(DAMS),主要目標是對敦煌石窟保護、研究和弘揚各領(lǐng)域數(shù)字資產(chǎn)的生產(chǎn)、保存、展示等進行科學的管理,在統(tǒng)一的系統(tǒng)架構(gòu)下,實現(xiàn)各領(lǐng)域知識高度關(guān)聯(lián),達到數(shù)字資產(chǎn)的高效利用。數(shù)字資產(chǎn)指與敦煌石窟相關(guān)的所有數(shù)字資源,包括敦煌石窟大遺址、壁畫、彩塑和建筑數(shù)字化成果,藏經(jīng)洞出土文物數(shù)字化成果,敦煌學研究文獻數(shù)字資源,石窟保護數(shù)據(jù)(環(huán)境監(jiān)測數(shù)據(jù)、保護材料數(shù)據(jù)、修復方案等),石窟考古資料(考古報告、考古測繪圖、出土文物信息等),石窟展示、展覽、新聞宣傳等方面的資料。

“數(shù)字敦煌”永久存儲體系,指導數(shù)字資產(chǎn)長期保存而建立的模型,是數(shù)據(jù)生產(chǎn)追蹤、數(shù)據(jù)校驗、存儲監(jiān)控、文件格式的提升和轉(zhuǎn)換,數(shù)據(jù)的備份及容災(zāi),以及存儲規(guī)章制度等的集合體。

“數(shù)字敦煌”資源庫,基于“數(shù)字敦煌”資產(chǎn)管理系統(tǒng)(DAMS),對數(shù)字資產(chǎn)的成果進行再加工,形成新的數(shù)字產(chǎn)品。結(jié)合大數(shù)據(jù)分析等技術(shù)手段,形成敦煌石窟知識圖譜,高度關(guān)聯(lián)敦煌石窟知識等信息。

二 國內(nèi)外有關(guān)敦煌資料資源庫應(yīng)用現(xiàn)狀

國內(nèi),敦煌研究院于2007年研發(fā)了“敦煌藝術(shù)圖像數(shù)據(jù)庫”[2],利用傳統(tǒng)膠片拍攝并數(shù)字化掃描,其內(nèi)容包括佛傳、飛天、供養(yǎng)人、服飾、圖案、瑞像、經(jīng)變畫、山水畫、音樂9個專題共1309幅圖像。該庫沒有完整壁畫的數(shù)字化成果,圖像數(shù)量有限;其它與敦煌石窟有關(guān)的數(shù)據(jù)庫基本都是敦煌文獻數(shù)據(jù)庫,沒有敦煌石窟整窟壁畫、彩塑等數(shù)據(jù),例如敦煌文獻數(shù)字圖書館[3]收錄北敦、斯號、英藏(其他)、伯號、法藏(其他)、俄藏等14類敦煌文獻,收入圖版文件51萬多個,敦煌學信息資源庫[4]收錄了與敦煌學相關(guān)的12萬余篇期刊文章和會議論文。

國際上,“國際敦煌項目”(the International Dunhuang Project,IDP)[5]于1994年啟動,其目標是敦煌及絲綢之路東段其他考古遺址出土的寫本、繪畫、紡織品以及藝術(shù)品的信息與圖像能在互聯(lián)網(wǎng)上自由地獲取,并通過教育與研究項目鼓勵用戶利用這些資源,數(shù)字圖像累計525,356張,但是不包括敦煌石窟壁畫。敦煌研究院與美國梅隆基金會合作建立了“梅隆國際敦煌檔案”(the Me-

llon International Dunhuang Archive,MIDA)[6]展示了22個數(shù)字化洞窟的圖像和5個虛擬漫游節(jié)目[7],展示的敦煌石窟壁畫數(shù)字化圖像采集精度僅為75DPI。敦煌研究院在固定IP地址的電子閱覽室可免費瀏覽,外界觀眾需要付費查看,瀏覽速度較慢。

三 “數(shù)字敦煌”資源庫建設(shè)任務(wù)的

特點和難點

“數(shù)字敦煌”資源庫有三大特點:其一,展示內(nèi)容豐富、專業(yè)知識性強。展示對象為敦煌石窟中的建筑、彩塑和壁畫。壁畫包括尊像畫、佛傳故事畫、本生故事畫、因緣故事畫、神話題材畫、佛教史跡畫、經(jīng)變畫、供養(yǎng)畫、裝飾圖案畫和說法圖等,專業(yè)知識涵蓋歷史、科技和藝術(shù)等方面[8];其二,展示數(shù)字資源多樣,包括高精度數(shù)字圖像、三維重建數(shù)據(jù)、虛擬漫游節(jié)目、多媒體節(jié)目、視頻節(jié)目、動漫節(jié)目、文字等[9];其三,展示壁畫數(shù)字化成果數(shù)據(jù)精度高、容量大,敦煌石窟壁畫數(shù)字化采集分辨率達到300DPI,每一個壁面最終形成的數(shù)字化成果數(shù)據(jù)容量超大,以莫高窟第61窟西壁為例,長寬像素分別為210270×91273,總像素超過了442億,數(shù)據(jù)容量超過60GB。

鑒于本資源庫的特點,造成了建設(shè)中的眾多難點:第一,選擇本資源庫展示敦煌石窟的內(nèi)容時,需考慮的因素眾多,既要考慮敦煌石窟的年代包括北魏、西魏、北周、隋朝、初唐、盛唐、中唐、晚唐、五代、西夏、元代等朝代,又要考慮洞窟形制包括中心塔柱式、穹頂、覆斗型、馬蹄形佛壇等,還要考慮壁畫的畫面內(nèi)容等;第二,數(shù)據(jù)關(guān)聯(lián)性強,如何挖掘多種形式的數(shù)字資源所包含的價值,并以何種形式科學、高效地關(guān)聯(lián)、組織敦煌石窟的專有知識;第三,由于洞窟空間結(jié)構(gòu)的多樣性,導致無法用結(jié)構(gòu)化的數(shù)據(jù)庫進行數(shù)據(jù)存儲;第四,壁畫數(shù)字化精度高、超大容量的圖像如何在互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)上的自適應(yīng)展示,并且滿足個性化的展示與檢索;第五,可擴展性強,本資源庫第一期展示內(nèi)容在已完成100余個洞窟的數(shù)字化成果中確定30個洞窟[10][11],如何在不改變系統(tǒng)架構(gòu),將敦煌石窟812個洞窟全部展示;第六,數(shù)據(jù)知識產(chǎn)權(quán)如何管理;第七,本資源庫大量為圖像數(shù)據(jù),如何優(yōu)化和提升性能,提高用戶并發(fā)量;第八,本資源庫的網(wǎng)絡(luò)安全如何保障。

四 分層架構(gòu)設(shè)計

“數(shù)字敦煌”資源庫分層架構(gòu)設(shè)計如圖 1所示。

1)平臺硬件層與虛擬化

本資源庫購置3臺物理主機,利用VMWare?譹?訛構(gòu)建虛擬環(huán)境,vSAN構(gòu)建分布式存儲。允許1臺物理主機宕機后,虛擬機可自動遷移至另外兩臺物理主機上運行,確?!皵?shù)字敦煌”資源庫提供不間斷的服務(wù),今后隨著數(shù)據(jù)量和計算資源的增加,只需要底層增加物理主機,加入虛擬池中,即可提供服務(wù)。

2)系統(tǒng)軟件

虛擬化的管理主機VMware vCenter Server 6.0版本?譹?訛其操作系統(tǒng)采用了Windows server 2008操作系統(tǒng),其它應(yīng)用主機都采用了Cent OS6.9操作系統(tǒng)。

3)運維管理

運營統(tǒng)計分析“數(shù)字敦煌”資源庫頁面訪問量、頁面訪問停留時間、訪問者的地域統(tǒng)計、操作系統(tǒng)統(tǒng)計、訪問者忠實用戶量、在線人數(shù),等等。為了提升“數(shù)字敦煌”資源庫的不間斷服務(wù)能力,還對服務(wù)器硬件、操作系統(tǒng)和應(yīng)用程序做了相應(yīng)的監(jiān)控。

4)后臺數(shù)據(jù)管理

洞窟空間結(jié)構(gòu)管理,以洞窟為單位,構(gòu)建每個洞窟相對應(yīng)的空間結(jié)構(gòu)。上傳壁畫高精度圖像和全景漫游節(jié)目,數(shù)據(jù)上傳后系統(tǒng)自動校驗每個文件的sha-1值,確保上傳數(shù)據(jù)的一致性和完整性。針對洞窟、壁面進行信息編目,并由專業(yè)人員審核編目的信息。多語言模塊的管理,目前只有中文和英文。

5)用戶功能

用戶通過互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)訪問“數(shù)字敦煌”資源庫,系統(tǒng)可自適應(yīng)在PC和不同類型的移動終端顯示瀏覽內(nèi)容。首先通過全景漫游節(jié)目以及文字介紹對整窟有全面的了解,然后每一個壁面對應(yīng)的有文字介紹,并且可以瀏覽壁畫的每一個細節(jié)內(nèi)容。用戶可通過遺址地、年代、洞窟形制篩選瀏覽內(nèi)容,或者可通過全文檢索準確查找壁畫內(nèi)容。

6)安全保障

“數(shù)字敦煌”資源庫硬件安全保障采用了防火墻和網(wǎng)頁防篡改防火墻,在軟件控制方面采用了反向代理技術(shù),提升安全性能。

7)知識產(chǎn)權(quán)保護和管理

知識產(chǎn)權(quán)是一項非常重要的工作,在頁面瀏覽中加入了自適應(yīng)多分辨的水印。數(shù)據(jù)授權(quán)目前遵循敦煌研究院線下的授權(quán)流程。

五 整體架構(gòu)實現(xiàn)與優(yōu)化

敦煌學的研究在國際上涵蓋幾十個國家,在國內(nèi)也涵蓋多個省份,因此“數(shù)字敦煌”資源庫面向的用戶地域分布較廣,為了滿足多國家、多地域的用戶需求,提高“數(shù)字敦煌”資源庫頁面的瀏覽速度,提升用戶的體驗,單臺服務(wù)器運行所有的應(yīng)用程序已不能滿足需求。最終采用動態(tài)資源與靜態(tài)資源分離、應(yīng)用服務(wù)器與數(shù)據(jù)庫分離、負載均衡、數(shù)據(jù)庫主從復制、緩存、應(yīng)用拆分和壓縮等技術(shù),滿足本資源庫的高性能、高可用、可擴展和安全等需求,系統(tǒng)架構(gòu)拓撲如圖 2所示。

1)高性能設(shè)計

“數(shù)字敦煌”資源庫的高性能在用戶層面考慮,即訪問頁面的相應(yīng)時間越短,用戶的體驗越好。本資源庫包含的主要資源是洞窟高精度壁畫數(shù)字圖像和全景漫游節(jié)目,用戶多次訪問這些資源時不發(fā)生任何變化,這些資源在網(wǎng)站資源中都屬于靜態(tài)資源,提高靜態(tài)資源訪問速度的辦法是與動態(tài)資源分離,將靜態(tài)資源存儲在兩臺獨立的服務(wù)器上,啟用ngnix?譺?訛高性能的http服務(wù),并且具有獨立的二級域,通過獨立域名可直接快速訪問靜態(tài)資源。相對應(yīng)的動態(tài)資源即用戶多次訪問時資源發(fā)生變換,本資源庫動態(tài)資源主要包括洞窟、壁畫描述文字、洞窟空間結(jié)構(gòu)、洞窟列表、檢索與檢索結(jié)果、登錄、注冊、用戶信息修改等,這些資源存儲在數(shù)據(jù)庫中。

將動態(tài)資源和靜態(tài)資源分離的同時,減少HTTP的下載請求,會縮短網(wǎng)絡(luò)傳輸?shù)臅r間,為了緩解兩臺獨立靜態(tài)資源服務(wù)器的訪問壓力,瀏覽器與數(shù)據(jù)服務(wù)器之間增加了squid?譻?訛反向代理服務(wù)器。將用戶訪問頻繁的洞窟壁畫和全景漫游節(jié)目資源緩存,并且重用頻繁請求的web頁面。用戶訪問動態(tài)資源時,采用了ngnix?譼?訛作為反向代理服務(wù)器,并且增加了memcache?譹?訛分布式緩存服務(wù)器,從MySQL查詢的動態(tài)資源存儲在memcached服務(wù)器中,減少數(shù)據(jù)庫的訪問次數(shù)。

用戶訪問的資源如果不影響瀏覽質(zhì)量,在網(wǎng)絡(luò)傳輸時進行壓縮,傳輸效率大大提升,本資源庫采用了gzip?譺?訛的網(wǎng)頁壓縮的技術(shù),用戶瀏覽器如果支持gzip便可提高訪問速度,若用戶瀏覽器不支持gzip壓縮技術(shù),訪問速度則相對慢一些。經(jīng)測試用Chrome瀏覽器訪問“數(shù)字敦煌”資源庫時,網(wǎng)頁壓縮率可在40%—70%之間。

所有的數(shù)據(jù)在最底層都要存儲于硬盤中,如果硬件資源采用速度較快的設(shè)備,將提升“數(shù)字敦煌”資源庫的整體性能。本資源庫底層采用了VMWare vSAN?譻?訛軟件定義的分布式存儲,硬盤采用閃存和機械硬盤混合模式,提高存儲性能。

2)高可用性設(shè)計

敦煌學的研究在國際上涵蓋多個國家,導致“數(shù)字敦煌”的用戶來自全球,因為各個國家時差的原因,要求本資源24小時提供可靠的服務(wù)。用戶訪問靜態(tài)資源和動態(tài)資源時采用負責均衡技術(shù),由haproxy?譼?訛軟件實現(xiàn),根據(jù)訪問資源的特性,haproxy采用不同的負載策略。用戶訪問壁畫與全景漫游節(jié)目時采用leastconn(連接數(shù)最小)的策略,訪問動態(tài)資源采用roundrobin(輪詢)策略。

本資源庫的高可用性設(shè)計的另一方面是備份,一旦應(yīng)用服務(wù)器宕機,自動或者手動啟動備份設(shè)備,縮短系統(tǒng)從故障到正常運行的恢復時間。本資源庫的備份有三種形式:第一種,數(shù)據(jù)庫主從復制機制,數(shù)據(jù)庫存儲動態(tài)資源,單一的數(shù)據(jù)庫容易發(fā)生單點故障,因此需要考慮數(shù)據(jù)庫的備份機制,采用了MySQL5.7版本的關(guān)系型數(shù)據(jù)庫,利用它自帶的主從復制功能,兩臺獨立數(shù)據(jù)庫服務(wù)器一主一從,一旦主數(shù)據(jù)庫服務(wù)器發(fā)生宕機,自動切換至從數(shù)據(jù)庫服務(wù)器;第二種,VMWare vSAN技術(shù)自身將數(shù)據(jù)底層做了一份備份,所有的虛擬機都做了快照;第三種,靜態(tài)資源服務(wù)器增加了數(shù)據(jù)完全相同的備份服務(wù)器,兩臺squid服務(wù)器,兩臺nginx反向代理服務(wù)器,拆分的應(yīng)用根據(jù)需求啟動了不同數(shù)量的備份服務(wù)器。

3)可擴展設(shè)計

“數(shù)字敦煌”資源庫既要考慮內(nèi)容的擴展性,又要考慮系統(tǒng)架構(gòu)的擴展性。內(nèi)容的擴張性將在下一章節(jié)介紹,在系統(tǒng)架構(gòu)方面,提高資源庫的擴展性,就是要降低資源庫功能的耦合度,主要采用拆解的思想,一臺服務(wù)器提供所有功能,拆解為多臺服務(wù)器提供不同的功能,例如將消耗資源較大的數(shù)據(jù)庫和應(yīng)用分離,部署在各自獨立的服務(wù)器上,降低因服務(wù)器資源耗盡造成宕機的概率,提高本資源庫的高可用性。

“數(shù)字敦煌”資源庫將復雜的功能拆分成獨立的多個功能,可提高單項功能的復用率,也可提高系統(tǒng)維護效率,目前應(yīng)用拆分為首頁信息、洞窟分類、洞窟詳情、檢索、認證。

4)安全設(shè)計

安全是一項非常重要的工作,互聯(lián)網(wǎng)上的應(yīng)用,大部分都會受到各種攻擊。確保本資源庫的安全采用了硬件防火墻、反向代理和定期漏洞掃描。硬件防火墻采用了外網(wǎng)邊界防火墻和web防火墻兩種硬件設(shè)備。外網(wǎng)邊界防火墻主要用于網(wǎng)絡(luò)邊界防護和地址轉(zhuǎn)換,防御外部用戶的非法訪問和網(wǎng)絡(luò)攻擊,web防火墻主要是防御web入侵,保障內(nèi)容網(wǎng)絡(luò)安全。

在5.1節(jié)中所述,本資源庫增加了反向代理服務(wù)器,將反向代理服務(wù)器置于公網(wǎng),將其它應(yīng)用都置于內(nèi)網(wǎng),未經(jīng)授權(quán)的用戶沒有機會訪問反向代理服務(wù)器與動態(tài)資源、靜態(tài)資源服務(wù)器之間的交換信息,提高內(nèi)部服務(wù)器的安全性。

另外定期還采用了專業(yè)的網(wǎng)絡(luò)漏洞掃描,及時發(fā)現(xiàn)網(wǎng)站的漏洞并予以修復。

5)性能測試

網(wǎng)站性能測試采用了Apache JMeter?譹?訛,它可用于測試動態(tài)和靜態(tài)資源、Web動態(tài)應(yīng)用程序的性能,用來模擬服務(wù)器、服務(wù)器組、網(wǎng)絡(luò)或?qū)ο笊系闹剌d,以測試其強度或分析不同負載類型下的總體性能。本資源庫的性能測試以100個并發(fā)用戶量為開始,每次測試增加100個并發(fā)用戶,測試20組數(shù)據(jù),用戶并發(fā)數(shù)量和平均響應(yīng)時間如圖 3所示。

按照網(wǎng)站性能測試2、5、10原則,當響應(yīng)時間在2秒內(nèi),用戶瀏覽網(wǎng)站會感覺很快,根據(jù)測試結(jié)果“數(shù)字敦煌”資源庫并發(fā)量在1200之內(nèi),平均響應(yīng)速度可以在2秒之內(nèi)。

根據(jù)“數(shù)字敦煌”資源庫的統(tǒng)計,平均每天PV量約7000,平均頁面停留時間為1821秒,用戶訪問時間主要集中在每天的8點至12點,14點至16點,20點至22點,即每天訪問時間長為28800秒。根據(jù)網(wǎng)頁并發(fā)量計算公式C=nL/T,即C=7000*1821/28800,C≈443,由此可知“數(shù)字敦煌”用戶并發(fā)數(shù)量大概在443,依據(jù)測試結(jié)果用戶訪問頁面平均響應(yīng)時間在200毫秒。

總體來看,“數(shù)字敦煌”資源庫達到了高性能設(shè)計的需求。

六 主要功能設(shè)計與實現(xiàn)

針對“數(shù)字敦煌”資源庫的特點和難點,本資源庫主要功能為高精度圖像快速瀏覽、洞窟空間結(jié)構(gòu)設(shè)計、系統(tǒng)核心元數(shù)據(jù)設(shè)計、洞窟空間結(jié)構(gòu)與元數(shù)據(jù)的存儲檢索、除了主要功能外,還有系統(tǒng)管理、接口管理、多語言管理、日志管理、全文檢索、資源管理、用戶注冊和登錄等功能。

1)高精度圖像分層細化

通常情況,通過高性能的圖形工作站才可以瀏覽敦煌壁畫幾百億像素的數(shù)字圖像,而通過互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)直接加載瀏覽根本不可能實現(xiàn)。為了解決這一難題,我們采用了LOD?譺?訛?zāi)P退枷?,如圖 4所示,超大圖像從上而下,劃分為0層、1層……N層,那么第0層圖像最小且分辨率最低,第N層圖像最大且分辨率最高,隨著層數(shù)增加,圖像越來越大。

2)洞窟空間結(jié)構(gòu)設(shè)計

洞窟的空間結(jié)構(gòu)設(shè)計原則首先考慮空間,然后考慮方位和獨立實體,循環(huán)漸進建立洞窟空間結(jié)構(gòu),以空間結(jié)構(gòu)三層級為例:

第一層級:洞窟從空間考慮有整窟、前室、甬道和主室四部分,這里有區(qū)別于日常洞窟空間結(jié)構(gòu)劃分,增加了整窟,因為在“數(shù)字敦煌”資源庫平臺首先要對整窟進行圖像和文字的介紹,讓觀眾對洞窟有整體性的了解。

第二層級:以主室為例從方位考慮有東壁、南壁、西壁、北壁、東披、南披、西披、北披;以獨立實體考慮有藻井、中心柱、佛壇、背屏、佛臺等。

第三層級:以主室西壁為例從空間考慮有佛龕、佛臺;以中心柱為例從方位考慮有東壁、南壁、西壁和北壁。

以此類推,逐漸細化每一層,針對每個洞窟建立自己獨有的洞窟空間結(jié)構(gòu),洞窟結(jié)構(gòu)基礎(chǔ)庫構(gòu)建后,可服務(wù)于數(shù)據(jù)采集、加工、存儲和展示等各個環(huán)節(jié)。“數(shù)字敦煌”資源庫第一期展示的數(shù)字類型有圖像、文字和VR,洞窟空間結(jié)構(gòu)與數(shù)字類型對應(yīng)關(guān)系如圖 5所示。

3)系統(tǒng)核心元數(shù)據(jù)設(shè)計

為了更好的描述“數(shù)字敦煌”資源庫所展示的各類數(shù)據(jù),考慮元數(shù)據(jù)描述的易操作性、可擴展性等,系統(tǒng)核心元數(shù)據(jù)內(nèi)容,如表 1所示。

4)洞窟空間結(jié)構(gòu)構(gòu)建和元數(shù)據(jù)的存儲、檢索實現(xiàn)

“數(shù)字敦煌”資源庫第一期選擇了30個洞窟作為展示內(nèi)容,目前可以將這30個洞窟的空間結(jié)構(gòu)完整構(gòu)建,但是敦煌石窟共計812個洞窟,所有洞窟空間結(jié)構(gòu)除了相同之外,還存在大量的獨特性,各遺址保存在不同地域,詳細調(diào)查每個洞窟工作量非常大,所以,目前無法將812個洞窟的所有空間結(jié)構(gòu)完整構(gòu)建。因此,考慮“數(shù)字敦煌”資源庫將來展示更多敦煌石窟數(shù)字資源,洞窟空間結(jié)構(gòu)和元數(shù)據(jù)的存儲應(yīng)具有極強的可擴展性。

XML是一種簡單靈活的可擴展語言,非常適合“數(shù)字敦煌”資源庫中洞窟結(jié)構(gòu)空間構(gòu)建和元數(shù)據(jù)的存儲。根據(jù)洞窟空間結(jié)構(gòu)設(shè)計的層級關(guān)系,制定XML的模板,每個洞窟生成獨立的XML文件,并以遺產(chǎn)地名稱的第一個拼音字母+洞窟號命名,保存在相對應(yīng)洞窟圖像的根目錄下。以莫高窟第61窟為例即MGK61.xml,其視圖如圖 6所示。

由上述XML結(jié)構(gòu)可知,如果增加前室和甬道,可在〈Space〉同級擴充,其它層級增加內(nèi)容同理,非常靈活。

針對XML文件的生成,采用了分散錄入、模塊組裝成完整的XML文件的方法:首先根據(jù)6.3章節(jié)中核心元數(shù)據(jù)內(nèi)容,拆分成數(shù)字資源信息XML、洞窟空間結(jié)構(gòu)XML、基礎(chǔ)信息XML、和版本信息XML四部分;其次將洞窟空間結(jié)構(gòu)拆分成前室XML、甬道XML、主室XML和整窟XML四部分;以主室為例根據(jù)洞窟空間結(jié)構(gòu),拆分相對應(yīng)方位的XML文件,最后根據(jù)完整XML的文件結(jié)構(gòu),整合成一個完整的XML文件。具體流程如圖 7所示。

將完整的洞窟XML文件存儲在Mysql 5.7數(shù)據(jù)庫,并利用XPath查詢對應(yīng)的內(nèi)容。XPath是一種表達式語言,它允許處理符合XQuery和XPath數(shù)據(jù)模型(XDM)中定義的數(shù)據(jù)模型的值,提供了對XML樹中的節(jié)點進行分層尋址的方法?譹?訛。這種方法具有速度快、定位準等特點,例如要查詢莫高窟第61窟主室東壁的文字描述,即可用下面語句進行查找:

SELECT EXTRACTVALUE(@MGK61_xml,

'Dunhuang/Grottoes/Space/Location/Met-

adata/Contents') AS names

七 界面設(shè)計與實現(xiàn)

“數(shù)字敦煌”資源庫開發(fā)了洞窟空間結(jié)構(gòu)構(gòu)建功能,便于數(shù)據(jù)錄入與多人操作,可快速、規(guī)范地構(gòu)建每個洞窟對應(yīng)的空間結(jié)構(gòu)(圖8)。

用戶界面主要有洞窟、壁畫、檢索、語言和登錄功能(圖9)。用戶登錄系統(tǒng)后,通過窟號瀏覽洞窟,或者系統(tǒng)會推薦精美壁畫直接瀏覽壁畫詳細內(nèi)容。目前已有中文和英語兩種語言,資源庫根據(jù)用戶操作系統(tǒng)推薦默認的語言。

“數(shù)字敦煌”資源庫運行監(jiān)測(圖10)已穩(wěn)定運行3年多,未發(fā)生系統(tǒng)故障,具有一定的抗攻擊性,安全系數(shù)較高。分析頁面訪問趨勢,進行SEO優(yōu)化,在各大主流搜索引擎檢索“數(shù)字敦煌”都排名第一。

“數(shù)字敦煌”資源庫[11]在2016年5月1日正式上線,第一次向全球免費共享敦煌石窟30個洞窟采集精度為300DPI的高精度數(shù)字圖像和全景漫游節(jié)目,訪問國已超過十多個,頁面訪問超過700萬次,在敦煌學研究、展覽、美術(shù)臨摹、教育等領(lǐng)域的應(yīng)用,取得了良好的社會反響。

八 展 望

“數(shù)字敦煌”資源庫雖然已設(shè)計與開發(fā)特定的功能,系統(tǒng)上線也取得了較好的成績,但是,如何挖掘壁畫包含的價值——將整幅壁畫按照內(nèi)容拆解,將圖像和文字一一對應(yīng),構(gòu)建不同的專題,如何將不同區(qū)域在同一界面內(nèi)對比研究,如何構(gòu)建敦煌石窟知識圖譜,提升檢索能力——這將是未來需要開發(fā)的主要功能。未來“數(shù)字敦煌”資源庫將構(gòu)建一個敦煌知識信息共享,智能服務(wù)觀眾,為敦煌學的研究、敦煌文化的弘揚和傳播發(fā)揮重大作用。隨著“數(shù)字敦煌”業(yè)務(wù)的增加,網(wǎng)站的性能也會面臨新的挑戰(zhàn),將來還需要做進一步的優(yōu)化與改進。

參考文獻:

[1]樊錦詩.為了敦煌的久遠長存——敦煌石窟保護的探索歷程[J].敦煌研究,2004(03).

[2]吳健,俞天秀,張若識.敦煌藝術(shù)圖像數(shù)據(jù)庫的建設(shè)[J].敦煌研究,2008(06).

[3]陜西師范大學出版總社.敦煌文獻數(shù)字圖書館[DB/OL].

(2017-9-0)[2019-10-14 ]http://dunhuang.hanjil-

ibrary.com/index.aspx.

[4]敦煌研究院.敦煌學信息資源庫[DB/OL].(2018-8-0)[2019-10-14]http://dh.dha.ac.cn.

[5]國際敦煌項目[DB/OL].(1994-0-0)[2019-10-14]http:

//idp.nlc.cn.

[6]梅隆國際敦煌檔案[DB/OL].(2005-0-0)[2019-10-14]https://www.artstor.org.

[7]敦煌研究院編.敦煌研究院年鑒2005—2006 [M].上海:上海辭書出版社,2007.

[8]季羨林.敦煌學大辭典 [M].上海:上海辭書出版社.1998-12-1:80.

[9]吳健.多元異構(gòu)的數(shù)字文化——敦煌石窟數(shù)字文化呈現(xiàn)與展示[J].敦煌研究,2016(01).

[10]吳健.石窟寺文物數(shù)字化的內(nèi)涵——融學術(shù)、技術(shù)、藝術(shù)于一體[J].敦煌研究,2015(02).

[11]“數(shù)字敦煌”資源庫[DB/OL].(2016-05-01)[2019-07-

30]https://www.e-dunhuang.com.

猜你喜歡
系統(tǒng)架構(gòu)網(wǎng)絡(luò)拓撲資源庫
基于通聯(lián)關(guān)系的通信網(wǎng)絡(luò)拓撲發(fā)現(xiàn)方法
健身氣功開放課程資源庫建設(shè)研究
貴州●石斛種質(zhì)資源庫
能量高效的無線傳感器網(wǎng)絡(luò)拓撲控制
勞斯萊斯古斯特與魅影網(wǎng)絡(luò)拓撲圖
人工智能在智能機器人系統(tǒng)中的應(yīng)用研究
基于云計算的多媒體網(wǎng)絡(luò)學習平臺系統(tǒng)架構(gòu)
高中歷史信息化教育資源庫應(yīng)用探索
福建基礎(chǔ)教育教學資源庫建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫為例
基于多任務(wù)異步處理的電力系統(tǒng)序網(wǎng)絡(luò)拓撲分析
巩留县| 焦作市| 贺兰县| 滦平县| 乌苏市| 修武县| 体育| 资阳市| 三门县| 靖边县| 诸城市| 白朗县| 双江| 赤壁市| 巴青县| 景宁| 梅河口市| 盐亭县| 丹巴县| 屏山县| 綦江县| 永德县| 若尔盖县| 饶平县| 龙山县| 通化市| 专栏| 隆回县| 砀山县| 新巴尔虎右旗| 洞头县| 临夏市| 宜州市| 河北省| 全椒县| 宝兴县| 承德市| 濉溪县| 汨罗市| 鹿邑县| 阜宁县|