王曉偉+劉能勇+梁傲雪
〔摘 要〕 語(yǔ)義網(wǎng)在最近二十年間獲得了長(zhǎng)足的發(fā)展,但目前學(xué)界和業(yè)界對(duì)語(yǔ)義網(wǎng)定義及其理論框架的認(rèn)識(shí)仍模糊不清,相關(guān)研究多以技術(shù)支持為主,而鮮有系統(tǒng)深入的理論分析,這不利于語(yǔ)義網(wǎng)的長(zhǎng)期發(fā)展。為此,本文首先通過(guò)對(duì)符號(hào)三角模型的研究與擴(kuò)展,選定若干與語(yǔ)義網(wǎng)相關(guān)的核心原始概念;然后,以此為基礎(chǔ)比較分析三類(lèi)典型的語(yǔ)義網(wǎng)定義;最后通過(guò)本體分析,深入討論語(yǔ)義網(wǎng)的資源網(wǎng)絡(luò)本質(zhì)屬性?;谝陨嫌懻摵头治鼋Y(jié)果,本文將給出以其核心屬性為構(gòu)成要素的語(yǔ)義網(wǎng)定義,并基于此定義重構(gòu)語(yǔ)義網(wǎng)的理論框架,以期完善當(dāng)前語(yǔ)義網(wǎng)基礎(chǔ)理論體系。
〔關(guān)鍵詞〕語(yǔ)義網(wǎng);符號(hào)學(xué);符號(hào)三角模型;本體論
DOI:10.3969/j.issn.1008-0821.2017.08.005
〔中圖分類(lèi)號(hào)〕G201 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2017)08-0033-08
〔Abstract〕Semantic web has gained considerable development in the last two decades,yet the definition of semantic web and its theoretical framework are still ambigous,the related research was mostly proposed for technical support,and there is few systematic and in-depth theoretical analysis,which is not conducive to the development of semantic web in a long-term. To address this problem,firstly,this paper chose several core primary concepts related to semantic web by discussing and expanding the classic “semiotic triangle”model. Then,based on these primary concepts,it discussed and compared three kinds of typical semantic web definitions. Finally,through ontological analysis,it discussed semantic web as a resource network through its core properties. According to above discussion and analysis,it proposed a new definition of semantic web with its core attributes as the constituent elements,and reconstructed the theoretical framework of semantic web based on this definition,in order to improve the foundamental theoratical framework of semantic web.
〔Key words〕semantic web; semiology;“semiotic triangle”model;ontology
Tim Berners-Lee于1989年、1990年相繼發(fā)明了萬(wàn)維網(wǎng)(World Wide Web, 3W)和世界上第一個(gè)瀏覽器[1]。利用瀏覽器和超文本連接技術(shù),用戶(hù)可以輕松瀏覽網(wǎng)頁(yè),實(shí)現(xiàn)“網(wǎng)上沖浪”。歷經(jīng)9年的高速發(fā)展,時(shí)至1998年,萬(wàn)維網(wǎng)已經(jīng)在全球范圍內(nèi)普及。但是,通過(guò)萬(wàn)維網(wǎng)發(fā)布的網(wǎng)頁(yè)數(shù)據(jù)一般以自然語(yǔ)言為載體,缺乏結(jié)構(gòu)性,導(dǎo)致機(jī)器無(wú)法對(duì)其進(jìn)行有效理解和處理。為解決這一問(wèn)題,語(yǔ)義網(wǎng)(Semantic Web)的概念應(yīng)運(yùn)而生[2],在沿襲萬(wàn)維網(wǎng)數(shù)據(jù)互聯(lián)共享理念的基礎(chǔ)上,從信息發(fā)布源頭入手,將攜帶語(yǔ)義的數(shù)據(jù)以統(tǒng)一預(yù)定義的結(jié)構(gòu)化形式發(fā)布,進(jìn)而使得網(wǎng)頁(yè)內(nèi)容數(shù)據(jù)可以高效地被機(jī)器理解和處理,使人與機(jī)器、機(jī)器與機(jī)器之間可以進(jìn)行無(wú)障礙的數(shù)據(jù)交換,實(shí)現(xiàn)相關(guān)應(yīng)用的自動(dòng)化和智能化。
自語(yǔ)義網(wǎng)概?被提出以來(lái),經(jīng)由萬(wàn)維網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)對(duì)其進(jìn)行推廣和普及,與其相關(guān)的研究發(fā)展迅速,并逐漸演化為計(jì)算機(jī)科學(xué)領(lǐng)域的一個(gè)重要分支。到目前為止的19?間,很多專(zhuān)家和學(xué)者一直致?于語(yǔ)義網(wǎng)的研究與探?,相關(guān)的科研成果已經(jīng)在經(jīng)濟(jì)、政治、教育等許多領(lǐng)域得到實(shí)踐應(yīng)用。例如,自2007年始,英國(guó)廣播公司(BBC)開(kāi)始利用語(yǔ)義網(wǎng)技術(shù),將旗下音樂(lè)頻道中所涉及藝術(shù)家的信息進(jìn)行自動(dòng)標(biāo)注,附加語(yǔ)義,并且相互連接,進(jìn)而構(gòu)建了一個(gè)關(guān)于音樂(lè)藝術(shù)家的關(guān)聯(lián)數(shù)據(jù)集[3]。2010年5月,美國(guó)政府?dāng)?shù)據(jù)網(wǎng)站data.gov將其約400個(gè)數(shù)據(jù)集部署到現(xiàn)有語(yǔ)義網(wǎng)體系中,英國(guó)政府也宣布將采用W3C標(biāo)準(zhǔn),澳大利亞、新西蘭、荷蘭等國(guó)家也紛紛跟進(jìn)[4]。2013年,Sergio Miranda等人率先嘗試運(yùn)用語(yǔ)義網(wǎng)技術(shù)準(zhǔn)確發(fā)現(xiàn)MOOC平臺(tái)中用戶(hù)的學(xué)習(xí)數(shù)據(jù),實(shí)現(xiàn)其教學(xué)評(píng)價(jià)體系的優(yōu)化設(shè)計(jì)[5]。
在最近二十年的時(shí)間里,語(yǔ)義網(wǎng)領(lǐng)域有了長(zhǎng)足的發(fā)展,相關(guān)的技術(shù)標(biāo)準(zhǔn)、描述語(yǔ)言、實(shí)現(xiàn)工具、應(yīng)用實(shí)例不斷推陳出新,許多學(xué)者熱衷于探索各種實(shí)踐應(yīng)用的可能[6-7]。但是,相比其他傳統(tǒng)學(xué)科,語(yǔ)義網(wǎng)終歸還是一個(gè)新生事物,其基礎(chǔ)理論體系尚不健全,而且表現(xiàn)出發(fā)展遲緩的現(xiàn)狀[8],鮮有專(zhuān)家學(xué)者專(zhuān)門(mén)對(duì)其進(jìn)行梳理、界定和闡釋?zhuān)@對(duì)語(yǔ)義網(wǎng)的長(zhǎng)遠(yuǎn)發(fā)展極為不利。為緩解這一矛盾,調(diào)節(jié)當(dāng)前語(yǔ)義網(wǎng)基礎(chǔ)理論體系與實(shí)踐應(yīng)用發(fā)展的平衡,本文將首先對(duì)符號(hào)學(xué)中的“符號(hào)三角”模型進(jìn)行討論與擴(kuò)展,并選定與語(yǔ)義網(wǎng)相關(guān)的若干原始概念,作為后文對(duì)語(yǔ)義網(wǎng)討論的基礎(chǔ)。然后,基于已選定的這些原始概念,分別討論和對(duì)比三類(lèi)典型的語(yǔ)義網(wǎng)定義,并給出以其核心屬性為構(gòu)成要素的語(yǔ)義網(wǎng)定義。最后,基于語(yǔ)義網(wǎng)定義,深入討論語(yǔ)義網(wǎng)作為資源網(wǎng)絡(luò)的本質(zhì)屬性,并完成語(yǔ)義網(wǎng)理論框架的重構(gòu)與解釋。
1 符號(hào)三角的認(rèn)知與擴(kuò)展
語(yǔ)義網(wǎng)的核心功能之一就是承載語(yǔ)義,語(yǔ)義即人腦中的概念、想法或意義。一直以來(lái),人類(lèi)使用語(yǔ)言來(lái)記錄和傳遞語(yǔ)義。雖然,不同語(yǔ)言在形式和表述能力上各有特色,但歸根結(jié)底,語(yǔ)言就是人類(lèi)社會(huì)約定俗成的一種符號(hào)系統(tǒng)。這種符號(hào)系統(tǒng)包含“能指”和“所指”兩個(gè)部分,“能指”就是符號(hào)的存在形式方面,即語(yǔ)音的連續(xù)或者書(shū)寫(xiě)的結(jié)構(gòu),而“所指”就是符號(hào)的表述內(nèi)容方面,即概念、想法或意義[9]。正如索緒爾在《普通語(yǔ)言學(xué)教程》一書(shū)中指明的那樣:“概念和音響形象的結(jié)合叫做符號(hào)”[10]。語(yǔ)義網(wǎng)也不例外,其所包含的語(yǔ)義也是通過(guò)某種語(yǔ)言來(lái)承載的,即“描述邏輯語(yǔ)言”。
描述邏輯語(yǔ)言是一種介于自然語(yǔ)言和數(shù)理邏輯語(yǔ)言之間的一種語(yǔ)言。它選取了一階邏輯語(yǔ)言的部分表述能力,定義一組類(lèi)似于自然語(yǔ)言的符號(hào)和規(guī)則,并使之對(duì)應(yīng)于一階邏輯語(yǔ)言的符號(hào)和規(guī)則。新定義的描述邏輯語(yǔ)言具有一定的結(jié)構(gòu)性,便于計(jì)算機(jī)高效地處理和分析,同時(shí),這種類(lèi)似于自然語(yǔ)言的表達(dá)使人類(lèi)可以便利地書(shū)寫(xiě)和閱讀,從而實(shí)現(xiàn)人與機(jī)器、機(jī)器與機(jī)器之間的高效交互。
在語(yǔ)義網(wǎng)框架下,人類(lèi)對(duì)世間萬(wàn)事萬(wàn)物的認(rèn)識(shí)被稱(chēng)為“語(yǔ)義”,通過(guò)描述邏輯語(yǔ)言對(duì)語(yǔ)義進(jìn)行記錄所形成的語(yǔ)言片段被稱(chēng)之為“語(yǔ)義描述”,語(yǔ)義描述的相互引用和鏈接就構(gòu)成了語(yǔ)義網(wǎng)。也就是說(shuō),語(yǔ)義網(wǎng)的構(gòu)建過(guò)程就是人類(lèi)對(duì)其周?chē)澜绮粩嗾J(rèn)知、對(duì)已獲得認(rèn)知進(jìn)行記錄,以及對(duì)認(rèn)知記錄的組織管理過(guò)程。雖然這一過(guò)程涉及諸多要素,且漫長(zhǎng)而復(fù)雜,但Ogden等人提出的“符號(hào)三角(Semiotic Triangle)”模型[11]為探討和理解該過(guò)程的核心內(nèi)涵提供了獨(dú)特視角,幫助讀者從認(rèn)知層面對(duì)語(yǔ)義網(wǎng)本質(zhì)有更深層次的理解。
如圖1所示,Ogden等人提出的符號(hào)三角包含3個(gè)方面的內(nèi)容。三角形的右下角代表著世界上實(shí)際存在的事物,隨著對(duì)世界的觀察,人們逐漸認(rèn)識(shí)到有這樣一類(lèi)動(dòng)物,它們毛茸茸的、性情非常憨厚、是人類(lèi)忠實(shí)的朋友?;谏鲜鲇^察和認(rèn)識(shí),人們把這種動(dòng)物的屬性固化成一個(gè)類(lèi)的概念存儲(chǔ)到記憶中,圖中三角形的上頂角就代表著這樣的類(lèi)概念。有了這樣的類(lèi)概念之后,如果想要表達(dá)心中的想法,比如這一例中狗的概念,就需要使用描述語(yǔ)言對(duì)其進(jìn)行指稱(chēng)。圖中三角形的左下角就代表著表達(dá)概念的語(yǔ)義描述,比如例子中的“Dog”是個(gè)英文詞匯,這個(gè)詞匯就和頂角所代表的概念建立了對(duì)應(yīng)的關(guān)系。這樣,語(yǔ)義描述和類(lèi)概念之間構(gòu)成了聯(lián)系,同時(shí)類(lèi)概念和一組現(xiàn)實(shí)中的實(shí)體又構(gòu)成了聯(lián)系。間接地,一個(gè)類(lèi)概念的語(yǔ)義描述就和某組特定的實(shí)體構(gòu)成了對(duì)應(yīng)關(guān)系。
如果兩個(gè)人對(duì)世界上相同的事物形成了相同的概念,并且約定用相同的語(yǔ)義描述來(lái)表達(dá)相同的概念,那么這兩個(gè)人之間就可以使用這種語(yǔ)義描述進(jìn)行溝通和交流。例如,參照?qǐng)D1中討論的范例,A可以對(duì)B說(shuō)或者寫(xiě)“Dog”這個(gè)詞匯用以指稱(chēng)自己頭腦中的狗的概念,而這個(gè)概念有對(duì)應(yīng)著現(xiàn)實(shí)世界中的狗;當(dāng)B聽(tīng)到或者看到這個(gè)詞匯時(shí)就會(huì)喚起腦中狗的概念,同樣的概念對(duì)應(yīng)著現(xiàn)實(shí)世界中同樣一組狗的實(shí)例。這樣,A和B之間就達(dá)成了溝通與交流的目的。
在上述符號(hào)三角中我們提到了“概念”和“語(yǔ)義描述”,換一組計(jì)算機(jī)與情報(bào)技術(shù)領(lǐng)域中的詞匯來(lái)指稱(chēng),它們分別對(duì)應(yīng)著人們常說(shuō)的“信息”和“數(shù)據(jù)”,而信息和數(shù)據(jù)也就是語(yǔ)義網(wǎng)所要處理的主要對(duì)象。在述符號(hào)三角提出之后的九十余年中,許多專(zhuān)家和學(xué)者根據(jù)這一認(rèn)知模型,對(duì)“信息”的相關(guān)概念進(jìn)行了許多理論研究。Smith[12]和Ferrario[13]等人曾經(jīng)分別嘗試解釋什么是“思想”和“概念”。在他們之后Maass[14],Mentor[15]和Jureta[16]等人對(duì)“信息對(duì)象”進(jìn)行了深入研究。
在這些學(xué)者中,F(xiàn)ortier 和 Kassel (F&K) 提出了關(guān)于信息的本體論模型(Information and Discourse Acts,I&DA),在該模型中他們對(duì)“信息”及其相關(guān)概念做了詳細(xì)分析和闡述[17]。如圖2所示,相對(duì)于原來(lái)的符號(hào)三角,信息和數(shù)據(jù)的部分沒(méi)有發(fā)生變化,分別被稱(chēng)為“內(nèi)容”和“內(nèi)容載體”,內(nèi)容是抽象的思維,指稱(chēng)想法或者知識(shí)本身,而“內(nèi)容載體”是指對(duì)內(nèi)容的符號(hào)表述,也是一種抽象的事物,但符號(hào)是幾何結(jié)構(gòu)的存在,這使其可以通過(guò)某些物理媒介進(jìn)行具象化。在此基礎(chǔ)上,他們延伸出“刻印”的概念,這便是對(duì)內(nèi)容載體(即符號(hào)表述)的一種通過(guò)物理媒介的具象化。
繼續(xù)使用圖1中的范例加以說(shuō)明,我們頭腦中有狗的概念“一種毛茸茸的小動(dòng)物”,這是一種想法和知識(shí),是內(nèi)容的部分;而“Dog”就是狗的概念的符號(hào)表述,而符號(hào)本身是抽象的;只有將這一符號(hào)寫(xiě)在紙上的時(shí)候,墨汁和紙張共同形成的物理存在形式使得抽象符號(hào)得以具象化。當(dāng)然,還有許多其他將符號(hào)具象化的方法,比如在石碑上進(jìn)行刻印,所以F&K使用“刻印”這一詞匯指稱(chēng)這種對(duì)抽象符號(hào)表述的具象化物理媒介支持。
上述討論內(nèi)容是以語(yǔ)義描述對(duì)類(lèi)概念的描述為范例展開(kāi)的,應(yīng)當(dāng)提起注意的是除了類(lèi)概念,還有一種個(gè)體實(shí)例的概念與之對(duì)應(yīng)。比如,圖1范例中提到狗的符號(hào)形式、類(lèi)的概念和對(duì)應(yīng)的一組特定的狗的個(gè)體集合。相同的思路也可以用來(lái)討論個(gè)體實(shí)例的概念。例如,作者的家中養(yǎng)了一條叫做“小黑”的狗,“小黑”這個(gè)詞匯作為一個(gè)語(yǔ)義描述,是一個(gè)抽象符號(hào)的存在。提起“小黑”名字的時(shí)候,作者頭腦中閃過(guò)的印象和屬性是專(zhuān)屬于某一只特定的狗的,當(dāng)然就是指作者家中飼養(yǎng)的那條寵物狗。
前文曾提到當(dāng)下語(yǔ)義網(wǎng)的描述對(duì)象可以是世間的萬(wàn)事萬(wàn)物,而僅僅依靠對(duì)類(lèi)層面的描述還不能夠?qū)κ篱g的萬(wàn)事萬(wàn)物進(jìn)行完整的描述。因此,本文特別強(qiáng)調(diào)個(gè)體實(shí)例的概念,并且與類(lèi)概念并列討論,進(jìn)而確保語(yǔ)義描述范圍的完整性。為方便讀者理解,本文給出圖3對(duì)語(yǔ)義描述的兩種對(duì)象進(jìn)行比較。
2 語(yǔ)義網(wǎng)定義的再認(rèn)識(shí)
前文對(duì)符號(hào)三角模型進(jìn)行了闡釋和擴(kuò)展,從符號(hào)學(xué)的視角重新界定了與語(yǔ)義網(wǎng)相關(guān)的若干核心原始概念。接下來(lái),作者基于這些已經(jīng)界定的原始概念,對(duì)各方提出的語(yǔ)義網(wǎng)定義進(jìn)行了比較分析,并認(rèn)為當(dāng)前并沒(méi)有足夠準(zhǔn)確的語(yǔ)義網(wǎng)定義,既能涵蓋語(yǔ)義網(wǎng)的核心屬性,同時(shí)又能適應(yīng)當(dāng)前信息社會(huì)對(duì)萬(wàn)事萬(wàn)物的描述需求。為解決這一問(wèn)題,本文從被廣泛認(rèn)同的更加原始的概念入手,綜合分析這些原始概念所揭示的語(yǔ)義網(wǎng)本質(zhì)屬性,同時(shí)考慮對(duì)語(yǔ)義網(wǎng)歷史定義的比較分析結(jié)果,最終給出以語(yǔ)義網(wǎng)核心屬性為要素所構(gòu)成的語(yǔ)義網(wǎng)定義,從符號(hào)學(xué)的角度給出語(yǔ)義網(wǎng)的明確的內(nèi)涵。
2.1 Tim Berners-Lee對(duì)語(yǔ)義網(wǎng)的定義
作為語(yǔ)義網(wǎng)的創(chuàng)始人,Berners-Lee對(duì)語(yǔ)義網(wǎng)的定義是“Semantic Web is a consistent logical web of data”[2],翻譯成中文就是“語(yǔ)義網(wǎng)是一個(gè)具有一致性和邏輯性的數(shù)據(jù)網(wǎng)絡(luò)”。這個(gè)定義揭示出語(yǔ)義網(wǎng)三個(gè)層面的基本特征,下面就這三個(gè)特征逐一進(jìn)行分析:
首先,他認(rèn)為語(yǔ)義網(wǎng)是一種數(shù)據(jù)網(wǎng)絡(luò)(web of data),也就是將分布存儲(chǔ)在各地的數(shù)據(jù)聯(lián)系在一起的網(wǎng)絡(luò)。在本文中,我們使用“數(shù)據(jù)”這個(gè)詞匯來(lái)指稱(chēng)“信息”的載體,正如圖2中擴(kuò)展后的符號(hào)三角模型所示,所謂信息就是指人們頭腦中所要表達(dá)的意思、意義或者想法,它是一種無(wú)形的存在。為了方便討論,作者將前文所涉及到的與語(yǔ)義網(wǎng)相關(guān)的原始概念整理成表,如表1所示。
由表1可知,人們?yōu)榱擞涗浐徒涣鬟@種無(wú)形的信息,使用有形的符號(hào)對(duì)應(yīng)到無(wú)形的信息上,在形成了這種符號(hào)與信息的對(duì)應(yīng)關(guān)系之后,信息的記錄和交流就可以轉(zhuǎn)化為對(duì)符號(hào)的記錄和交流,而這里所謂的符號(hào)本文稱(chēng)之為“數(shù)據(jù)”。
在語(yǔ)義網(wǎng)領(lǐng)域中,人們通常使用另外一組詞匯來(lái)指稱(chēng)相同的概念。上文中提到的信息就是語(yǔ)義網(wǎng)里所說(shuō)的語(yǔ)義,而其對(duì)應(yīng)的數(shù)據(jù)就是語(yǔ)義網(wǎng)里所說(shuō)的語(yǔ)義描述。由于語(yǔ)義描述的本質(zhì)是數(shù)據(jù),或者說(shuō)是符號(hào)排列,所以它也是一種抽象幾何結(jié)構(gòu)的存在,它在物理世界中只有通過(guò)物理媒介具象化之后才能真正實(shí)現(xiàn)記錄和交流的功能。其常見(jiàn)的物理媒介有墨水和紙張,墨水在紙張上占有的空間所構(gòu)成的符號(hào)排列就是我們前面所說(shuō)的語(yǔ)義描述。
所以,所謂的“數(shù)據(jù)網(wǎng)絡(luò)”也可以說(shuō)成是“語(yǔ)義描述網(wǎng)絡(luò)”。比如人們熟悉的萬(wàn)維網(wǎng)就可以理解成為這樣的一種數(shù)據(jù)網(wǎng)絡(luò)。在萬(wàn)維網(wǎng)里,信息通過(guò)網(wǎng)頁(yè)數(shù)據(jù)存儲(chǔ)和傳送,數(shù)據(jù)的形式一般是自然語(yǔ)言描述,而數(shù)字化后的網(wǎng)頁(yè)數(shù)據(jù)的具象化物理媒介就是存儲(chǔ)在各個(gè)服務(wù)器上的網(wǎng)頁(yè)文件。由于網(wǎng)頁(yè)文件中可以?xún)?nèi)嵌其他網(wǎng)頁(yè)文件的“超文本連接”地址,網(wǎng)頁(yè)文件之間相互指向進(jìn)而構(gòu)成網(wǎng)絡(luò),同時(shí)網(wǎng)頁(yè)文件中存儲(chǔ)的又是數(shù)據(jù)內(nèi)容,在這個(gè)意義上也可以說(shuō)萬(wàn)維網(wǎng)就是一個(gè)超大型的數(shù)據(jù)網(wǎng)絡(luò)。
語(yǔ)義網(wǎng)也可以用相同的概念進(jìn)行解釋。語(yǔ)義網(wǎng)中的數(shù)據(jù)就是語(yǔ)義描述,其具象化媒介就是語(yǔ)義描述文件。在語(yǔ)義網(wǎng)初期,語(yǔ)義描述內(nèi)嵌在萬(wàn)維網(wǎng)的網(wǎng)頁(yè)數(shù)據(jù)中,后來(lái)這些語(yǔ)義描述被獨(dú)立出來(lái),以單獨(dú)的語(yǔ)義描述文件的形式存儲(chǔ)在各個(gè)服務(wù)器上。或者有專(zhuān)門(mén)的工具對(duì)語(yǔ)義文件進(jìn)行存儲(chǔ)、組織和管理,同時(shí)提供公共的訪(fǎng)問(wèn)和查詢(xún)的接口。各文件中的語(yǔ)義描述之間相互引用和相互指向,在這個(gè)意義上,語(yǔ)義網(wǎng)也可以被稱(chēng)為是一種數(shù)據(jù)網(wǎng)絡(luò)。
其次,這種數(shù)據(jù)網(wǎng)絡(luò)應(yīng)該是具有邏輯(logical)屬性的。雖然Berners-Lee的這種表述并不夠準(zhǔn)確,但他對(duì)語(yǔ)義網(wǎng)的后續(xù)描述和實(shí)踐對(duì)此進(jìn)行了補(bǔ)充解釋。他想使用邏輯語(yǔ)言對(duì)事物進(jìn)行描述從而產(chǎn)生數(shù)據(jù),這樣就使得該數(shù)據(jù)網(wǎng)絡(luò)具有了語(yǔ)義。這樣做的好處有兩點(diǎn):①相對(duì)于自然語(yǔ)言的描述,邏輯語(yǔ)言具有無(wú)二義性特征,使語(yǔ)義的表達(dá)更加精確;②邏輯語(yǔ)言是結(jié)構(gòu)化的語(yǔ)言,可以充分發(fā)揮計(jì)算機(jī)的自動(dòng)計(jì)算能力,實(shí)現(xiàn)語(yǔ)義的推理功能,以及更高級(jí)的應(yīng)用智能化處理。其中,智能化處理的部分也是Berners-Lee一再?gòu)?qiáng)調(diào)和許諾的語(yǔ)義網(wǎng)會(huì)給未來(lái)世界帶來(lái)的便利。
最后,這種語(yǔ)義化的數(shù)據(jù)網(wǎng)絡(luò)應(yīng)該保持一致性。語(yǔ)義網(wǎng)的終極目的是把分散的語(yǔ)義描述都相互連接進(jìn)而整合到一起,最終形成一個(gè)全局的整體語(yǔ)義描述網(wǎng)絡(luò)。但要做到這種整合就必須解決各個(gè)語(yǔ)義描述之間的兼容性問(wèn)題,除了統(tǒng)一邏輯描述語(yǔ)言之外,還有必要規(guī)定該語(yǔ)言中最核心的原始概念,其他概念都可以通過(guò)這些原始概念進(jìn)行解釋。類(lèi)比字典的例子,一個(gè)詞條的解釋是由許多其他詞條組成的。如果,對(duì)這個(gè)解釋中的詞條依次進(jìn)行查詢(xún)的話(huà),又可以得到類(lèi)似形式的解釋。但是,通過(guò)反復(fù)查詢(xún)可知,所有的詞條都可以用一組特殊的詞條集來(lái)解釋。而在這組特殊的詞條集中,它們之間又是互為解釋的,這樣的循環(huán)定義相當(dāng)于沒(méi)有定義,也就是說(shuō)有些詞條就是先天存在的大家都公認(rèn)的不需要再進(jìn)行解釋的,這樣的詞條就代表著原始概念。
在語(yǔ)義網(wǎng)中也是一樣,雙方對(duì)同一事物有不同描述時(shí),就可以透過(guò)這一標(biāo)準(zhǔn)原始概念集進(jìn)行溝通,相互協(xié)商,最后實(shí)現(xiàn)語(yǔ)義一致。而通常的解決方案就是大家規(guī)定并共享一套本體,在本體中給出類(lèi)層面的概念列表,然后通過(guò)對(duì)某些類(lèi)的實(shí)例化來(lái)對(duì)具體的個(gè)體以及個(gè)體之間的關(guān)系進(jìn)行描述。這里所涉及的類(lèi)層面與個(gè)體實(shí)例層面的語(yǔ)義描述就是語(yǔ)義網(wǎng)實(shí)現(xiàn)語(yǔ)義的基本手段。
2.2 W3C對(duì)語(yǔ)義網(wǎng)的定義
自從語(yǔ)義網(wǎng)概念問(wèn)世以來(lái),“W3C Semantic Web Activity”組織也隨之建立。該組織在萬(wàn)維網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)中長(zhǎng)期致力于對(duì)語(yǔ)義網(wǎng)概念的推廣,并為其制定標(biāo)準(zhǔn)。他們對(duì)語(yǔ)義網(wǎng)的定義是“The Semantic Web is a web of data”,即“語(yǔ)義網(wǎng)就是一種數(shù)據(jù)網(wǎng)絡(luò)”。該定義只認(rèn)同和繼承了Berners-Lee對(duì)語(yǔ)義網(wǎng)數(shù)據(jù)網(wǎng)絡(luò)部分的描述,因此只能稱(chēng)其為一個(gè)寬泛的描述[18]。
為了彌補(bǔ)該定義比較寬泛的問(wèn)題,該組織對(duì)語(yǔ)義網(wǎng)的概念做了比較詳細(xì)的補(bǔ)充說(shuō)明,并且在一定程度上完善了語(yǔ)義網(wǎng)的框架結(jié)構(gòu)。在說(shuō)明中,他們認(rèn)為語(yǔ)義網(wǎng)應(yīng)該提供一個(gè)通用框架,在該框架下數(shù)據(jù)可以在各種應(yīng)用、企業(yè)及社會(huì)群體之間實(shí)現(xiàn)方便快捷的共享和復(fù)用。為實(shí)現(xiàn)這一目標(biāo),語(yǔ)義網(wǎng)在技術(shù)層面需要制定一套標(biāo)準(zhǔn)的數(shù)據(jù)模型和相應(yīng)的數(shù)據(jù)格式,使得采用該標(biāo)準(zhǔn)發(fā)布的分散在各地的數(shù)據(jù)集可以被無(wú)縫的整合,這也對(duì)應(yīng)了前文中討論的Berners-Lee認(rèn)為語(yǔ)義網(wǎng)所應(yīng)具備的邏輯性屬性和一致性屬性。
早期對(duì)于語(yǔ)義網(wǎng)的研究主要集中在數(shù)據(jù)格式標(biāo)準(zhǔn)化和數(shù)據(jù)資源共享方面,但經(jīng)過(guò)10年左右的發(fā)展,W3C在2011年給出上述語(yǔ)義網(wǎng)的描述時(shí),特別強(qiáng)調(diào)了語(yǔ)義網(wǎng)的另一個(gè)屬性,即語(yǔ)義網(wǎng)所提供的邏輯描述也應(yīng)該解決如何將數(shù)據(jù)跟現(xiàn)實(shí)世界中的事物相互聯(lián)系的問(wèn)題。早在2001年語(yǔ)義網(wǎng)剛剛問(wèn)世不久,Berners-Lee就想到了這個(gè)問(wèn)題,并認(rèn)為這應(yīng)該是語(yǔ)義網(wǎng)的終極形態(tài)。
他認(rèn)為,URI(Uniform Resource Identifier)不僅可以用來(lái)定位數(shù)據(jù)文件資源,理論上它可以被用來(lái)指稱(chēng)任何事物,這其中就包括現(xiàn)實(shí)世界中的各種物理事物。在這種定位的基礎(chǔ)之上,人們就可以對(duì)這些物理事物以及他們之間的關(guān)系進(jìn)行邏輯描述,從而構(gòu)建一個(gè)更加廣義的包羅萬(wàn)象的語(yǔ)義網(wǎng)框架,Berners-Lee稱(chēng)之為“Web of Things”[19]。
這個(gè)概念跟時(shí)下流行的物聯(lián)網(wǎng)(Internet of Things)的概念非常相似,容易發(fā)生混淆,但我們認(rèn)為這兩者概念之間是存在本質(zhì)區(qū)別的。Internet就是人們常說(shuō)的英特網(wǎng)或者互聯(lián)網(wǎng),這種網(wǎng)絡(luò)更加注重的是物理線(xiàn)路的連接,從而實(shí)現(xiàn)數(shù)據(jù)傳輸?shù)目赡?。比如,用?hù)之所以可以在瀏覽器中看到一張網(wǎng)頁(yè)的內(nèi)容,正是因?yàn)榇鎯?chǔ)在服務(wù)器上的數(shù)據(jù)文件通過(guò)互聯(lián)網(wǎng)傳輸?shù)搅吮镜亍:?jiǎn)單來(lái)講,互聯(lián)網(wǎng)只做一件事,那就是數(shù)據(jù)的傳輸。在這個(gè)意義上的物聯(lián)網(wǎng),就是把傳統(tǒng)意義上的計(jì)算機(jī)通信網(wǎng)絡(luò)擴(kuò)展成為所謂的智能設(shè)備通信網(wǎng)絡(luò),通常的做法就是給設(shè)備安裝控制芯片和互聯(lián)網(wǎng)連接端口,使之成為互聯(lián)網(wǎng)的一部分,本質(zhì)上它是一個(gè)通信網(wǎng)絡(luò)。
語(yǔ)義網(wǎng)則是萬(wàn)維網(wǎng)的一個(gè)擴(kuò)展,它們不解決數(shù)據(jù)的物理傳輸問(wèn)題,而是建立相互關(guān)聯(lián)的語(yǔ)義描述,偏重于數(shù)據(jù)之間的互聯(lián)關(guān)系。這是一種非物理的邏輯上的連接關(guān)系,通過(guò)這種連接人們就可以尋找、定位、整合自己需要的數(shù)據(jù)集?,F(xiàn)在把語(yǔ)義網(wǎng)的概念擴(kuò)展成為“Web of Things”,其實(shí)就是把數(shù)據(jù)描述的對(duì)象擴(kuò)展到任何事物,透過(guò)一整套的語(yǔ)義描述間接地將所描述的對(duì)象相互連接起來(lái)。描述的對(duì)象可以是個(gè)體實(shí)例層面的,也可是類(lèi)層面的。如果將這些描述的對(duì)象都視為某種資源的話(huà),萬(wàn)維網(wǎng),初期的語(yǔ)義網(wǎng)和擴(kuò)展之后的語(yǔ)義網(wǎng)在本質(zhì)上都是某種資源網(wǎng)絡(luò),只是在語(yǔ)義描述的機(jī)器處理效率上、以及在指向?qū)ο蟮姆秶嫌兴煌?/p>
2.3 各教材中對(duì)語(yǔ)義網(wǎng)的定義
自Berners-Lee提出語(yǔ)義網(wǎng)概念,后經(jīng)由W3C對(duì)該概念的普及和推廣,語(yǔ)義網(wǎng)已經(jīng)演化為計(jì)算機(jī)科學(xué)領(lǐng)域的一個(gè)重要分支。比如南安普頓大學(xué)在2010年前后就開(kāi)始推廣關(guān)于語(yǔ)義網(wǎng)的教育,開(kāi)設(shè)了網(wǎng)絡(luò)科學(xué)(Web Science)專(zhuān)業(yè),覆蓋了從學(xué)士、碩士到博士的學(xué)位授予點(diǎn),學(xué)習(xí)和研究同時(shí)開(kāi)展。如果把語(yǔ)義網(wǎng)作為計(jì)算機(jī)科學(xué)的一個(gè)分支來(lái)考慮,它對(duì)自身的定義就是該學(xué)科的基礎(chǔ),而相關(guān)教材則代表了該領(lǐng)域?qū)W者對(duì)該學(xué)科相對(duì)統(tǒng)一的基本認(rèn)識(shí),因此對(duì)教材中語(yǔ)義網(wǎng)定義的考察有利于探究該學(xué)科對(duì)語(yǔ)義網(wǎng)概念的基本認(rèn)識(shí)?;谝陨嫌^點(diǎn),本文特意挑選了三本最近幾年出版的關(guān)于語(yǔ)義網(wǎng)的基礎(chǔ)教材,并考察每本教材對(duì)語(yǔ)義網(wǎng)的定義情況。
首先,Domingue等人[20]在其撰寫(xiě)的教材中提出語(yǔ)義網(wǎng)并不是一個(gè)獨(dú)立的新生事物,而是當(dāng)前萬(wàn)維網(wǎng)的一個(gè)擴(kuò)展版本,在這個(gè)擴(kuò)展板的萬(wàn)維網(wǎng)中,信息被賦予了定義良好的語(yǔ)義,進(jìn)而促進(jìn)了人機(jī)交互的發(fā)展。在對(duì)語(yǔ)義網(wǎng)定義方面,該書(shū)選擇了相對(duì)保守的處理方式,只給出了以上描述性說(shuō)明,而并未就語(yǔ)義網(wǎng)的本質(zhì)屬性給出足夠的闡述和討論。因此,本文認(rèn)為該書(shū)對(duì)語(yǔ)義網(wǎng)定義的解釋是寬泛的,缺乏對(duì)于學(xué)科的方向指導(dǎo)功能。
另外,Antoniou[21]則聲稱(chēng)繼承了Berners-Lee對(duì)語(yǔ)義網(wǎng)的理解,并沒(méi)有給出語(yǔ)義網(wǎng)的明確定義,只是說(shuō)“語(yǔ)義網(wǎng)”和“數(shù)據(jù)網(wǎng)絡(luò)”是通用的詞匯。他對(duì)語(yǔ)義網(wǎng)的解釋是從語(yǔ)義網(wǎng)的設(shè)計(jì)原則角度來(lái)描述的:①語(yǔ)義網(wǎng)應(yīng)該將當(dāng)下可用的結(jié)構(gòu)化的和半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)的格式并發(fā)布;②語(yǔ)義網(wǎng)不僅發(fā)布類(lèi)層面的數(shù)據(jù)集,同時(shí)也可以發(fā)布個(gè)體數(shù)據(jù)單元,以及這些單元之間的關(guān)系;③將這些數(shù)據(jù)想要表達(dá)的語(yǔ)義以一種形式化的方法表示出來(lái),進(jìn)而實(shí)現(xiàn)機(jī)器的自動(dòng)化處理。雖然,這些設(shè)計(jì)原則可以為語(yǔ)義網(wǎng)開(kāi)發(fā)者提供技術(shù)層面的指導(dǎo),但并不能作為構(gòu)成語(yǔ)義網(wǎng)理論體系的基礎(chǔ)。
最后,Yu[22]在其教材中對(duì)語(yǔ)義網(wǎng)做出如下定義:“語(yǔ)義網(wǎng)就是一組技術(shù)與標(biāo)準(zhǔn),用以實(shí)現(xiàn)機(jī)器對(duì)萬(wàn)維網(wǎng)中信息所攜帶語(yǔ)義的理解”。該定義泛泛地使用語(yǔ)義網(wǎng)的相關(guān)技術(shù)來(lái)代替其自身的屬性,在應(yīng)用技術(shù)和理論基礎(chǔ)的認(rèn)識(shí)上發(fā)生了混淆,這對(duì)于讀者理解語(yǔ)義網(wǎng)的內(nèi)涵非常不利。
如表2所示,由比較分析可知,Domingue、Antoniou和Yu等人在其撰寫(xiě)的教材中均未對(duì)語(yǔ)義網(wǎng)定義做出正面說(shuō)明,而是使用“簡(jiǎn)單描述”、“設(shè)計(jì)原則”及“技術(shù)標(biāo)準(zhǔn)”進(jìn)行替代,側(cè)面闡述語(yǔ)義網(wǎng)的部分特征。另外,Domingue和Antoniou等人為了回避對(duì)語(yǔ)義網(wǎng)進(jìn)行直接定義,使用了粗粒度的描述方法,這種概括性的說(shuō)明可以作為對(duì)初學(xué)者的直觀說(shuō)明,卻不能作為該理論體系的研究基礎(chǔ)。在這一點(diǎn)上,Yu雖然在細(xì)節(jié)上給出了對(duì)語(yǔ)義網(wǎng)的定義,但技術(shù)代替理論的表述本質(zhì)上是錯(cuò)誤的,所以他的定義也不能為簡(jiǎn)歷語(yǔ)義網(wǎng)理論體系提供支持。
綜合前文對(duì)語(yǔ)義網(wǎng)概念的討論,本文基于符號(hào)學(xué)提供的原始概念,給出如下包含其核心屬性的與以往定義,即語(yǔ)義網(wǎng)本質(zhì)上是一種資源網(wǎng)絡(luò),以語(yǔ)義描述為表現(xiàn)形式,并以互聯(lián)網(wǎng)進(jìn)行傳輸?;谶@一語(yǔ)義網(wǎng)定義,下文將從“網(wǎng)絡(luò)屬性”、“表現(xiàn)形式”和“傳輸形式”等3個(gè)方面對(duì)其加以梳理,使之既可以滿(mǎn)足初學(xué)者的直觀認(rèn)識(shí)需求,也可以滿(mǎn)足專(zhuān)業(yè)學(xué)者對(duì)語(yǔ)義網(wǎng)的研究需求。達(dá)成對(duì)語(yǔ)義網(wǎng)概念的統(tǒng)一認(rèn)識(shí),構(gòu)建該學(xué)科的理論起點(diǎn)。
3 語(yǔ)義網(wǎng)理論框架的再認(rèn)識(shí)
3.1 傳統(tǒng)語(yǔ)義網(wǎng)體系結(jié)構(gòu)分析
隨著語(yǔ)義網(wǎng)的發(fā)展,各種相關(guān)的描述邏輯語(yǔ)言、技術(shù)和標(biāo)準(zhǔn)被先后開(kāi)發(fā)出來(lái),為了構(gòu)建行業(yè)規(guī)范并指導(dǎo)開(kāi)發(fā)人員實(shí)踐,Berners-Lee仿照Open System Interaction (OSI)參考模型,提出了如圖4所示的傳統(tǒng)語(yǔ)義網(wǎng)體系結(jié)構(gòu)[23]。這類(lèi)模型的設(shè)計(jì)理念是將一個(gè)較大的系統(tǒng)劃分成若干較小的部分,每部分被稱(chēng)為一個(gè)層并自底向上依次排列。功能類(lèi)似的技術(shù)要素被封裝在同一層中,每層自其下層引用所需服務(wù),同時(shí)為其上層提供服務(wù)。
這種分層封裝的體系結(jié)構(gòu)的主要優(yōu)點(diǎn)是可以降低系統(tǒng)各部分之間的耦合度。一方面,與各層相關(guān)的科研或者技術(shù)人員可以專(zhuān)注于本層內(nèi)部的研究和實(shí)踐,對(duì)其他各層只引用其標(biāo)準(zhǔn)外部接口而忽略其內(nèi)部細(xì)節(jié),這有利于提高科研和技術(shù)人員的工作效率。另一方面,各層內(nèi)部的變化不會(huì)影響到其上層對(duì)其服務(wù)的持續(xù)引用,這使得系統(tǒng)整體的兼容性得到增強(qiáng),跨平臺(tái)跨語(yǔ)言開(kāi)發(fā)成為可能。
根據(jù)這種分層設(shè)計(jì)理念,傳統(tǒng)語(yǔ)義網(wǎng)體系結(jié)構(gòu)被劃分成如圖4所示的各層。處于最下方的第一層是用于資源編碼的Unicode,以及用于資源定位的URI技術(shù)。第二層是用于記錄語(yǔ)義描述數(shù)據(jù)的可擴(kuò)展標(biāo)記語(yǔ)言XML。第三層的資源描述框架RDF則為XML提供了三元組形式的數(shù)據(jù)表述模型。再上面的第四層又包含了用于構(gòu)建本體的邏輯描述語(yǔ)言O(shè)WL,為查詢(xún)語(yǔ)義描述數(shù)據(jù)而開(kāi)發(fā)的SPARQL語(yǔ)言,以及用于描述規(guī)則的RIF語(yǔ)言格式。以此類(lèi)推,再上層的內(nèi)容中依次還涉及到邏輯、驗(yàn)證、信用以及用戶(hù)界面和應(yīng)用等內(nèi)容。
該體系結(jié)構(gòu)是語(yǔ)義網(wǎng)領(lǐng)域中目前被普遍認(rèn)可的語(yǔ)義網(wǎng)技術(shù)層次框架的現(xiàn)狀,但該體系結(jié)構(gòu)并未透徹闡釋語(yǔ)義網(wǎng)的資源網(wǎng)絡(luò)本質(zhì)屬性,用于描述語(yǔ)義網(wǎng)的理論框架還處于萌芽和討論階段。為改善這一現(xiàn)狀,本文接下來(lái)將以語(yǔ)義網(wǎng)定義為基礎(chǔ)展開(kāi)討論,分析語(yǔ)義網(wǎng)的網(wǎng)絡(luò)屬性本質(zhì),并進(jìn)而提出語(yǔ)義網(wǎng)的基礎(chǔ)理論框架。
3.2 網(wǎng)絡(luò)概念分析
如前所述,本文認(rèn)為語(yǔ)義網(wǎng)本質(zhì)上是一種資源網(wǎng)絡(luò),以語(yǔ)義描述為表現(xiàn)形式,并以互聯(lián)網(wǎng)進(jìn)行傳輸。所以網(wǎng)絡(luò)屬性是語(yǔ)義網(wǎng)的本質(zhì)屬性,本文接下來(lái)將對(duì)網(wǎng)絡(luò)這一概念進(jìn)行展開(kāi)分析,進(jìn)而為語(yǔ)義網(wǎng)理論框架構(gòu)建提供基礎(chǔ)。
網(wǎng)絡(luò)可以被理解為將對(duì)象元素相互連接在一起而形成的復(fù)雜系統(tǒng),這種系統(tǒng)具有的特殊結(jié)構(gòu)就叫做網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)結(jié)構(gòu)由“節(jié)點(diǎn)”和“連接”組合而成,節(jié)點(diǎn)代表著系統(tǒng)中的對(duì)象元素,而連接則表示對(duì)象元素之間的相互關(guān)系。在日常生活中,人們會(huì)遇到各種各樣的網(wǎng)絡(luò),比如漁網(wǎng)、物流網(wǎng)和人際關(guān)系網(wǎng)等等(在本文中,“網(wǎng)”與“網(wǎng)絡(luò)”指稱(chēng)相同的概念,可以互換使用)。它們的功能各不相同:其中,漁網(wǎng)是漁夫用來(lái)捕魚(yú)的工具,這種網(wǎng)絡(luò)通常被以其整體所表現(xiàn)出來(lái)的功能使用,類(lèi)似的例子還有捕蟲(chóng)網(wǎng)、蜘蛛網(wǎng)等等;物流網(wǎng)是一種用來(lái)在節(jié)點(diǎn)之間通過(guò)連接傳遞包裹的網(wǎng)絡(luò)。這種網(wǎng)絡(luò)在其節(jié)點(diǎn)和連接被構(gòu)建好以后,人們通常不再關(guān)注這個(gè)網(wǎng)絡(luò)以整體存在的對(duì)外功能,而是主要考慮網(wǎng)絡(luò)內(nèi)部各節(jié)點(diǎn)之間的包裹傳遞功能;人際關(guān)系網(wǎng)則是人或者組織以不同角色參與到社會(huì)活動(dòng)中,從而形成的一種分工合作系統(tǒng),相互之間結(jié)成各種各樣的關(guān)系。比如在公司里雇主與雇員的關(guān)系,或者在學(xué)校里老師與學(xué)生的關(guān)系。
以上列舉的三種網(wǎng)絡(luò)各有特點(diǎn),如果將它們各自的屬性抽象出來(lái)并加以分類(lèi),就會(huì)得到三種廣義上的網(wǎng)絡(luò)。類(lèi)似于蜘蛛網(wǎng)的這種網(wǎng)絡(luò),通常以一個(gè)獨(dú)立的整體完成它的外部功能,本文稱(chēng)之為“整體性功能網(wǎng)絡(luò)”;類(lèi)似于物流網(wǎng)的這種網(wǎng)絡(luò)不注重其自身的整體對(duì)外功能,而是強(qiáng)調(diào)網(wǎng)絡(luò)內(nèi)部節(jié)點(diǎn)之間的事物傳輸,本文稱(chēng)之為“傳輸網(wǎng)絡(luò)”。在傳輸網(wǎng)絡(luò)上被傳輸?shù)目梢允侨魏问挛?,比如包裹、水、電、?shù)據(jù)等等,只要有合適的傳輸管道和傳輸介質(zhì),它們都可以被有效地在節(jié)點(diǎn)之間進(jìn)行傳輸;類(lèi)似于人際關(guān)系網(wǎng)的這種網(wǎng)絡(luò),則更加注重節(jié)點(diǎn)之間的連接形式,如果將這種網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)看作一個(gè)資源,節(jié)點(diǎn)之間的相互連接關(guān)系便構(gòu)成了資源的組織形式,因此本文稱(chēng)之為“資源網(wǎng)絡(luò)”。在資源網(wǎng)絡(luò)中,通常單獨(dú)節(jié)點(diǎn)的資源所能提供的功能很有限,將網(wǎng)絡(luò)內(nèi)部的一個(gè)或數(shù)個(gè)子網(wǎng)絡(luò)整體使用帶來(lái)的收益更大,所以在資源網(wǎng)絡(luò)中資源的組織形式就變得非常重要。
圖5展示了一個(gè)粗粒度的網(wǎng)絡(luò)分類(lèi),這代表了本文從功能維度對(duì)網(wǎng)絡(luò)的認(rèn)知。該分類(lèi)并不是完整的,子類(lèi)之間在其他分類(lèi)維度下也可能重疊,但在此處給出以上分類(lèi)已經(jīng)能夠滿(mǎn)足下文說(shuō)明語(yǔ)義網(wǎng)作為一種資源網(wǎng)絡(luò)的需要。
3.3 語(yǔ)義網(wǎng)理論框架構(gòu)建
簡(jiǎn)單來(lái)講,語(yǔ)義網(wǎng)是一種被用賦有語(yǔ)義的描述邏輯語(yǔ)言所描述的資源網(wǎng)絡(luò),同時(shí),這些對(duì)資源的描述又以數(shù)據(jù)的形式在傳輸網(wǎng)絡(luò)中被存儲(chǔ)和傳輸。如圖6所示,根據(jù)語(yǔ)義網(wǎng)的網(wǎng)絡(luò)屬性,本文將分三個(gè)層面對(duì)語(yǔ)義網(wǎng)進(jìn)行闡釋?zhuān)嘿Y源網(wǎng)絡(luò)層面,語(yǔ)義描述層面,數(shù)據(jù)傳輸層面,以期為讀者提供一個(gè)認(rèn)識(shí)語(yǔ)義網(wǎng)的基礎(chǔ)理論框架。
在資源網(wǎng)絡(luò)層面中,任何事物都可以被視為資源。比如,人類(lèi)在日常生活中需要的衣服、食物、住房、交通工具、醫(yī)療設(shè)備等,都是維持生命必不可少的資源。除了物質(zhì)資源之外,作為文明的現(xiàn)代人類(lèi),還需要各種知識(shí)和文化方面的學(xué)習(xí)和訓(xùn)練,所以大量的書(shū)籍、文獻(xiàn)、錄音、影視劇都成為人類(lèi)所需的精神資源。人作為社會(huì)動(dòng)物,在社會(huì)中生存就離不開(kāi)與其他人進(jìn)行交流,進(jìn)而結(jié)成各種各樣的關(guān)系,在處理某一事務(wù)時(shí),與此事有關(guān)的人就會(huì)發(fā)揮各自的作用。從這個(gè)角度來(lái)看,我們?cè)谏鐣?huì)中的朋友、同事、同學(xué)、上下級(jí)等等,都可以理解成為是一種資源。在萬(wàn)維網(wǎng)的框架下,資源經(jīng)常被誤解為只包括可獲取的網(wǎng)頁(yè)數(shù)據(jù),但是在語(yǔ)義網(wǎng)的框架下,資源不僅僅包含網(wǎng)頁(yè)數(shù)據(jù),而是被擴(kuò)展為上述任何事物。
在語(yǔ)義描述層面中,個(gè)體或者組織對(duì)持有的資源或者資源網(wǎng)絡(luò)進(jìn)行描述,并且創(chuàng)建數(shù)據(jù)發(fā)布到互聯(lián)網(wǎng)上。比如“用戶(hù)A”對(duì)自己所認(rèn)知的“資源網(wǎng)絡(luò)A”進(jìn)行了描述,并且將“描述數(shù)據(jù)A”發(fā)布到互聯(lián)網(wǎng)上。之后,“用戶(hù)B”在對(duì)另外一個(gè)資源網(wǎng)絡(luò)“資源網(wǎng)絡(luò)B”進(jìn)行描述時(shí),就可以引用已經(jīng)發(fā)布的“描述數(shù)據(jù)A”,進(jìn)而將“資源網(wǎng)絡(luò)A”和“資源網(wǎng)絡(luò)B”相互連接,形成一個(gè)更大的節(jié)點(diǎn)之間相互連接的資源網(wǎng)絡(luò)??梢哉f(shuō),通過(guò)這種描述數(shù)據(jù)的共享和引用,語(yǔ)義網(wǎng)將散布在各處的各個(gè)資源子網(wǎng)絡(luò)相互連接,最終形成一個(gè)全局的資源網(wǎng)絡(luò)。
在數(shù)據(jù)傳輸層面中:可以說(shuō),語(yǔ)義網(wǎng)作為一個(gè)龐大的全局資源網(wǎng)絡(luò)是依托于具體的資源描述數(shù)據(jù)而存在的,而想要發(fā)布、共享、獲取這些資源描述,用戶(hù)就需要通過(guò)某種傳輸網(wǎng)絡(luò)將這些語(yǔ)義描述進(jìn)行傳遞。完成這項(xiàng)工作的是計(jì)算機(jī)通信網(wǎng)絡(luò),更具體一點(diǎn)則可以說(shuō),通常這些描述被以某種數(shù)據(jù)的形式在互聯(lián)網(wǎng)中被傳遞。
為了進(jìn)一步闡釋語(yǔ)義網(wǎng)的理論框架,理清語(yǔ)義網(wǎng)在三個(gè)層面上的特性,這里舉一個(gè)簡(jiǎn)單的例子加以說(shuō)明。如圖6所示,這里假設(shè)皮特和露西是兄妹,他們都是現(xiàn)實(shí)世界中的人。這樣,一個(gè)簡(jiǎn)單的人間關(guān)系網(wǎng)絡(luò)就得以形成,而人際關(guān)系網(wǎng)絡(luò)又可視為資源網(wǎng)絡(luò)的一種。通過(guò)對(duì)這個(gè)資源網(wǎng)絡(luò)觀察和理解,可以獲得對(duì)皮特、露西以及他們之間關(guān)系的認(rèn)知,已獲得的認(rèn)知又可以使用某種具有標(biāo)準(zhǔn)格式的描述邏輯語(yǔ)言來(lái)對(duì)其進(jìn)行描述,并使得這種描述具有足夠的語(yǔ)義。比如,使用Turtle語(yǔ)言進(jìn)行描述,具體的描述內(nèi)容如下:
@prefix example:
example:皮特 example:哥哥 example:露西
example:露西 example:妹妹 example:皮特
完成描述之后,這個(gè)描述數(shù)據(jù)可被以數(shù)據(jù)文件的形式存儲(chǔ)到本地計(jì)算機(jī)的存儲(chǔ)器里,比如用“皮特與露西.ttl”為文件名將其存儲(chǔ)。之后,這個(gè)文件又可以通過(guò)互聯(lián)網(wǎng)上傳到某個(gè)服務(wù)器,完成對(duì)資源描述的發(fā)布,并獲得該文件的網(wǎng)絡(luò)地址“http://example/皮特與露西.ttl”。其他人也就可以通過(guò)互聯(lián)網(wǎng),從服務(wù)器上訪(fǎng)問(wèn)并獲取這份文件,進(jìn)而對(duì)其描述的資源獲得相應(yīng)的了解。另外,基于已經(jīng)被發(fā)布到網(wǎng)上的資源描述,其他人也可以對(duì)其直接引用,進(jìn)而發(fā)布新的資源描述。比如,皮特和露西的母親就可以引用“http://example/皮特與露西.ttl”文件中所描述的個(gè)體,并且添加自己與這兩個(gè)個(gè)體之間的聯(lián)系。我們假設(shè)這位母親的名字叫做瑪麗,那么她就可以追加發(fā)布類(lèi)似的資源描述:
@prefix example:
@prefix new:
example:瑪麗 new:媽媽example:皮特
example:瑪麗new:媽媽 example:露西
綜上所述,本文將語(yǔ)義網(wǎng)視為資源網(wǎng)絡(luò)的一種,對(duì)這種資源網(wǎng)絡(luò)的認(rèn)知?jiǎng)t通過(guò)描述邏輯語(yǔ)言進(jìn)行記錄,最后通過(guò)互聯(lián)網(wǎng)進(jìn)行傳輸和共享。
4 結(jié)語(yǔ)
自Tim Berners-Lee提出語(yǔ)義網(wǎng)的概念以來(lái),19年間語(yǔ)義網(wǎng)領(lǐng)域得到了長(zhǎng)足的發(fā)展,無(wú)論是在技術(shù)實(shí)現(xiàn)層面,還是在實(shí)踐應(yīng)用層面,都有許多的學(xué)者進(jìn)行了大量的探索和研究,語(yǔ)義網(wǎng)也在這樣的發(fā)展中逐漸演變?yōu)橛?jì)算機(jī)科學(xué)的一個(gè)重要分支。但是,相比其他傳統(tǒng)學(xué)科,語(yǔ)義網(wǎng)的基礎(chǔ)理論體系尚不健全,并且鮮有專(zhuān)家學(xué)者專(zhuān)門(mén)對(duì)其進(jìn)行梳理、界定和闡釋?zhuān)@對(duì)語(yǔ)義網(wǎng)的長(zhǎng)遠(yuǎn)發(fā)展極為不利。
為緩解這一矛盾,調(diào)節(jié)當(dāng)前語(yǔ)義網(wǎng)基礎(chǔ)理論體系與實(shí)踐應(yīng)用發(fā)展的平衡,本文首先通過(guò)對(duì)符號(hào)三角模型的研究與擴(kuò)展,辨析和選定了若干相關(guān)原始概念,作為討論語(yǔ)義網(wǎng)本質(zhì)屬性的基礎(chǔ)。然后,基于以上已選定的原始概念,本文對(duì)三類(lèi)語(yǔ)義網(wǎng)的典型定義進(jìn)行了梳理和對(duì)比,并給出了以其核心屬性為構(gòu)成要素的語(yǔ)義網(wǎng)定義。最后,本文對(duì)該語(yǔ)義網(wǎng)定義進(jìn)行展開(kāi)討論,通過(guò)本體分析的方法,強(qiáng)調(diào)語(yǔ)義網(wǎng)作為一種特殊資源網(wǎng)絡(luò)的存在,并給出了語(yǔ)義網(wǎng)的基礎(chǔ)理論框架,以彌補(bǔ)傳統(tǒng)語(yǔ)義網(wǎng)體系結(jié)構(gòu)過(guò)于偏重技術(shù)層次劃分的不足。
本文認(rèn)為,語(yǔ)義網(wǎng)作為一門(mén)獨(dú)立完整的學(xué)科,想要長(zhǎng)期穩(wěn)定的發(fā)展,除了實(shí)現(xiàn)技術(shù)的支持外,還需要領(lǐng)域內(nèi)的學(xué)者在其基礎(chǔ)理論體系上達(dá)成一致。例如,語(yǔ)義網(wǎng)的概念,語(yǔ)義網(wǎng)的理論框架等,都是領(lǐng)域內(nèi)學(xué)者賴(lài)以溝通和交流的基礎(chǔ)。本文在這方面的工作,正是為了構(gòu)建這樣一個(gè)共享的語(yǔ)義網(wǎng)基礎(chǔ)理論體系而做出的努力,并且希望語(yǔ)義網(wǎng)可以作為一門(mén)獨(dú)立的學(xué)科不斷的自我完善和發(fā)展,并實(shí)現(xiàn)更廣泛的智能化社會(huì)實(shí)踐。
參 考 文 獻(xiàn)
[ 1 ] Oxford Brookes University. History of the Web[EB/OL]. [2017-03-15]. http://www.w3c.it/education/2012/upra/documents/origins.pdf.
[ 2 ] Berners-Lee T. Semantic Web Road map[EB/OL]. [2017-03-15]. https://www.w3.org/DesignIssues/Semantic.html.
[ 3 ] Kobilarov G,Scott T,Raimond Y,et al. Media Meets Semantic Web–how the Bbc Uses Dbpedia and linked data to Make Connections[C] // European Semantic Web Conference. Berlin Heidelberg:Springer,2009:723-737.
[ 4 ]丁楠,王鈺,潘有能. 基于關(guān)聯(lián)數(shù)據(jù)的政府信息聚合研究[J]. 情報(bào)理論與實(shí)踐,2015,(7):76-79,85.
[ 5 ] Miranda S,Mangione GR,Orciuoli F,et al. Automatic Generation of Assessment Objects and Remedial Works for MOOCs[C] // 12th International Conference on Information Technology Based Higher Education and Training (ITHET). Antalya. IEEE,2013:1-8.
[ 6 ]周曉劍. 基于CiteSpace的語(yǔ)義網(wǎng)國(guó)外研究熱點(diǎn)與前沿分析[J]. 情報(bào)探索,2014,(9):24-27.
[ 7 ]王珊珊,肖明. 文獻(xiàn)計(jì)量分析的我國(guó)語(yǔ)義網(wǎng)研究綜述[J]. 情報(bào)工程,2016,(2):52-61.
[ 8 ]胡珊. 語(yǔ)義網(wǎng)應(yīng)用框架研究[D]. 南京:南京大學(xué),2014.
[ 9 ]萬(wàn)麗,丁曉梅. 符號(hào)學(xué)語(yǔ)義三角形的模式變體[J]. 大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2006,(3):141-144.
[ 10 ]索緒爾. 普通語(yǔ)言學(xué)教程[M]. 北京:商務(wù)印書(shū)館,1999:102.
[ 11 ] Ogden CK,Richards IA,Malinowski B. The Meaning of Meaning:A Study of the Influence of Language Upon Thought and of the Science of Symbolism[M]. London & New York:K. Paul,Trench,Trubner & Company,1923:11.
[ 12 ] Smith B. Beyond concepts:Ontology as Reality Representation[C] // 3rd International Conference on Formal Ontology in Information Systems. Amsterdam. IOS,2004:73-84.
[ 13 ] Ferrario R,Oltramari A. Towards a Computational Ontology of Mind[C] // Aerospace Conference. Big Sky,MT. IEEE,2005:1-9.
[ 14 ] Maass W,Goyal S,Behrendt W. Knowledge Content Objects and a Knowledge Content Carrier[C] // the European Workshop for the Integration of Knowledge,Semantics and Digital Media Technology. London. QMUL,2004:449-456.
[ 15 ] Mentor QA. Task Taxonomies for Knowledge Content D07[R]. Metokis Project,2004.
[ 16 ] Jureta IJ,Mylopoulos J,F(xiàn)aulkner S. A Core Ontology for Requirements[J]. Applied Ontology,2009,4(3):169-244.
[ 17 ] Fortier JY,Kassel G. Managing Knowledge at the Information Level:an Oontological Approach[C] // ECAI04 Workshop on Knowledge Management and Organizational Memories. Valencia,Spain. 2004:39-45.
[ 18 ] W3C,W3C SEMANTIC WEB ACTIVITY[EB/OL]. [2017-03-15]. https://www.w3.org/2001/sw/.
[ 19 ] Berners-Lee T,Hendler J,Lassila O. The Semantic Web[J]. Scientific American,2001,284 (5):28-37.
[ 20 ] Domingue J,F(xiàn)ensel D,Hendler JA. Handbook of Semantic Web Technologies[M]. Berlin Heidelberg:Springer,2011:5.
[ 21 ] Antoniou G,Groth P,Harmelen F,et al. A Semantic Web Primer[M]. London,England:MIT Press,2012:1-19.
[ 22 ] Yu L. A Developers Guide to the Semantic Web[M]. Berlin Heidelberg:Springer,2014:17-21.
[ 23 ] Berners-Lee T. Artificial Intelligence and the Semantic Web[EB/OL]. [2017-03-15]. https://www.w3.org/2006/Talks/0718-aaai-tbl/Overview.html#(14)
(本文責(zé)任編輯:郭沫含)