摘要:從Weh 2.0向Weh 3.0過渡的過程中,網(wǎng)絡(luò)信息的組織是一個動態(tài)過程,而不是靜態(tài)過程。面對龐大煩瑣的網(wǎng)絡(luò)信息資源,傳統(tǒng)的人工組織方式已經(jīng)不能滿足網(wǎng)絡(luò)信息資源組織的新要求。只有將各種傳統(tǒng)的信息組織方法與新的網(wǎng)絡(luò)信息組織方法相結(jié)合,才能提高網(wǎng)絡(luò)信息組織的質(zhì)量,搜索效率和信息利用率。通過大眾分類法、網(wǎng)絡(luò)信息自組織、知識組織和本體語義網(wǎng)的發(fā)展,網(wǎng)絡(luò)信息資源組織將得到進一步的發(fā)展。
關(guān)鍵詞:網(wǎng)絡(luò)信息資源;weh2.0;web3.0;信息組織社會化媒體
中圖分類號:TP391
文獻標識碼:A
文章編號:1009-3044(2019)36-0033-03
1面向社會化媒體的網(wǎng)絡(luò)信息資源
1.1網(wǎng)絡(luò)信息資源概念
網(wǎng)絡(luò)信息資源以電子數(shù)據(jù)的形式在存儲在非紙質(zhì)印刷載體中的各種形式的信息,例如文本,圖像,聲音,動畫,視頻等,并且通過以下方式再現(xiàn):網(wǎng)絡(luò)通信,計算機或終端等方式。網(wǎng)絡(luò)信息資源是計算機網(wǎng)絡(luò)可以使用的各種信息資源的總和。[1]網(wǎng)絡(luò)信息資源是電子化、數(shù)字化了的,并通過計算機網(wǎng)絡(luò)進行傳輸、共享和利用的資源。
1.2社會化媒體概述
Web2.0的出現(xiàn),不但使得因特網(wǎng)上的內(nèi)容豐富,并且滿足了與用戶共同創(chuàng)新與分享的需求,形成了彼此溝通協(xié)作的社區(qū)。隨著互聯(lián)網(wǎng)技術(shù)的進一步發(fā)展,2006年一種新型的媒體形式:社會化媒體(Social Media)進入了人們的視野,加快了人類邁向信息社會的步伐,社會化媒體是一種給予用戶極大參與空間的新型在線媒體,這是人們彼此共享想法,見解,經(jīng)驗和觀點的工具和平臺。[2]具有傳統(tǒng)媒體并不具備的獨有特性:公開性、參與性、共享性、交流性、聯(lián)通性以及社區(qū)化特性,它模糊了時間和空間的界限,也模糊了媒體和受眾之間的界限。用戶被鼓勵主動參與到社會化媒體的平臺中,參與信息創(chuàng)建,交流,反饋,協(xié)作,貢獻等,在沒有任何障礙或限制的情況下加入和使用社交媒體,并輕松地形成一個社區(qū)以與、對共同感興趣的信息內(nèi)容進行交互。[3]而Web3.0是Web2.0技術(shù)的進一步發(fā)展,通過互聯(lián)網(wǎng)與通訊的融合,用戶可以用所有智能終端及時、輕松享受各種信息服務(wù),在Web2.0的基礎(chǔ)上,基于SPARQL(SimpleProtocol and RDF Query Language)、RDF(Resource DescriptionFramework)等標準,可以智能地使用各種數(shù)據(jù)庫程序,這些數(shù)據(jù)庫程序基于語義Web連接本體信息資源,并通過具有及時性,集成性和交互性的智能技術(shù)為用戶提供個性化服務(wù),Web3.0的技術(shù)核心是語義網(wǎng)技術(shù)。[4]
1.3面向社會化媒體的網(wǎng)絡(luò)信息資源特點
1.3.1信息量基數(shù)大、增速快
大數(shù)據(jù)時代,我們無時無刻不面臨著海量并且不斷激增的數(shù)據(jù),網(wǎng)絡(luò)平臺的開放性和自由性使得信息在發(fā)布時沒有統(tǒng)一的標準。同時也缺乏宏觀的管理,這就導(dǎo)致了信息數(shù)量的龐大、復(fù)雜并且排列無序。
1.3.2形式多樣,分布廣泛
內(nèi)容豐富,形式多樣,涵蓋不同學(xué)科、領(lǐng)域、地域、語言,并且包括文本、圖像、音頻、視頻等多種格式,除了結(jié)構(gòu)化數(shù)據(jù)外,更多的是半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)類型。網(wǎng)絡(luò)信息的全球化分布,使得社會化媒體連接了世界的每一個角落,信息的分布也遍布不同國家、不同地區(qū)。
1.3.3網(wǎng)絡(luò)信息流動加速
在面向社會化媒體的網(wǎng)絡(luò)種,信息流的運動成為信息傳遞的主要形式,是信息資源的時空轉(zhuǎn)移,并且在流動的過程中還會不斷地產(chǎn)生與之相關(guān)的其他信息。在傳統(tǒng)的網(wǎng)絡(luò)信息資源中,信息的傳遞大部分是單向的,但面向社會化媒體的網(wǎng)絡(luò)中信息的傳遞、接收和創(chuàng)造都是雙向的,甚至是多向的,[5]網(wǎng)絡(luò)主體可以不受時間和地域限制實現(xiàn)信息的交換和共享,信息流動速度也更迭迅速。
1.3.4個性化信息增多
面向社會化媒體的網(wǎng)絡(luò)信息都是圍繞用戶產(chǎn)生的,每一個用戶的信息組織體系都是個性化的存在,這也使用戶在信息傳遞系統(tǒng)中是被動的,被動的接收信息。個性化信息的增多,會影響信息傳遞的過程,隨著興趣、關(guān)注熱點、參與度以及需求的改變,會造成個性化信息的不確定性。那么信息的組織方式也會受到信息有序化程度的影響。
1.3.5版權(quán)問題復(fù)雜化
由于傳統(tǒng)的信息資源大多是紙質(zhì)的,而且大部分資源已經(jīng)具有完善的版權(quán)保護制度以及法律法規(guī),而在網(wǎng)絡(luò)平臺上的信息資源相關(guān)保護制度將更加復(fù)雜,且難以規(guī)定。
1.4面向社會化媒體的網(wǎng)絡(luò)信息資源組織
在Web2.0和Web3.0的理念和技術(shù)應(yīng)用環(huán)境下,網(wǎng)絡(luò)信息資源組織的方式方法也分為面向用戶、面向協(xié)作、社會化、面向機器理解幾個方面。
在面向用戶的信息組織中,比較有代表性的有博客,信息組織方法主要有:時間排序法、大眾分類法、信息行為排序方法等。
在面向協(xié)作的信息組織中,比較有代表性的有維基百科,是通過協(xié)作的方式來創(chuàng)建、組織、維護信息資源。它具有如下特征:信息內(nèi)容具有一定的編輯規(guī)則、信息行為具有一定的規(guī)范、信息內(nèi)容不是一成不變,二是不斷地更新和演進的。
社會化特征主要體現(xiàn)在用戶對信息對象的處理行為上,例如在抖音中,用戶瀏覽、下載、評論、搜索信息對象,賦予了信息資源本身社會化的特性,同時個性化的信息資源也增加了信息共享的需求和程度。
面向機器理解的信息組織與面向用戶是相對的,HTML這類信息視圖適合于用戶理解,但不適合機器理解。XML是促成機器理解信息的基礎(chǔ),建立在XML基礎(chǔ)上的各類協(xié)議(RSS、ATOM、OWL等)可以支持不同層次的機器理解,提高機器智能。[6]
2網(wǎng)絡(luò)信息資源組織研究現(xiàn)狀
2.1關(guān)于信息組織的技術(shù)
這方面的研究對象,主要是關(guān)于搜索引擎、元數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、知識發(fā)現(xiàn)、標記語言、數(shù)據(jù)庫技術(shù)、自動跟蹤技術(shù)、機器翻譯技術(shù)、信息檢索的推拉技術(shù)、虛擬圖書館技術(shù)、專業(yè)指引庫技術(shù)、智能代理技術(shù)、多媒體技術(shù)、人T智能技術(shù)等。武漢大學(xué)信息管理學(xué)院的晏凌與王應(yīng)解基于聯(lián)機分析挖掘技術(shù)(OLAM),提出了一種新的網(wǎng)絡(luò)信息組織策略——智能化信息導(dǎo)航系統(tǒng)及其組織原則:空間暗示原則、用戶原則、同一性原則及平衡原則。[7]李洪、隋利玲概括了三種多媒體信息組織和管理技術(shù),即擴展現(xiàn)有的關(guān)系數(shù)據(jù)庫模型,面向?qū)ο蟮臄?shù)據(jù)模型,超文本和超媒體技術(shù),介紹了“中國路橋多媒體數(shù)據(jù)庫”的功能及其多媒體信息的組織管理方式。[8]
2.2關(guān)于社交媒體的信息組織
在對社交媒體信息組織的相關(guān)研究中,前人的工作分別在內(nèi)容摘要、內(nèi)容分類和聚類等不同的技術(shù)領(lǐng)域提出了相應(yīng)的解決方案。
例如摘要(document summarization)[9]技術(shù)從數(shù)據(jù)壓縮的角度來完成對海量信息的組織。其中,許多研究者通過從給定文檔集中抽取出代表性的句子和可讀性高的句子來為產(chǎn)品評論數(shù)據(jù)生成更為簡短的摘要。而Yang等人[10]提出利用社交媒體之間的引用以及社交媒體用戶的社交網(wǎng)絡(luò)來提高微博摘要質(zhì)量的方法。此外,如果給定一個已知的內(nèi)容分類體系,我們也可以利用文檔分類(document classiflcation)算法[11]將數(shù)據(jù)劃分到不同的類別上去。
3網(wǎng)絡(luò)信息資源組織的層次和實現(xiàn)方法
3.1傳統(tǒng)網(wǎng)絡(luò)信息組織方法
3.1.1分類組織法
分類組織方法是指網(wǎng)絡(luò)分類組織方法。它首先對從網(wǎng)絡(luò)獲得的各個主題領(lǐng)域的信息資源進行標識和匯總,然后根據(jù)詳細信息對它們進行分類和匯總,然后將信息整合到相同的字段中,然后再根據(jù)特定的順序和規(guī)則來進行系統(tǒng)的索引編號。[12]分類組織法是從宏觀的角度出發(fā)為用戶揭示信息的內(nèi)涵。
分類組織的方法是按總體輪廓對信息資源進行分類。這樣可以清晰地組織復(fù)雜的信息資源,并允許用戶從根據(jù)索引分類的類別中選擇所需的信息資源。其優(yōu)點主要體現(xiàn)在高搜索成功率和易學(xué)習(xí)的操作步驟,節(jié)省了管理成本、提高了檢索效率。但是,分類組織方法僅適用于初步信息資源管理的建立,不同信息資源之間沒有辦法進行有效的聯(lián)系。且面對信息時代的大量資源,這種方法有一些局限性,例如無法規(guī)范的描述信息資源的準確性,及時性,權(quán)威性等,用戶只能在使用信息時自行判斷。
3.1.2主題組織法
主題組織方法提供作者,標題,類名或關(guān)鍵詞,標題詞和其他形式來揭示和組織知識,用戶可以在搜索關(guān)鍵詞后獲取相關(guān)的超鏈接。主題合成方法使信息的揭示更加直觀,并允許根據(jù)信息的特征,結(jié)合信息手段本身的搜索手段,方便地搜索目標信息。但這種組織方式對信息的描述還不夠深入,必須在建立嚴格的主題樹網(wǎng)絡(luò)之后應(yīng)用。由于關(guān)鍵詞的廣泛關(guān)聯(lián)作用,其搜索的準確性較低,也造成了整體的復(fù)雜冗余,也一定程度上降低了信息利用率。
3.1.3元數(shù)據(jù)組織法
專門用于描述數(shù)據(jù)特征和屬性的數(shù)據(jù),即有關(guān)該數(shù)據(jù)的數(shù)據(jù)被稱為元數(shù)據(jù)。包括數(shù)據(jù)庫和搜索引擎。元數(shù)據(jù)是對資源信息的描述。目前常見的類型有MARC、GILS、TEI、FGDC、DC、IAFA等[13]。
應(yīng)用元數(shù)據(jù)法,可以對信息資源的現(xiàn)有一般信息即內(nèi)容和主題等進行更深入的描述,網(wǎng)絡(luò)信息資源的描述和組織使用戶可以更方便地組織和評估信息資源,以便做出快速,合理的決策和選擇。元數(shù)據(jù)組織是相比前兩種傳統(tǒng)組織法方法而言更深入的組織方法。
3.2新型數(shù)字信息組織方法
隨著網(wǎng)絡(luò)的擴展,互聯(lián)網(wǎng)上的信息量呈爆炸式增長趨勢。信息系統(tǒng)需要維護的數(shù)據(jù)庫也變得非常龐大。采用傳統(tǒng)的檢索方法來查詢這樣的量網(wǎng)絡(luò)信息是非常耗時的,有時也很難滿足用戶的信息需求。在對異質(zhì)異構(gòu)的海量網(wǎng)絡(luò)信息資源進行組織時,急需更加自由簡便、靈活易用的信息組織方式。在此背景下,本體、主題詞表、分眾分類法等新型的信息組織方式應(yīng)運而生。
3.2.1本體
在信息科學(xué)領(lǐng)域,為了提高網(wǎng)絡(luò)信息檢索系統(tǒng)檢索精度和效率,人們引入本體技術(shù)作為技術(shù)手段。作為一種工具,本體使用獨特的功能來提供一種有效的方法來解決網(wǎng)絡(luò)中信息資源的各種問題。本質(zhì)上,它描述了網(wǎng)絡(luò)中的概念及其之間的關(guān)系,并在共享范圍內(nèi)具有清晰唯一的定義。[14]本體技術(shù)最近已引起計算機和情報界的關(guān)注。如今,本體已廣泛用于語義Web,智能信息檢索,信息集成和數(shù)字圖書館等領(lǐng)域。
3.2.2分眾分類法
最早由信息科學(xué)家托馬斯·范德(Thomas Vander)首先提出的分眾分類法是一種適應(yīng)互聯(lián)網(wǎng)發(fā)展的新型知識自組織方法。該分類方法更加方便靈活,結(jié)合了用戶的認知度,突出了群體智慧與合作的重要性,促進了用戶信息的獲取與交流。分眾分類法的執(zhí)行主體是普通網(wǎng)絡(luò)用戶,用戶是直接參與信息組織工作的,用戶可以在發(fā)布信息時標記信息資源或標記信息,也可以在沒有專家或工具協(xié)助的情況下單獨完成知識組織任務(wù)。分眾分類法主要用于組織網(wǎng)絡(luò)信息資源,但由于其等級結(jié)構(gòu)劃力不明確,準確性和時效性差,應(yīng)用范想較為狹窄。
3.2.3主題詞表
主題詞表,又稱敘詞表、檢索詞表或詞庫,與自然語言相比,主題詞表是經(jīng)過標準化,系統(tǒng)化的定義的名詞術(shù)語的集成。主題詞匯表是指專家如何使用領(lǐng)域敘詞表來定義和組織單詞及其語義關(guān)系。主題詞表已經(jīng)從傳統(tǒng)的知識組織方法轉(zhuǎn)變?yōu)闃?gòu)建知識組織系統(tǒng)的重要手段,并已成為大規(guī)模網(wǎng)絡(luò)知識組織系統(tǒng)中必不可少的工具之一。但是詞匯量的可擴展性很低,并且編譯復(fù)雜需要大量的人力和時間資源,并影響詞表的及時性。
4網(wǎng)絡(luò)信息資源信息組織的發(fā)展趨勢和影響
在web2.0不斷向web3.0演進的過程中,作為交互層的結(jié)構(gòu)性要素的信息組織也呈現(xiàn)出自動化和個性化的演進趨勢。我們就這兩個特征出現(xiàn)的依據(jù)和它們涉及的技術(shù)進行梳理,不難發(fā)現(xiàn)技術(shù)架構(gòu)和標準與用戶需求不斷耦合的過程,而隨著技術(shù)的進步,用戶對互聯(lián)網(wǎng)信息也有了更高更個性化的需求,也為更高層次的信息組織方式乃至網(wǎng)絡(luò)信息的自組織和建構(gòu)的演進指出了前進的方向。下面先就信息組織的自動化和個性化兩個特征進行探討:
4.1網(wǎng)絡(luò)信息資源組織的自動化發(fā)展
基于大數(shù)據(jù)和云計算等技術(shù)的發(fā)展,網(wǎng)絡(luò)信息資源從數(shù)量到結(jié)構(gòu)與以往相比都有了飛躍式的豐富,而存儲和計算的設(shè)備和架構(gòu)也與以往有了本質(zhì)的不同。另外,越來越多的技術(shù)和設(shè)備被引入到有關(guān)網(wǎng)絡(luò)信息資源的組織和評估的研究工作中,當前的研究方法和模型頁已經(jīng)改變和完善。同時,隨著信息資源總量的增加,基于海量數(shù)據(jù)乃至圖片和流媒體的無監(jiān)督學(xué)習(xí)成為可能,給信息組織的自動化鋪平了道路。對于用戶而言,可以更便捷的享受研究成果,對網(wǎng)絡(luò)資源組織者來說,應(yīng)該致力于改善用戶體驗、強化以用戶為中心的原則,我們可以從以下兩個層次對網(wǎng)絡(luò)信息資源組織的自動化進行展望:
4.1.1主題分類一體化的發(fā)展趨勢
在信息資源的數(shù)量和種類日益豐富的當下,進行網(wǎng)絡(luò)信息資源組織可以更尊重它們本身的屬性和粒度,具體而言就是使用分類主題一體化方法來組織網(wǎng)絡(luò)信息。在以往的信息資源組織中,分類方法基于事物的主題屬性執(zhí)行族性檢索,但是主題方法是一種特征搜索,具體取決于反映人類思維的兩個不同方面的主題類別和執(zhí)行。而在當下的技術(shù)條件下,我們可以尊重人們本來的認知過程,通過將分類法和主題方法有機地結(jié)合在一起,分類主題一體化對于加強分類搜索和主題檢索之間的關(guān)系是有用的,便于從主題角度充分利用分類系統(tǒng)。
4.2社交網(wǎng)絡(luò)的興起為網(wǎng)絡(luò)信息資源組織引入的個性化要素
標簽是標準的Web 2.0組件之一,最初旨在滿足多維分類的需求。這是基于對信息資源的概括和理解,是對信息內(nèi)容的個人理解的注釋,可以不一定是主題,且可以是與時間,內(nèi)容或信息資源無關(guān)的詞,標簽比關(guān)鍵詞更方便,并且可以從多個維度來提示信息的內(nèi)容和分類。大眾標注是取決于用戶決定的一種分類方式。用戶可以通過為博客、照片、喜炊的網(wǎng)頁等添加一個或多個標簽來自己組織內(nèi)容。這種更自由和靈活的功能極大地增強了網(wǎng)站的可用性,功能和個性化。
特別是在社交媒體興盛的當下,大眾標注多維度的特性能夠準確反應(yīng)網(wǎng)絡(luò)信息的傳播和使用的狀況,通過改變一個事件的標注就可以讓傳播和利用的途徑和方式發(fā)生根本的改變,使用戶對網(wǎng)絡(luò)信息資源的自我組織和管理成為可能,讓網(wǎng)絡(luò)資源的信息組織更趨于個性化。另外,公共標簽是靈活可變的標簽,信息資源標簽的粒度是可變的,因此用戶信息資源標簽更適合于用戶時代的需求。通過將公共注釋的多維特征和注釋的靈活可變功能同時應(yīng)用于信息資源注釋,信息資源的組織和分類變得更加詳細和靈活。
傳統(tǒng)意義上的信息組織更偏重于信息分類,識別系統(tǒng)來表述信息內(nèi)容、導(dǎo)航系統(tǒng)負責(zé)查看信息和控制信息,用戶可以通過搜索找到所需的信息。社交網(wǎng)絡(luò)將上述的模塊整合起來,基于龐大的數(shù)據(jù)流和自然語言處理技術(shù)導(dǎo)向了處理過程的自動化,在使用社交網(wǎng)絡(luò)的過程中,社交網(wǎng)絡(luò)信息資源組織根據(jù)用戶的需求進行個性化,這必然指向信息組織向信息建構(gòu)發(fā)展的趨勢。
參考文獻:
[1]周寧.信息組織[M].武漢:武漢大學(xué)出版社,2017:337-339.
[2]社會化媒體[EB/OL].[2019-05-18].https://wiki.mbalib.com/wi-ki/% E7%A4%BE% E4c/oBCo/0 9A% E5%8C% 96%E5%AA%920/oE4%BD%93
[3]范哲.社會化媒體情境中信息素養(yǎng)的內(nèi)容框架研究[J].情報雜志,2012(31):170-174+164.
[4]張冰潔.Web3.0環(huán)境下圖書館信息咨詢服務(wù)創(chuàng)新研究[D].大連:遼寧師范大學(xué),2018.
[5]吳東陽,梁秋春.社會網(wǎng)絡(luò)環(huán)境下的薪資組織與共享模式研究[J].傳播與版權(quán),2018(5):116-118.
[6]周寧.信息組織[M].武漢:武漢大學(xué)出版社,2017:348-352.
[7]晏凌,王應(yīng)解.Intemet信息資源的組織策略——建立基于聯(lián)機分析挖掘的導(dǎo)航系統(tǒng)[J].圖書情報工作,2000(5).
[8]李洪,隋利玲.多媒體信息的組織和管理技術(shù)[J].現(xiàn)代圖書情報技術(shù),2000(2).
[9] Sebastiani F.Machine learning in automated text categorization[J].Acm Computing Surveys,2002, 34(1):1-47.
[10]鐘瑩,麥淑平,黎細玲.基于網(wǎng)絡(luò)的信息資源組織與評價現(xiàn)狀及發(fā)展趨勢研究[J].圖書館學(xué)研究,2013 (3):67-71.
[11]郭海明.網(wǎng)絡(luò)信息資源組織方式探析[J].情報資料工作,2003(3):50-52.
[12]崔金棟.基于本體的網(wǎng)格信息檢索模型研究[D].吉林大學(xué),2011.
[13]孫中秋,陳曉美,畢強.知識自組織與他組織方法類比與融合研究[J].數(shù)字圖書館論壇,2014(9):18-22.
[14]陳成,邵波.基于大眾標注技術(shù)的網(wǎng)站信息構(gòu)建研究[J].圖書情報工作,2011,55(3):116-119+22.
【通聯(lián)編輯:朱寶貴】
收稿日期:2019-10-25
作者簡介:劉雨晴(1995-),女,黑龍江哈爾濱人,在讀碩士研究生,主要研究方向為圖書情報。