王幸子
(中共河南省委黨校 圖書館,河南 鄭州 450000)
大數(shù)據(jù)背景下,網(wǎng)絡(luò)信息量暴漲,信息來源的分布非常廣泛,信息層次的復(fù)雜度也越來越高。在廣泛的信息來源中,分布著針對(duì)同一主題的同一個(gè)描述目標(biāo)的不同或者相同側(cè)面的相關(guān)信息,這些信息在表現(xiàn)形式、可信度、語義內(nèi)涵、存儲(chǔ)結(jié)構(gòu)、側(cè)重點(diǎn)等方面都不盡相同,但它們之間卻存在著某種必然的聯(lián)系,這些信息即大量的多模態(tài)信息[1]。多模態(tài)信息沖破了空間和時(shí)間這兩個(gè)維度的限制,測量維度更加多樣,因而能夠獲得信息比單模態(tài)更加的全面準(zhǔn)確,服務(wù)質(zhì)量也就得到了提高[2]。一方面如果簡單孤立地處理不同模態(tài)的信息,那么信息資源的浪費(fèi)就是必然的,最終不能達(dá)到理想的服務(wù)目標(biāo);另一方面用戶側(cè)的信息需求也有了很多新想法,所需的信息模態(tài)變多,期待信息服務(wù)結(jié)果更可視化,可讀性易讀性要求更高,融合體的出現(xiàn)可以讓用戶更簡單方便的了解同一主題下的不同側(cè)面信息[3]。
如用戶能夠獲取到的信息往往是分散、各單模態(tài)的,隨著信息量的增加,用戶信息需求與利用的矛盾加深,為了緩解這一矛盾,急需提供多模態(tài)網(wǎng)絡(luò)信息資源的融合服務(wù)。更進(jìn)一步說,可以設(shè)想構(gòu)建出這樣一個(gè)多模態(tài)網(wǎng)絡(luò)信息資源融合系統(tǒng),它統(tǒng)一融合了同一主題下的不同單模態(tài)信息,將原本的信息融合成為一個(gè)統(tǒng)一整體[4]。這個(gè)服務(wù)系統(tǒng),可以使用戶的社會(huì)性信息網(wǎng)絡(luò)更加穩(wěn)定,社會(huì)性信息網(wǎng)絡(luò)間的共享更加方便,社會(huì)化應(yīng)用體系由此建立。
開展多模態(tài)網(wǎng)絡(luò)信息資源融合應(yīng)用需要經(jīng)過4個(gè)過程,信息搜集、信息組織、信息融合及信息提供[3]。這些環(huán)節(jié)都需要相應(yīng)的技術(shù)支持,圖1為多模態(tài)網(wǎng)絡(luò)信息資源融合的技術(shù)保障。
圖1 多模態(tài)網(wǎng)絡(luò)信息資源融合技術(shù)保障
多模態(tài)網(wǎng)絡(luò)信息資源融合應(yīng)用面對(duì)的信息資源大部分是預(yù)先存在的,如何利用這些信息資源是融合應(yīng)用需要解決的主要問題。信息搜集就是從網(wǎng)絡(luò)上分布的大量異構(gòu)信息資源中提取與某一主題或某一應(yīng)用相關(guān)的信息,數(shù)據(jù)挖掘技術(shù)和 web 信息抽取技術(shù)是解決該問題的關(guān)鍵技術(shù)[5]。
信息組織是指對(duì)搜集到的信息按形式特征和內(nèi)容特征有序化[6]。它包括3方面的內(nèi)容:信息標(biāo)引、信息描述、信息存儲(chǔ)。海量網(wǎng)絡(luò)信息的標(biāo)引是個(gè)巨大的工程,自動(dòng)標(biāo)引技術(shù)能自動(dòng)標(biāo)引、自動(dòng)文摘生成、自動(dòng)篇名生成、自動(dòng)分類等,大大節(jié)省了人力。信息組織的信息描述是指對(duì)異構(gòu)信息進(jìn)行標(biāo)準(zhǔn)描述,元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),元數(shù)據(jù)技術(shù)實(shí)現(xiàn)了整個(gè)體系底層的標(biāo)準(zhǔn)化描述。網(wǎng)絡(luò)環(huán)境下海量數(shù)據(jù)的存儲(chǔ)是一個(gè)重要的問題,需要涉及諸如數(shù)據(jù)壓縮、數(shù)據(jù)存貯結(jié)構(gòu)、數(shù)據(jù)倉庫等技術(shù)。海量數(shù)據(jù)存儲(chǔ)技術(shù)是這個(gè)環(huán)節(jié)的關(guān)鍵技術(shù)。
信息融合是指真正的實(shí)現(xiàn)多模態(tài)網(wǎng)絡(luò)信息資源的融合,它涉及4項(xiàng)關(guān)鍵技術(shù)即海量信息分析處理技術(shù),信息描述技術(shù),主題聚類技術(shù)和相關(guān)規(guī)則技術(shù)。海量網(wǎng)絡(luò)信息資源的處理是個(gè)大工程,海量信息分析處理技術(shù)能夠?qū)崿F(xiàn)快速、有效、高效地海量信息處理,大大節(jié)約了時(shí)間、人力。信息描述技術(shù)是指對(duì)不同模態(tài)信息資源進(jìn)行描述,是在原有元數(shù)據(jù)技術(shù)對(duì)異構(gòu)信息進(jìn)行標(biāo)準(zhǔn)化描述基礎(chǔ)上進(jìn)行的深層次描述,包括兩個(gè)步驟,首先是描述方法的融合,其次將融合后的方法用于描述,實(shí)現(xiàn)多模態(tài)信息資源描述。主題聚類技術(shù)是將相同或相似主題的信息資源分成一類[7]。相關(guān)規(guī)則技術(shù)是判斷同特征的多模態(tài)信息資源不相關(guān)程度。
信息提供即信息服務(wù),可以實(shí)現(xiàn)多模態(tài)網(wǎng)絡(luò)信息資源融合的應(yīng)用。信息檢索技術(shù)實(shí)現(xiàn)檢索功能,是信息服務(wù)的基本功能,它直接會(huì)影響服務(wù)質(zhì)量,最終影響用戶滿意度。信息可視化技術(shù)使用戶能夠得到直觀可視化地得到各類信息。智能用戶界面技術(shù)可以打造出友好、直觀、方便、個(gè)性化的用戶界面,使實(shí)現(xiàn)與人機(jī)之間的充分交流。推送技術(shù)突破了以往被動(dòng)的信息得到方式,有效節(jié)約了搜尋信息的工作量,將個(gè)性化信息主動(dòng)傳送給用戶可以提高用戶信息信息效率[8]。智能技術(shù)具有自動(dòng)學(xué)習(xí)功能,理解用戶需求并自動(dòng)檢索、分析和處理Web頁面,根據(jù)用戶需求和用戶思維方式來優(yōu)化檢索結(jié)果。
以上只是對(duì)網(wǎng)絡(luò)信息集成服務(wù)技術(shù)保障體系所涉及技術(shù)的靜態(tài)分類描述,不能說這些技術(shù)的羅列就是這一技術(shù)保障體系。網(wǎng)絡(luò)信息集成服務(wù)的技術(shù)保障體系是所涉及到的的多項(xiàng)技術(shù)有機(jī)融合產(chǎn)生的,是技術(shù)集成的產(chǎn)物,并且這一體系的各項(xiàng)技術(shù)元素、各技術(shù)元素在體系中的權(quán)重及各技術(shù)元素間的相互關(guān)系會(huì)隨著外在環(huán)境的變化以及集成服務(wù)功能的調(diào)整而發(fā)生變化,整個(gè)技術(shù)保障體系是動(dòng)態(tài)的、發(fā)展的、變化的。
(1)多模態(tài)網(wǎng)絡(luò)信息資源。是服務(wù)網(wǎng)絡(luò)的起點(diǎn)。只有擁有多模態(tài)網(wǎng)絡(luò)信息資源,多模態(tài)信息融合服務(wù)網(wǎng)絡(luò)才可能存在。
(2)網(wǎng)絡(luò)基礎(chǔ)機(jī)構(gòu)。信息需要一定載體,即網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)是多模態(tài)信息融合服務(wù)網(wǎng)絡(luò)的基礎(chǔ),它負(fù)責(zé)存儲(chǔ)、處理多模態(tài)信息資源,并接受請(qǐng)求返回傳送多模態(tài)信息[9]。
(3)信息機(jī)構(gòu)。信息機(jī)構(gòu)進(jìn)行多模態(tài)網(wǎng)絡(luò)信息資源的融合,產(chǎn)生滿足特定需求的信息產(chǎn)品,并將信息產(chǎn)品傳送到相應(yīng)的信息用戶,它是多模態(tài)網(wǎng)絡(luò)信息資源融合服務(wù)網(wǎng)絡(luò)價(jià)值的產(chǎn)生源頭。
(4)信息用戶。信息用戶扮演兩種角色,分別是信息消費(fèi)者和信息經(jīng)濟(jì)人。信息用戶需要獲取信息資源來滿足自身的信息需求,因而信息資源開始了自由流動(dòng),與此同時(shí)同一主題下相關(guān)的多種模態(tài)的不同的信息資源自然地產(chǎn)生,最后這些信息資源自然地集中,又開始重新自由流動(dòng),又間接服務(wù)到了其他用戶。
多模態(tài)網(wǎng)絡(luò)信息資源融合服務(wù)中,資源的流向可分為4種:
(1)信息機(jī)構(gòu)—信息用戶。信息機(jī)構(gòu)進(jìn)行多模態(tài)網(wǎng)絡(luò)信息資源融合,生產(chǎn)出信息產(chǎn)品,將信息資源推入市場,傳送給一個(gè)或多個(gè)信息用戶,這是傳統(tǒng)的資源流向。
(2)信息用戶—信息機(jī)構(gòu)。信息從信息用戶流向信息機(jī)構(gòu)有兩方面作業(yè)。①信息機(jī)構(gòu)可以收集到用戶的反饋信息,依據(jù)反饋來調(diào)整或重新設(shè)計(jì)信息產(chǎn)品;②信息用戶產(chǎn)生的增值信息與原有信息產(chǎn)品之間有著錯(cuò)綜復(fù)雜的聯(lián)系,卻不能與之融合最終形成體系,而信息機(jī)構(gòu)可以將這些信息資源將其與原有信息產(chǎn)品融合升級(jí),最終生產(chǎn)出全新的信息產(chǎn)品。
(3)信息機(jī)構(gòu)—信息機(jī)構(gòu)。信息機(jī)構(gòu)進(jìn)行多模態(tài)網(wǎng)絡(luò)信息資源融合后,沒有直接將其投放至市場,而是將資源傳遞給其他信息機(jī)構(gòu),按照對(duì)信息的深層次需求,進(jìn)行信息產(chǎn)品深加工。
(4)信息用戶—信息用戶。信息用戶產(chǎn)生的增值信息與原有信息產(chǎn)品可通過微博,微信或其他專業(yè)交流論壇進(jìn)行信息交流共享,即通過社會(huì)性信息網(wǎng)絡(luò)來共享信息。
資源從信息機(jī)構(gòu)流向信息用戶是資源流動(dòng)的起點(diǎn),也是其基礎(chǔ)。用戶間的資源流動(dòng)擴(kuò)大了資源流動(dòng)的范圍,同時(shí)也使信息得到不斷增值。但是一方面信息在社會(huì)信息網(wǎng)絡(luò)上的多次轉(zhuǎn)移會(huì)導(dǎo)致漏損、失真等負(fù)面作用的累積,最終使得信息“變質(zhì)”;另一方面信息如果僅僅只在社會(huì)性信息網(wǎng)絡(luò)中流動(dòng)會(huì)導(dǎo)致有需要的用戶不能及時(shí)找到相應(yīng)信息。為解決這兩方面問題,就需要資源從信息用戶流向信息機(jī)構(gòu),信息機(jī)構(gòu)及時(shí)的融合當(dāng)前的增值信息與原有信息產(chǎn)品,使信息保真,同時(shí)它也起著一個(gè)公共信息庫的作用,有需要的用戶可以到信息機(jī)構(gòu)去尋找自己所需要的信息。而資源在信息機(jī)構(gòu)之間的流動(dòng)則是為了滿足用戶不同層次的信息需求。
社會(huì)化應(yīng)用是指每一個(gè)人都是互聯(lián)網(wǎng)建設(shè)與發(fā)展過程中的使用人員和參與人員,因此共同構(gòu)成了多個(gè)社會(huì)性信息網(wǎng)絡(luò),信息在這個(gè)網(wǎng)絡(luò)間流動(dòng)。社會(huì)化應(yīng)用的基礎(chǔ)是是資源、功能、服務(wù)、思想等多元共享,同時(shí)信息增值能力對(duì)社會(huì)化應(yīng)用意義重大,它是形成較為穩(wěn)定社會(huì)性信息網(wǎng)絡(luò)的基礎(chǔ)。
為了實(shí)現(xiàn)信息共享的深度化,應(yīng)注重拓展自己地理空間、人際關(guān)系空間和共享信息主題空間等,擴(kuò)大深層次、多方位、多角度的信息交流,這樣就更有可能實(shí)現(xiàn)信息增值,最終建立自己的社會(huì)性信息網(wǎng)絡(luò)。一方面,多模態(tài)網(wǎng)絡(luò)信息資源融合是對(duì)分布信息采用集中式管理,圍繞某一主題展開,最終將形成一個(gè)大型的社會(huì)網(wǎng)絡(luò);另一方面,社會(huì)性信息網(wǎng)絡(luò)中個(gè)體產(chǎn)生的增值信息是獨(dú)特,信息機(jī)構(gòu)可以收集到這些增值異構(gòu)信息,對(duì)它們進(jìn)行加工處理,就可以產(chǎn)生出全新的信息產(chǎn)品,并再次推向市場,最終實(shí)現(xiàn)社會(huì)化應(yīng)用[7]。
多模態(tài)網(wǎng)絡(luò)信息資源融合能融合不同的社會(huì)性信息網(wǎng)絡(luò)的增值信息,使不同的網(wǎng)絡(luò)間實(shí)現(xiàn)了信息流動(dòng)共享。而新的信息產(chǎn)品又會(huì)促發(fā)了下一輪的共享、增值與融合,因而融合服務(wù)本身就是一個(gè)螺旋上升的過程,其中會(huì)經(jīng)歷很多次的多模態(tài)網(wǎng)絡(luò)信息資源融合,而每一次融合都是為了滿足用戶更深層次地信息需求,都能實(shí)現(xiàn)共享,促進(jìn)社會(huì)化應(yīng)用。
面向用戶需求的應(yīng)用要求根據(jù)用戶期望、用戶需求和用戶滿意度等方面的要求進(jìn)行,使信息資源融合不僅能從信息資源集成發(fā)展到信息內(nèi)容的融合,而且可以創(chuàng)造積極的用戶互動(dòng),使用戶滿意度提升。為了達(dá)成該目標(biāo)可實(shí)行以下服務(wù)模式:
(1)建立復(fù)合型分布式分層次的服務(wù)機(jī)構(gòu)??梢栽O(shè)置一個(gè)信息咨詢中心,作為機(jī)構(gòu)的對(duì)外開放的統(tǒng)一入口??傋稍兣_(tái)主要進(jìn)行的是指引型咨詢服務(wù),檢索中心負(fù)責(zé)常規(guī)的檢索服務(wù),定題服務(wù)中心負(fù)責(zé)定題服務(wù)、科技查新;專家咨詢負(fù)責(zé)專項(xiàng)研究等。這種方式可以極大的提升人力資源、信息資源的配置與使用,通過現(xiàn)代化技術(shù)和傳統(tǒng)服務(wù)手段的綜合應(yīng)用,使用戶得到更為簡便的服務(wù)[10]。
(2)提供多種形態(tài)的服務(wù)。根據(jù)用戶需求的不同,網(wǎng)絡(luò)郵件、線上咨詢與電話咨詢等服務(wù)方式可以進(jìn)行配合使用。同時(shí)傳統(tǒng)的檢索服務(wù),定題服務(wù),推送服務(wù)與代理服務(wù)相結(jié)合,提供豐富服務(wù)類型。
(3)協(xié)作式服務(wù)。針對(duì)用戶的信息需求,可以從一個(gè)信息機(jī)構(gòu)走向以聯(lián)合體為依托的協(xié)作模式。每個(gè)信息機(jī)構(gòu)都有相應(yīng)情況介紹各自特長,當(dāng)這一體系中的信息機(jī)構(gòu)不能提供用戶需求的服務(wù),可將該需求提交給聯(lián)合體協(xié)作網(wǎng)管理系統(tǒng),將該需求轉(zhuǎn)給相應(yīng)的信息機(jī)構(gòu)。
多模態(tài)網(wǎng)絡(luò)信息資源融合在微觀層面上實(shí)現(xiàn)了結(jié)果的可視化呈現(xiàn)。現(xiàn)有的搜索引擎可以搜索到關(guān)于某一主題的各種模態(tài)的列表式的信息資源,用戶需要自己整合關(guān)于同一主題的各模態(tài)信息資源。多模態(tài)網(wǎng)絡(luò)信息資源融合從本質(zhì)上改變了這一情況,它的搜索結(jié)果是一個(gè)融合體,它可視化地展示出了所有相關(guān)模態(tài)信息之間的關(guān)系,而且融合過程中實(shí)際也進(jìn)一步加工了原有信息資源。在這種搜索方式下,用戶可以得到的搜索結(jié)果,是一個(gè)可視化的融合結(jié)果,可以稱之為融合體。某一主題下不同側(cè)面的不同模態(tài)信息及其關(guān)系都可以得到全面的直觀展示。同時(shí)該融合體也支持就某一側(cè)面進(jìn)行深入了解,其展示形式可能是一個(gè)更小的融合體,用戶也可通過這個(gè)更小的融合體來就該側(cè)面進(jìn)行深入了解[9]。如果用戶希望能夠獲取到一手的原始資料,可直接點(diǎn)擊鏈接去獲取直接原始資料。這種搜索方式很好地結(jié)合了查全率與查準(zhǔn)率,用戶可根據(jù)自身的需求,選擇全面了解信息整體,或是就某一方面信息進(jìn)行深入了解,適用于不同層次的信息需求。
多模態(tài)網(wǎng)絡(luò)信息資源融合的應(yīng)用,使用戶對(duì)多模態(tài)網(wǎng)絡(luò)信息資源的要求得到了滿足,拓展了信息檢索結(jié)果的可視化,它改變了傳統(tǒng)的一次融合的思維方式,升級(jí)為多次融合方式,可以有效地滿足用戶更深層次信息需求。