国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)環(huán)境下網絡社區(qū)學術資源的深度挖掘與推送服務研究

2016-11-01 08:41劉靜春陳麗云
河南圖書館學刊 2016年9期
關鍵詞:數(shù)據(jù)挖掘大數(shù)據(jù)

劉靜春 陳麗云

關鍵詞:大數(shù)據(jù);網絡社區(qū);學術資源;數(shù)據(jù)挖掘

摘要:文章分析了網絡社區(qū)學術信息資源需求與行為特征,闡明了大數(shù)據(jù)環(huán)境下網絡社區(qū)學術資源的動力機制,論述了大數(shù)據(jù)環(huán)境下網絡社區(qū)學術資源深度挖掘與聚合的方法,提出了網絡社區(qū)面向用戶的學術資源推送服務模式。

中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2016)09-0114-03

大數(shù)據(jù)時代學科信息交融為科研人員學術創(chuàng)新提供了條件,面對海量信息數(shù)據(jù),科研人員的學術交流方式也由傳統(tǒng)渠道逐漸向博客、SMS等網絡社區(qū)方向發(fā)展。大數(shù)據(jù)環(huán)境下網絡社區(qū)的數(shù)量逐漸增多,學術資源呈現(xiàn)網絡化聚合趨勢,并且類型更為多樣,傳播速度更為高效。研究表明,截至2014年年底我國學術科研類網絡社區(qū)用戶的數(shù)量已經超過180萬,常見的網絡社區(qū)包括丁香園、學術博客等。網絡社區(qū)學術信息資源的迅速增長及數(shù)據(jù)挖掘等技術的不斷進步,為研究網絡社區(qū)功能與揭示知識關聯(lián)奠定了基礎。為更好地發(fā)現(xiàn)網絡社區(qū)學術資源的內在關聯(lián),掌握網絡社區(qū)學術資源的發(fā)展規(guī)律,以高效管理促進科研創(chuàng)新,需要借助大數(shù)據(jù)技術制訂合理的學術資源聚合與服務方案。

1網絡社區(qū)學術信息資源需求與行為特征分析

網絡社區(qū)是大數(shù)據(jù)時代科研人員獲取學術信息的重要來源,只有了解網絡社區(qū)學術信息需求與行為特征,才能更好地為科研人員提供服務。

1.1網絡社區(qū)學術資源的產生

網絡社區(qū)是指具有相同興趣愛好與學科背景的用戶,通過網絡技術開展信息交互形成的虛擬團體。當前網絡社區(qū)成為人們獲取信息的有效手段,也為科研人員獲取最新科研信息提供了便利[1]。網絡社區(qū)學術信息的獲取途徑十分廣泛,用戶之間的溝通與信息交互均會產生大量數(shù)據(jù),社區(qū)用戶所掌握的學術成果、學科經驗等信息資源,均可成為網絡社區(qū)學術資源的來源。網絡社區(qū)用戶數(shù)量龐大,依托互聯(lián)網可以實現(xiàn)跨區(qū)域、跨時空交流,這就意味著社區(qū)成員均可成為學術信息的發(fā)布者與利用者。

1.2網絡社區(qū)學術資源需求

科研人員通過網絡社區(qū)獲取最新科技信息,以解決學術研究中遇到的問題,或用于完善自身知識結構,這就產生了學術信息資源需求。當前學術交流呈現(xiàn)跨學科趨勢,科研人員要求獲取專業(yè)性、準確性的學術資源,為科研活動提供指導。而科研活動實質上屬于知識認知過程,任何階段都需要信息資源提供支持。網絡社區(qū)學術資源具有學科化、分類化特點,能夠為科研人員提供專業(yè)化學科信息服務[2]。如科學網根據(jù)學科專業(yè)進行模塊劃分,其中包括醫(yī)學、工程學、信息技術及數(shù)理科學等資源,為科研人員獲取相關信息提供了便利。

1.3網絡社區(qū)學術信息行為特征

科研人員在開展科研活動過程中產生學術信息需求,并在遵守網絡行為秩序的基礎上,利用網絡技術產生的一系列行為,這就是網絡社區(qū)信息行為??蒲腥藛T的學術信息行為源于其對學術信息的需求,而學術信息需求是信息行為的內在動力,屬于由內而外的知識表達過程。網絡社區(qū)學術信息行為的開展具有獨特的方式,學術人員有極高的信息交互性,并通過信息發(fā)布與交流獲取更多資源。研究人員可通過發(fā)帖咨詢的方式獲得學術幫助,而其他社區(qū)成員對主題帖的關注、回復與轉發(fā),可以看作是學術信息衍生行為。科研人員學術信息交流具有廣泛性,信息交互對象也在不斷擴大,有助于拓展學術資源傳播渠道。同時,學術信息交流還具備多維性,即網絡社區(qū)的信息交流存在多種形式,不僅可以提升知識傳播的準確度,還可以豐富研究人員的知識結構。

2大數(shù)據(jù)環(huán)境下網絡社區(qū)學術資源的動力機制

網絡社區(qū)屬于錯綜復雜的人際關系網絡,其中的學術資源存在復雜的關聯(lián)性,任何關聯(lián)的變化都會影響到整體發(fā)展狀況。其支撐動力包括信息行為引導、學術興趣發(fā)現(xiàn)、參與激勵機制等,有助于維持網絡社區(qū)的穩(wěn)定與發(fā)展。

2.1信息行為引導

保障網絡社區(qū)學術信息交流的活躍度,提高用戶的學術資源貢獻率,促進網絡社區(qū)的良性發(fā)展,就需要構建相應的信息行為引導機制。網絡社區(qū)猶如一個龐大的知識庫,用戶可以從中獲取所需信息,也可以獲得幫助或分享知識[3]。網絡社區(qū)中經常發(fā)布與分享信息的用戶,被看作網絡社區(qū)的“活躍者”,他們在科研信息產生與交流中發(fā)揮著重要作用,也影響到其他用戶的行為。網絡社區(qū)可以將他們作為社區(qū)引導者,通過規(guī)范他們的學術信息行為,激勵更多用戶參與其中;同時,制定學術造假舉報制度,發(fā)現(xiàn)造假行為及時處理,并對舉報成員予以適當獎勵,以營造良好的學術交流氛圍。

2.2科研興趣發(fā)現(xiàn)

科研人員對學術信息具有較高的專業(yè)性要求,因此,在利用互聯(lián)網獲取信息時需要耗費大量時間和精力,影響了科研效率。網絡學術社區(qū)的產生與發(fā)展,其根本目的在于全面了解科研人員的信息需求與科研興趣,為他們提供便捷的資源獲取途徑,保障學術資源的持續(xù)增長。網絡社區(qū)用戶科研興趣的發(fā)現(xiàn)需要對用戶需求進行分析挖掘,通過構建科研興趣模型了解不同用戶的個性化需求,也可以借助網絡社區(qū)成員的頁面瀏覽與檢索結果,從中挖掘不同用戶的興趣愛好或通過信息行為跟蹤了解用戶的學術興趣。

2.3參與激勵機制

網絡社區(qū)的發(fā)展離不開用戶的參與互動,這就要求借助必要的激勵手段吸引用戶參與到學術資源建設中,提升社區(qū)學術資源質量。網絡社區(qū)用戶成員之間可以自由交流,并且允許通過版權功能設置等方式,幫助用戶構建基于共同專業(yè)背景、興趣愛好的團體。網絡社區(qū)用戶的參與度與其群體依賴性、人際交往情況均有關系,大部分用戶更傾向于在彼此認同的基礎上形成團隊關系,這種關系讓用戶認識到自己屬于團隊的一分子,擔負著共同建設社區(qū)的責任。網絡學術社區(qū)可以通過虛擬貨幣、積分等激勵方式,制定合理的激勵評估機制,營造良好的社區(qū)交流環(huán)境,激勵更多用戶參與到社區(qū)建設中,促進網絡社區(qū)資源共建共享。

3大數(shù)據(jù)環(huán)境下網絡社區(qū)學術資源的深度挖掘與聚合

大數(shù)據(jù)環(huán)境下網絡社區(qū)用戶的信息行為是動態(tài)變化的,決定了對網絡社區(qū)學術資源進行分析處理的復雜性。借助數(shù)據(jù)挖掘等大數(shù)據(jù)技術開展學術資源挖掘,促進學術資源的精確分類與高效聚合,可為學術資源推送服務奠定基礎。

3.1學術資源的獲取

從網絡社區(qū)海量數(shù)據(jù)資源中提取有價值的信息,需要用到數(shù)據(jù)挖掘技術。該技術能夠從海量信息中分析一系列信息行為,在分析數(shù)據(jù)關聯(lián)的基礎上揭示內在規(guī)律,融合了數(shù)據(jù)可視化、數(shù)據(jù)庫、數(shù)據(jù)處理等技術。由于網絡社區(qū)學術資源的類別不同,采用的數(shù)據(jù)挖掘算法也存在差異[4]。數(shù)據(jù)挖掘過程中首先需要對海量數(shù)據(jù)進行采集抽樣,然后開展數(shù)據(jù)預處理與數(shù)據(jù)描述,通過數(shù)據(jù)變換構建相關模型,并通過模型評估獲得結果。學術資源的深度挖掘要求構建興趣向量,明確具體的學術研究領域與方向,通過對相關學術資源、學術成果的分析處理及關鍵詞頻率排序等方式,將分散的學術資源聚集起來,提升學術信息服務的準確率。

3.2合理選擇數(shù)據(jù)庫

網絡社區(qū)擁有龐大的數(shù)據(jù)信息,并且數(shù)據(jù)規(guī)模是不斷變化的。因此,在數(shù)據(jù)庫選擇方面需要考慮其最大容量,數(shù)據(jù)庫是否具備安全穩(wěn)定性及數(shù)據(jù)查詢速度是否滿足需求等。為解決海量學術信息資源的存儲問題,在數(shù)據(jù)庫選擇方面首先需要考慮其延展性與兼容性,要求該數(shù)據(jù)庫容納更多數(shù)據(jù),可由幾十或數(shù)百臺服務器構成,數(shù)據(jù)的存儲模式更為自由,無需考慮數(shù)據(jù)文件的存儲格式。數(shù)據(jù)庫中每個文檔的存儲均有統(tǒng)一的標識,方便進行瀏覽與管理。同時,該數(shù)據(jù)庫具備較高的伸縮性,能夠為云數(shù)據(jù)庫提供支撐,還可以額外增加其他設備,可以通過文件備份與自動轉移保障安全性。此外,該數(shù)據(jù)庫還具備完善的信息索引系統(tǒng),能夠幫助用戶迅速查找所需信息,提高學術信息的查詢速度。

3.3學術資源挖掘與存儲

網絡社區(qū)學術信息并非獨立存在的,而是存在語義關聯(lián)的知識節(jié)點[5]。學術資源挖掘是通過對信息數(shù)據(jù)進行高層次處理,提取關聯(lián)數(shù)據(jù)的總體特征,獲取其中潛在的、新穎的、有價值的信息。首先,了解社區(qū)的信息行為特征,利用數(shù)據(jù)挖掘技術對用戶的輸入關鍵詞進行搜集查詢,在標記相關網頁的基礎上下載檢索文檔。其次,對檢索結果進行深入分析,獲取相關文獻的URL值,借助編程技術了解相關文獻的具體信息,并將計算權值與相關參數(shù)存儲在數(shù)據(jù)庫中。全面掌握學術資源之間的語義關系,能夠更好地保障數(shù)據(jù)挖掘與聚合效果。最后,借助語義關聯(lián)促進學術資源聚合,構建多層次、多維度、立體化的網絡社區(qū)知識網絡,并利用數(shù)據(jù)可視化技術進行結果展示,方便社區(qū)用戶了解學術資源的整體脈絡及學術資源的挖掘與存儲過程(見圖1)。

4大數(shù)據(jù)環(huán)境下網絡社區(qū)面向用戶的學術資源推送服務模式

4.1網絡社區(qū)用戶需求分析

網絡社區(qū)本質上屬于信息共享的虛擬交流平臺,學術資源推送服務側重于對信息數(shù)據(jù)進行重構與加工,明確信息推送服務的參與要素、服務流程與實現(xiàn)機制,進而為科研人員提供具有決策性的信息服務(見圖2)。為此,首先需要對社區(qū)用戶的基本信息、認知水平及信息行為特征進行分析,隨后在對社區(qū)學術信息資源進行管理的基礎上形成學術資源庫。社區(qū)用戶在信息行為、認知能力等方面存在較大差異,對社區(qū)學術信息的獲取、處理與認知能力,都會影響其對所獲取資源的價值利用率。筆者認為,可從社區(qū)用戶的科研興趣、認知能力、認知結構等方面進行分析,挖掘社區(qū)用戶潛在的學術信息需求,根據(jù)不同用戶群體的行為特征提供個性化服務,也可以針對某個用戶提供個性化推送服務,保障服務參與要素、服務流程的聯(lián)動性,以提高信息服務效率。

4.2學術資源庫的構建

不同網絡社區(qū)中學術資源的內容存在較大差異,但學術資源的來源基本相同,均為社區(qū)用戶信息發(fā)布與分享的結果。通過對網絡社區(qū)各種形態(tài)學術信息的聚合與重組,就可以構建學術資源數(shù)據(jù)庫。在具體構建過程中組織與維護學術資源至關重要,學術資源聚合并非簡單的信息聚集,而是基于某一主題的關聯(lián)或對多個主題信息的融合,并保障提取關聯(lián)特征的準確性。將所有學術資源通過聚類整理納入數(shù)據(jù)庫后,在全面掌握社區(qū)用戶需求的基礎上,對推送服務參與要素進行識別分析,明確服務流程的科學性與合理性,確定學術信息推送服務目標,為準確提供信息推送服務提供支撐。

4.3主動推送服務的實施

網絡社區(qū)推出學術資源推送服務,主要目的在于針對社區(qū)用戶的信息交互、檢索與瀏覽行為,在學術資源庫中深度挖掘與集成信息后,為用戶主動提供準確的反饋信息,滿足他們對網絡社區(qū)信息服務的期待。學術資源推送強調個性化服務,在分析不同群體用戶特征的基礎上,主動調取學術資源數(shù)據(jù)庫中的相關信息,并將最終結果推送給用戶[6]。可根據(jù)不同用戶群體的基本特征,在用戶沒有開展信息檢索的情況下,主動為用戶提供科研信息,讓用戶在獲得信息的同時積極參與到學術信息發(fā)布及傳播中。

參考文獻:

[1]胥琳佳.大數(shù)據(jù)對于傳播學研究內容和方法的影響:基于社交媒體和移動互聯(lián)網的思考[J].中國出版,2013(18):3-6.

[2]朱世琴.面向大數(shù)據(jù)時代的高校圖書館創(chuàng)新服務[J].高校圖書館工作,2014(5):70-72.

[3]欒旭倫.大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務系統(tǒng)研究[J].圖書館學刊,2014(8):118-121.

[4]李春英,湯庸,陳國華,等.面向學術社區(qū)的專家推薦模型[J].智能系統(tǒng)學報,2012(4):365-369.

[5]彭文梅.大數(shù)據(jù)時代高校圖書館信息服務創(chuàng)新與發(fā)展[J].河北科技圖苑,2014(3):14-16.

[6]陳國華,湯庸,彭澤武,等.基于學術社區(qū)的學術搜索引擎設計[J].計算機科學,2011(8):171-175.

(編校:馬懷云)

猜你喜歡
數(shù)據(jù)挖掘大數(shù)據(jù)
數(shù)據(jù)挖掘技術在內河航道維護管理中的應用研究
數(shù)據(jù)挖掘綜述
軟件工程領域中的異常數(shù)據(jù)挖掘算法
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
基于大數(shù)據(jù)背景下的智慧城市建設研究
基于R的醫(yī)學大數(shù)據(jù)挖掘系統(tǒng)研究
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
一本面向中高級讀者的數(shù)據(jù)挖掘好書
云霄县| 翁源县| 崇信县| 昆山市| 清水河县| 承德县| 永善县| 兴化市| 文昌市| 廊坊市| 郑州市| 客服| 湖州市| 禹城市| 涪陵区| 成安县| 朔州市| 成武县| 罗山县| 焦作市| 凤台县| 蒙阴县| 金乡县| 磴口县| 五大连池市| 台南县| 望江县| 怀安县| 西宁市| 方城县| 德令哈市| 怀化市| 崇礼县| 岳西县| 玛纳斯县| 营山县| 葫芦岛市| 安岳县| 宁明县| 阳新县| 吉安市|