夏 天/中國人民大學(xué)數(shù)據(jù)工程與知識工程教育部重點實驗室、中國人民大學(xué)信息資源管理學(xué)院、中國人民大學(xué)電子文件管理研究中心
信息咨詢是檔案服務(wù)的重要組成部分,隨著互聯(lián)網(wǎng)的快速發(fā)展,檔案管理部門積極主動地提供在線咨詢服務(wù),通過網(wǎng)上咨詢與用戶互動,獲取用戶的咨詢需求并及時解答。對這些在線咨詢產(chǎn)生的真實互動數(shù)據(jù)進(jìn)行分析,一方面能夠發(fā)現(xiàn)社會公眾對檔案利用的常見需求,有助于檔案管理部門聚焦關(guān)鍵問題、提升業(yè)務(wù)咨詢服務(wù)能力、完善檔案利用體系;另一方面采集構(gòu)建檔案咨詢互動數(shù)據(jù),可以為檔案用戶行為分析提供機(jī)器可讀的學(xué)習(xí)素材,便于從數(shù)據(jù)驅(qū)動計算的角度開展檔案知識服務(wù)研究,豐富檔案領(lǐng)域數(shù)字人文的實踐研究。
本文完整梳理了國內(nèi)省級檔案網(wǎng)站的在線咨詢服務(wù)運行情況,基于數(shù)據(jù)量和可以公開獲取程度兩個因素,構(gòu)建了檔案咨詢互動數(shù)據(jù)集,并基于該數(shù)據(jù)集進(jìn)行統(tǒng)計分析,反映網(wǎng)絡(luò)用戶利用在線咨詢獲取檔案服務(wù)的整體發(fā)展趨勢、反饋時效情況和互動典型主題,并根據(jù)分析結(jié)論提出相關(guān)建議。
咨詢服務(wù)是檔案部門基于所擁有的檔案資源和專業(yè)知識,運用各種軟硬件設(shè)施和專業(yè)人員,滿足用戶檔案信息需求的活動,是檔案信息服務(wù)的重要組成部分。隨著技術(shù)進(jìn)步,檔案咨詢的方式由早期的當(dāng)面咨詢和信函咨詢,發(fā)展為后來的電話和傳真咨詢,再發(fā)展為今天的網(wǎng)絡(luò)咨詢,如利用電子郵件咨詢,或在檔案部門開設(shè)的網(wǎng)站、微博、微信公眾號中留言咨詢等。與之相適應(yīng)的是,以檔案網(wǎng)站為主要服務(wù)載體的咨詢形式,成為近年來的研究熱點。
網(wǎng)絡(luò)在線信息咨詢服務(wù)可以分為兩大類,即不需要檔案工作人員參與的靜態(tài)服務(wù),和需要檔案工作人員與利用人員雙向互動的動態(tài)服務(wù)[1]?;臃?wù)能夠獲取用戶的真實需求,有利于檔案利用者獲得立體化的互動體驗,也有助于推動檔案網(wǎng)站從“灌輸式展示”轉(zhuǎn)變?yōu)椤盎邮綄υ挕盵2],因此成為檔案信息咨詢服務(wù)的關(guān)注重點。其中,雷曉慶等提出檔案服務(wù)者有必要設(shè)置在線咨詢、公眾交流等欄目,及時收集和解答用戶提問,實現(xiàn)檔案服務(wù)者與用戶的雙向交流[3];周林興[4]、張衛(wèi)東[5]均以31個省級綜合檔案館網(wǎng)站(除港、澳、臺地區(qū)外)為調(diào)查對象,分析我國檔案網(wǎng)站在互動功能方面存在的典型問題,并給出有針對性的建議。
社交媒體具有易于傳播和雙向?qū)崟r交流的特點,學(xué)者圍繞社交媒體檔案服務(wù)應(yīng)用展開了大量研究。張衛(wèi)東等對檔案部門的微信、微博進(jìn)行調(diào)查分析并進(jìn)行影響力評價,力圖提升檔案部門的信息服務(wù)能力[6];宋雪雁等設(shè)計了指標(biāo)體系,對公共檔案館微信公眾號平臺服務(wù)質(zhì)量進(jìn)行評價[7];賀軍[8]、高琪翔[9]均認(rèn)為微博、微信等社交媒體平臺在檔案信息傳播及網(wǎng)站建設(shè)中具有重要應(yīng)用,發(fā)揮其互動特點有助于改進(jìn)和優(yōu)化檔案信息服務(wù)。這類研究均以提升檔案部門的信息服務(wù)能力為終極目標(biāo)。
綜合來看,互動功能在檔案信息咨詢服務(wù)中的作用已經(jīng)引起了學(xué)者的關(guān)注,在調(diào)查檔案互動功能的現(xiàn)狀、不足及提出對策建議方面已有初步研究。但是如何構(gòu)建互動數(shù)據(jù)集,以及深入研究具體的互動內(nèi)容、探索用戶真實的信息咨詢需求,目前尚未發(fā)現(xiàn)相關(guān)的成果。
數(shù)字人文的興起為檔案學(xué)研究提供了新的視角。除理論探討和應(yīng)用展望之外[10][11],數(shù)字人文在檔案領(lǐng)域的實踐目前多以各類資源庫建設(shè)為主[12][13]。本研究將進(jìn)一步應(yīng)用數(shù)據(jù)采集和自然語言處理技術(shù),構(gòu)建互動數(shù)據(jù)集進(jìn)行文本主題分析,發(fā)現(xiàn)在線信息咨詢的真實需求,踐行將信息技術(shù)融入檔案學(xué)研究的數(shù)字人文和計算檔案學(xué)新思想[14]。
理論上,檔案信息咨詢的互動數(shù)據(jù)集需匯聚各種交互途徑產(chǎn)生的數(shù)據(jù),但在實踐中,當(dāng)前檔案機(jī)構(gòu)所應(yīng)用的微博、微信等社交媒體平臺,其單向宣傳和信息共享作用遠(yuǎn)大于雙向互動作用[15],目的明確的主動咨詢內(nèi)容相對較少,同時考慮到數(shù)據(jù)是否可公開獲取以及可獲取數(shù)據(jù)的規(guī)模,筆者僅以檔案網(wǎng)站上的在線咨詢?yōu)槟繕?biāo)對象構(gòu)建互動數(shù)據(jù)集。
梳理我國大陸副省級以上地區(qū)檔案網(wǎng)站的在線咨詢業(yè)務(wù)建設(shè)情況發(fā)現(xiàn),截至2019年4月6日,共有24個檔案網(wǎng)站提供了可公開瀏覽的互動咨詢信息,分別為:浙江(15124)、天津(858)、四川(858)、西安(553)、深圳(469)、陜西(259)、成都(236)、江西(205)、貴州(188)、廣西(162)、山東(117)、黑龍江(100)、湖南(100)、山西(100)、安徽(84)、廣州(60)、濟(jì)南(53)、河北(40)、福建(34)、沈陽(16)、上海(15)、江蘇(15)、海南(6)、哈爾濱(3),總計19,655條。筆者根據(jù)數(shù)量名次選取了前10個網(wǎng)站,共計18,912條數(shù)據(jù),占比96.22%,這部分?jǐn)?shù)據(jù)覆蓋了絕大部分可公開獲取的咨詢數(shù)據(jù)。
筆者進(jìn)一步編寫自動化網(wǎng)絡(luò)爬蟲程序,將咨詢互動數(shù)據(jù)抽取入庫,構(gòu)建檔案咨詢互動數(shù)據(jù)集并予公開(數(shù)據(jù)集下載地址:https://github.com/iamxiatian/data/blob/master/archive_consult.zip)。在采集浙江檔案信息網(wǎng)的互動數(shù)據(jù)時,筆者排除了47條依提交人意愿不進(jìn)行公開的記錄和21條檔案部門尚未處理的記錄,獲取15,056條,因此實際采集記錄總計18,823條,占全部網(wǎng)站所聲明的互動數(shù)據(jù)量的95.77%。
數(shù)據(jù)集的元數(shù)據(jù)由如下字段構(gòu)成:site(網(wǎng)站代號)、url(網(wǎng)頁地址)、url_md5(網(wǎng)頁地址的MD5哈希值)、code(咨詢信件的編號)、title(咨詢標(biāo)題)、person(咨詢用戶)、ask_time(咨詢時間)、ask_content(咨詢內(nèi)容)、replier(回復(fù)人)、reply_time(回復(fù)時間)、reply_content(回復(fù)內(nèi)容)、view_count(瀏覽數(shù)量)。
其中對于url字段,廣西檔案將多條互動記錄組織到了一個網(wǎng)頁之中顯示。為區(qū)分每條記錄,筆者將url、“#”字符和code屬性值拼接到一起,作為該記錄唯一的url。對于咨詢時間和回復(fù)時間,浙江、天津、四川、廣西的網(wǎng)站可精確到秒,但貴州、西安、深圳、江西、成都、陜西的網(wǎng)站只精確到天,在數(shù)據(jù)處理時將這6個無法確定具體時分秒數(shù)字的網(wǎng)站記錄,統(tǒng)一設(shè)置為當(dāng)天的0點0分0秒。對于瀏覽數(shù)量字段,如果網(wǎng)頁中沒有給出具體數(shù)字,則設(shè)置為0。
在處理過程中筆者發(fā)現(xiàn),數(shù)據(jù)存在回復(fù)時間早于提問時間的情況,為忠實記錄數(shù)據(jù)原貌,數(shù)據(jù)集保留了原始的時間信息,該類數(shù)據(jù)共計1,268條,其中天津檔案出現(xiàn)2條,浙江檔案出現(xiàn)1,266條。問題數(shù)據(jù)占總數(shù)據(jù)集的6.74%,主要出現(xiàn)在早期的互動數(shù)據(jù)之中。
用戶在咨詢過程中,有時會留下個人姓名、手機(jī)、郵箱等信息,目前僅有部分網(wǎng)站對這類數(shù)據(jù)進(jìn)行了隱匿化處理,將聯(lián)系方式中的部分字符以星號替代,實現(xiàn)隱私保護(hù)。
對于沒有進(jìn)行隱私保護(hù)的原始信息,筆者將全角形式的數(shù)字和英文字母轉(zhuǎn)換為半角形式,然后采用正則表達(dá)式匹配技術(shù),識別咨詢問題和問題描述中出現(xiàn)的電話號碼、手機(jī)號碼、電子郵箱和身份證號,分別用“[TELE PHONE]”“[CELEPHONE]”“[EMAIL]”“[ID]”予以替換,如將“13612345678”替換為“[CELLPHONE]”。數(shù)據(jù)集中共替換掉具體的電話號碼41處、手機(jī)號碼96處、電子郵箱223處、身份證號20處。需加說明的是,雖然互動數(shù)據(jù)集中的個人聯(lián)系和標(biāo)識信息進(jìn)行了隱匿變換,但該類隱私的終極保護(hù)仍然取決于來源網(wǎng)站的處理。
為獲取當(dāng)前信息咨詢互動行為的真實狀況,筆者從整體趨勢、反饋時效和互動內(nèi)容三個方面對數(shù)據(jù)集進(jìn)行統(tǒng)計匯總和文本分析,初步回答咨詢?nèi)藛T的使用頻率變化、檔案服務(wù)機(jī)構(gòu)的反饋速度變化以及互動涉及的核心主題。
用戶通過檔案網(wǎng)站提供的在線互動服務(wù)進(jìn)行咨詢的行為,整體而言呈上升趨勢、下降趨勢,還是相對平穩(wěn)?為回答這一問題,筆者對所有互動數(shù)據(jù)在不同年度的數(shù)量分布進(jìn)行統(tǒng)計并繪制曲線觀察,發(fā)現(xiàn)2009年至2013年是在線咨詢的絕對數(shù)據(jù)量所占比重較大的5年,但近年來有所下降??紤]到數(shù)據(jù)集中的浙江檔案具有絕對領(lǐng)先優(yōu)勢,相關(guān)記錄在整個數(shù)據(jù)集中的比例超過80%,為反映網(wǎng)站群體的整體狀況,避免數(shù)據(jù)量較少的網(wǎng)站的趨勢信息被其他網(wǎng)站掩蓋,筆者進(jìn)一步對每個網(wǎng)站的年度數(shù)據(jù)按如下方式進(jìn)行規(guī)整化處理:
n(s, y)= count(s, y)×100/sumi(count(s, yi)).
即檔案網(wǎng)站s在年度y的互動數(shù)量規(guī)整化結(jié)果為該年度在s的所有互動數(shù)據(jù)中所占的百分比。經(jīng)過這一步處理,所有網(wǎng)站的互動數(shù)量被縮放到了0到100之間,然后把所有網(wǎng)站規(guī)整化后的數(shù)字按年度疊加,形成規(guī)整化年度曲線?;谝?guī)整化曲線可以發(fā)現(xiàn):對提供在線咨詢服務(wù)的所有網(wǎng)站而言,用戶通過在線方式獲取檔案服務(wù)的行為整體上呈快速上升趨勢,與網(wǎng)絡(luò)時代用戶習(xí)慣于借助互聯(lián)網(wǎng)獲取信息和檔案部門服務(wù)能力的普遍提升狀況相吻合??梢姡瑱n案部門加強(qiáng)在線咨詢服務(wù)的能力建設(shè)具有現(xiàn)實意義。
用戶提出咨詢問題之后,多長時間會得到反饋?為回答這一問題,筆者從數(shù)據(jù)集中排除了反饋時間早于提問時間的異常數(shù)據(jù),對剩余的17,555條互動數(shù)據(jù)進(jìn)行統(tǒng)計分析,結(jié)果發(fā)現(xiàn):數(shù)據(jù)集中最短反饋所用天數(shù)為1天,最長反饋所用天數(shù)為2,977天,平均天數(shù)為12天,反饋所用天數(shù)的25%、50%和75%分位值分別為1、2和5天,表明25%的用戶需要5天以上的自然日才能得到反饋結(jié)果;存在數(shù)月甚至數(shù)年之后才進(jìn)行反饋的情況,數(shù)據(jù)集中最長反饋用了2,977天,即一條在線咨詢在8年之后才被反饋,這種情況嚴(yán)重降低了用戶對在線咨詢的期望值。
在反饋所用的天數(shù)分布方面,83.5%的用戶能夠在一周(7天)之內(nèi)得到回復(fù),92%的用戶能在半個月(15天)內(nèi)得到回復(fù),接近96%的用戶能在一個月(30天)內(nèi)得到反饋,4%的用戶需要數(shù)月甚至更長時間才能得到反饋。實際上如果反饋天數(shù)超過一周,用戶的體驗就會變差,在線咨詢方便快捷的優(yōu)勢將會失去。
在檔案網(wǎng)站的咨詢反饋速度方面,早期相對較慢,年度平均反饋速度在10個自然日左右;2016年的年度數(shù)據(jù)因特殊值的原因,平均反饋速度明顯慢于其他年份;2017年開始反饋速度快速提升。
基于以上分析,可以得出如下結(jié)論:第一,用戶通過檔案網(wǎng)站進(jìn)行咨詢服務(wù),多數(shù)情況下能夠得到及時反饋。第二,反饋速度整體上呈加快趨勢,反映出近10年檔案在線咨詢服務(wù)水平的良性發(fā)展?fàn)顩r。第三,存在兩類極端數(shù)據(jù):反饋時間早于用戶提問時間的不合邏輯的互動數(shù)據(jù)、數(shù)月甚至數(shù)年才進(jìn)行反饋的數(shù)據(jù),這兩類數(shù)據(jù)對檔案部門的公信力會有不利影響,應(yīng)在以后避免出現(xiàn)此類情況。
發(fā)現(xiàn)用戶在線咨詢的互動主題,將有助于檔案部門把握用戶的典型需求,提高檔案在線服務(wù)能力。為此,筆者對互動數(shù)據(jù)集中的文本數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)記,并對涉及的主題詞語進(jìn)行統(tǒng)計分析,以期發(fā)現(xiàn)數(shù)據(jù)集中的代表性主題及其變化情況。
3.3.1 內(nèi)容分析流程
首先,筆者對由標(biāo)題、提問內(nèi)容和回復(fù)內(nèi)容組成的文本進(jìn)行分詞和詞性標(biāo)記,過濾掉詞性不是名詞和動詞的詞語,以及不包含漢字的詞語,進(jìn)行詞頻統(tǒng)計,獲取高頻詞集合,通過觀察高頻詞集合和數(shù)據(jù)集,形成停用詞表,出現(xiàn)在停用詞表中的詞語不再參與后續(xù)環(huán)節(jié)的短語發(fā)現(xiàn)和詞頻二次統(tǒng)計過程。停用詞目前共包括“謝謝”“請問”“想問”等28個詞語,已隨互動數(shù)據(jù)集同時發(fā)布。
其次,利用高頻詞在數(shù)據(jù)集中的近鄰?fù)F(xiàn)關(guān)系,發(fā)現(xiàn)分詞詞典中不存在的專業(yè)短語,例如將“人才”和“市場”合并為“人才市場”、“電子”和“簽名”合并為“電子簽名”、“就業(yè)”和“協(xié)議”合并為“就業(yè)協(xié)議”等,經(jīng)篩選后共得到390個短語,所有短語已隨數(shù)據(jù)集發(fā)布。筆者將專業(yè)短語集合添加到分詞詞典之中,以優(yōu)化分詞器的分詞效果,進(jìn)而對數(shù)據(jù)集進(jìn)行第二次詞頻分析,并過濾掉停用詞,將得到的高頻詞作為關(guān)鍵詞集合,利用關(guān)鍵詞在句子中的近鄰共現(xiàn)關(guān)系,形成共現(xiàn)網(wǎng)絡(luò),進(jìn)一步利用開源可視化軟件Gephi,將共現(xiàn)網(wǎng)絡(luò)可視化,以方便人工觀察分析。
3.3.2 高頻關(guān)鍵詞分析
筆者對互動數(shù)據(jù)集進(jìn)行分詞、識別短語、去除停用詞之后,得到的詞語集合按照出現(xiàn)頻度倒排,將獲得的高頻詞語作為關(guān)鍵詞,這些關(guān)鍵詞能夠一定程度上反映出用戶在線咨詢所涉及的常見主題。
筆者對前20個高頻關(guān)鍵詞進(jìn)行重點分析,發(fā)現(xiàn)用戶提問與網(wǎng)站答復(fù)的關(guān)鍵詞并不完全一致,但存在符合直覺的邏輯關(guān)系,用戶提問中的高頻關(guān)鍵詞涉及職稱、考試、歸檔、查詢、資格證書、文件材料等,回復(fù)部分更多涉及規(guī)定、要求、聯(lián)系、建議等,反映出對于用戶咨詢的內(nèi)容,檔案館通常會給出與問題相關(guān)的檔案管理規(guī)定、管理要求、專業(yè)建議,或者給出進(jìn)一步的聯(lián)系方式,方便用戶以更便捷的方式進(jìn)行咨詢和交流。
出現(xiàn)在互動記錄任意位置的高頻詞語,能在一定程度上體現(xiàn)提問者和回復(fù)者都較為關(guān)心的主題或共同使用的術(shù)語。以“保管期限”為例,提問內(nèi)容的前20個高頻詞和回復(fù)內(nèi)容的前20個高頻詞均未出現(xiàn)該詞語,但將提問和回復(fù)內(nèi)容合并在一起進(jìn)行高頻詞統(tǒng)計,則進(jìn)入了前20,反映出“保管期限”是信息咨詢用戶和檔案反饋人員都經(jīng)常提及的重要術(shù)語。
3.3.3 關(guān)鍵詞共現(xiàn)分析
高頻關(guān)鍵詞雖然能在一定程度上反應(yīng)數(shù)據(jù)集中互動咨詢的主要話題,但缺少關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系,不便于把握咨詢主題的整體分布情況。為進(jìn)一步獲取用戶在線咨詢的主題分布,筆者對高頻關(guān)鍵詞之間的共現(xiàn)信息進(jìn)行分析,如果兩個關(guān)鍵詞出現(xiàn)在同一咨詢記錄之中,則在兩者之間建立一條連接邊,并累加對應(yīng)邊的權(quán)重,形成帶權(quán)網(wǎng)絡(luò)。在處理過程中,“檔案”一詞的領(lǐng)域?qū)V付容^低,對主題關(guān)聯(lián)分析意義不大,因此將其排除在共現(xiàn)網(wǎng)絡(luò)之外。
基于共現(xiàn)網(wǎng)絡(luò)分析,筆者發(fā)現(xiàn)相關(guān)主題集中在三個方面。第一,與個人利益和職業(yè)發(fā)展緊密相關(guān)的信息咨詢。該類型關(guān)鍵詞子圖在共現(xiàn)網(wǎng)絡(luò)中占據(jù)了絕對中心的位置,構(gòu)成了互動數(shù)據(jù)集中最為常見的用戶咨詢主題。該類信息咨詢包括與個人發(fā)展密切相關(guān)的專業(yè)技術(shù)資格與職稱評審、與之相關(guān)的考試信息、專業(yè)培訓(xùn)和繼續(xù)教育等。
第二,檔案理論探討與專業(yè)技術(shù)咨詢。該類型關(guān)鍵詞涉及科技檔案、文書檔案、人事檔案、工程檔案、會計檔案等各類專業(yè)檔案,同時包括案卷目錄的組織、保管期限的設(shè)定、歸檔范圍與移交流程、文書檔案的著錄等檔案專業(yè)問題的咨詢。該類解答則多涉及檔案管理的標(biāo)準(zhǔn)規(guī)范、規(guī)章制度等。
第三,檔案本身的查詢與利用咨詢。包括個人檔案與親屬檔案的查詢、為開展特定研究或特定活動所需檔案的查詢。如,有關(guān)黃埔軍校人員信息等特色檔案的咨詢,因論文寫作需要查閱特定檔案的咨詢,以及家族家譜、企業(yè)歷史等方面的咨詢。
在這三類咨詢中,前兩類主要是檔案從業(yè)人員之間的互動,第三類則多發(fā)生在普通檔案用戶與檔案部門工作人員之間,三類主題在數(shù)據(jù)集中所占的比重依次降低。可見檔案網(wǎng)站提供的網(wǎng)絡(luò)互動咨詢,不僅滿足了傳統(tǒng)意義上社會公眾對檔案查閱利用和專業(yè)技術(shù)求助的需求,還給檔案從業(yè)人員提供了跨時空、慢節(jié)奏、低成本的交流探討手段。
本文包括兩個部分:一是構(gòu)建了具有一定規(guī)模和時間跨度的互動數(shù)據(jù)集并予公開,為進(jìn)一步研究檔案信息咨詢奠定了數(shù)據(jù)基礎(chǔ);二是基于數(shù)據(jù)集對當(dāng)前在線咨詢的整體趨勢、反饋時效和互動內(nèi)容三個方面進(jìn)行分析并給出了對應(yīng)結(jié)果。
通過分析發(fā)現(xiàn),無論是在線咨詢的互動頻度,還是檔案服務(wù)機(jī)構(gòu)對用戶咨詢的反饋速度,整體上都呈良性發(fā)展的上升趨勢,與信息獲取日益網(wǎng)絡(luò)化的特點相吻合;互動內(nèi)容當(dāng)前集中在職業(yè)發(fā)展、專業(yè)技術(shù)交流和檔案查詢利用三個方面;互動咨詢在社會公眾與檔案專業(yè)人員、檔案從業(yè)人員之間都起到了積極的交流溝通作用?;诋?dāng)前數(shù)據(jù)特點和分析結(jié)論,筆者提出如下建議。
其一,建議檔案部門進(jìn)一步加強(qiáng)互動過程中的用戶隱私和反饋時效管理,對用戶咨詢內(nèi)容中的手機(jī)、電話、身份證號、社交媒體賬號等信息進(jìn)行必要的隱匿處理,并加快用戶咨詢的反饋速度、提升用戶體驗,促進(jìn)雙向互動進(jìn)一步的健康發(fā)展。
其二,除了對咨詢內(nèi)容進(jìn)行快速反饋之外,檔案部門有必要采取制度化措施,定期對互動內(nèi)容進(jìn)行總結(jié)歸納,發(fā)現(xiàn)普遍性問題并予以系統(tǒng)性改進(jìn)。如,根據(jù)互動過程中常見的特色檔案查詢需求,增加必要的功能模塊或優(yōu)化欄目設(shè)置,從而減少用戶的交互等待時間,提升服務(wù)效率。
其三,建議檔案部門為檔案人員提供更多更高效的交流途徑。檔案從業(yè)人員利用網(wǎng)站信息咨詢功能進(jìn)行檔案技術(shù)和理論的互動探討,一定程度上表明從業(yè)人員之間具有較強(qiáng)的交流需求,而目前的交流手段尚不足以充分滿足這種需求。
展望未來,我們將進(jìn)一步對互動數(shù)據(jù)集進(jìn)行更新和完善,尤其關(guān)注用戶通過社交媒體與檔案部門互動的實際情況,必要時將該類數(shù)據(jù)納入數(shù)據(jù)集之中,為研究人員開展檔案數(shù)字人文研究、深入分析用戶需求,提供第一手?jǐn)?shù)據(jù),推動網(wǎng)絡(luò)時代檔案信息咨詢的理論與實踐探索。