■許 娜 任 越
微博的成長得益于Web2.0大環(huán)境下信息技術(shù)的快速發(fā)展,即網(wǎng)站建設(shè)、即時通訊軟件和手機(jī)通訊功能等良性融合。超高速、超大鏈接、超低延時的技術(shù)特點為政務(wù)微博信息傳播和共享機(jī)制提供了無限的想象空間,因而賦予政務(wù)微博新的歷史使命。政務(wù)機(jī)構(gòu)作為國家治理和社會管理的“大家長”,正是因為看中了新浪微博的即時互動特性,開通并入駐微博,實時更新當(dāng)前政治態(tài)勢和社會焦點問題等,借助微博這一在線溝通平臺來傳達(dá)政務(wù)信息給社會公眾。邁入大數(shù)據(jù)時代,網(wǎng)民通過政務(wù)機(jī)構(gòu)官方微博獲取最新政務(wù)信息已成為全民主流網(wǎng)絡(luò)活動,政務(wù)微博平臺成為了“網(wǎng)絡(luò)議政廳”的重要組成部分。政務(wù)微博信息內(nèi)容是公眾參與社會活動的直接證據(jù),是具有檔案特質(zhì)的原始性記錄,它承載著社會記憶,是數(shù)字環(huán)境下政府?dāng)?shù)據(jù)分析與挖掘的重要信息資源。這些數(shù)量龐大的信息亟待妥善累積與保存,將其歸檔,為建設(shè)數(shù)字政府和服務(wù)社會公眾架起“資源橋梁”,為構(gòu)建數(shù)字記憶系上資源儲備的“安全帶”。
政務(wù)機(jī)構(gòu)在處理工作事務(wù)或履行工作職責(zé)的過程中,通過終端在新浪微博平臺上形成、辦理、傳輸和存儲的數(shù)字格式的信息記錄,就是政務(wù)微博信息。從電子文件概念的角度來分析,政務(wù)微博大體上符合電子文件的屬概念。以電子文件的三要素即內(nèi)容、結(jié)構(gòu)和背景來作為屬性的判斷依據(jù),能夠認(rèn)識到政務(wù)微博有明確的信息發(fā)布主體,有明晰的發(fā)布目的,在平臺限制下有相對規(guī)范的信息格式,具備憑證價值和情報價值,蘊含了電子文件的基本特征。鑒于此,可將政務(wù)微博視為一種特殊的電子文件。例如,山東省檔案館編寫《機(jī)關(guān)檔案實戰(zhàn)手冊》,注明了政務(wù)社交媒體元數(shù)據(jù)收集范圍參照《文書類電子文件元數(shù)據(jù)方案》執(zhí)行。除此之外,需要考量的是政務(wù)微博具備自身特征,包括信息的權(quán)屬問題未明確界定、含有與職能無關(guān)的內(nèi)容、微博的文書流程尚無統(tǒng)一規(guī)范等。這與已界定的電子文件概念之間存有必然的不一致性,故而歸檔實踐要高度關(guān)注政務(wù)微博非線性歸檔的特殊性。
政務(wù)微博與網(wǎng)站網(wǎng)頁同樣信息數(shù)量龐大、更新迅速、拓展性強(qiáng)。網(wǎng)頁版政務(wù)微博與Web網(wǎng)頁是基本沒有區(qū)別的,都是在HTML協(xié)議下出現(xiàn)的產(chǎn)物。事實上,政務(wù)微博信息歸檔的本質(zhì)是網(wǎng)絡(luò)信息歸檔。在查考網(wǎng)站網(wǎng)頁歸檔項目時,發(fā)現(xiàn)一些項目把網(wǎng)站網(wǎng)頁作為網(wǎng)絡(luò)信息歸檔保存的內(nèi)容,例如,我國的“中文網(wǎng)絡(luò)資源收集和保存”項目、“互聯(lián)網(wǎng)信息資源保存保護(hù)中心”項目;英國“UK Government Web Archive”項目等。此外,一些項目將社交媒體歸檔納入網(wǎng)絡(luò)信息保存的一個環(huán)節(jié)或內(nèi)容,例如,英國“Online Social Media Archive”項目;澳大利亞“PANDORA”項目[1]。
雖然社交媒體歸檔行動屬于網(wǎng)絡(luò)信息資源長期保存工作,但鑒于政務(wù)微博具備實時交互性特點和社交媒體本質(zhì),傳統(tǒng)網(wǎng)站網(wǎng)頁歸檔方法是不能直接應(yīng)用在政務(wù)微博信息歸檔行動中的。由此,可以把網(wǎng)絡(luò)信息歸檔模式作為基礎(chǔ)起步點,借鑒管理方法與技術(shù)手段的同時,去深思政務(wù)微博信息歸檔的特性。此外,政務(wù)微博信息與網(wǎng)站網(wǎng)頁的歸檔鑒定工作存在不同之處。囿于數(shù)字技術(shù)與管理爭議,確定政務(wù)微博中網(wǎng)民評論與轉(zhuǎn)發(fā)信息內(nèi)容是否歸檔,成為政務(wù)微博歸檔鑒定的難點。這就與網(wǎng)站網(wǎng)頁信息采集的時間、頻率、范圍及元數(shù)據(jù)描述的設(shè)定具有較大差異。
事實上,政務(wù)微博信息歸檔、電子文件歸檔與網(wǎng)站網(wǎng)頁信息歸檔三者之間存在鄰近的屬概念。政務(wù)微博信息歸檔是介于電子文件管理與網(wǎng)絡(luò)資源歸檔之間的概念和行動。雖然電子文件歸檔、網(wǎng)站網(wǎng)頁歸檔與政務(wù)微博信息歸檔的研究層次和實務(wù)要求存有差異。但二者與政務(wù)微博信息歸檔工作存在著密切聯(lián)系,它們的研究進(jìn)展無疑會對政務(wù)微博信息歸檔事業(yè)產(chǎn)生驅(qū)動效果,應(yīng)將電子文件和網(wǎng)站網(wǎng)頁歸檔策略變換為政務(wù)微博信息歸檔動力。
既有歸檔方式的啟示有以下三個:第一,聯(lián)動多方力量,開拓集體智慧。對于一個地區(qū)、一個機(jī)構(gòu)來說,電子文件管理、網(wǎng)站網(wǎng)頁信息歸檔、政務(wù)微博信息歸檔都是一項跨領(lǐng)域跨部門的綜合型信息管理活動,而不是由單一職能機(jī)構(gòu)獨立承擔(dān)的任務(wù)。第二,強(qiáng)化標(biāo)準(zhǔn)規(guī)范、數(shù)字技術(shù)、管理手段等的賦能效用。把著眼點提至全部歸檔環(huán)節(jié)的最前端,借助保障門徑來規(guī)避政務(wù)微博信息歸檔過程中的風(fēng)險與不確定因素,為歸檔行動保駕護(hù)航。第三,自上而下地制定歸檔戰(zhàn)略規(guī)劃,歸檔路徑呈現(xiàn)為由要素到模式的蛻變歷程。戰(zhàn)略規(guī)劃者憑借前瞻性和預(yù)測性眼光,基于歸檔重點問題導(dǎo)向,統(tǒng)籌構(gòu)建相對完備的歸檔模式,設(shè)計與政務(wù)微博信息歸檔的合理內(nèi)核相適應(yīng)的實現(xiàn)方案框架。
若沒有政策法規(guī)的支撐和標(biāo)準(zhǔn)規(guī)范的加持,政務(wù)微博信息歸檔的構(gòu)想在實現(xiàn)與推廣的過程中會面臨許多阻礙?!峨娮游募w檔與電子檔案管理規(guī)范》《機(jī)關(guān)檔案管理規(guī)定》《政務(wù)服務(wù)事項電子文件歸檔規(guī)范》等都相對隱晦地覆蓋了政務(wù)微博信息,表現(xiàn)出一種若即若離的交集情況?,F(xiàn)行的政策法規(guī)與標(biāo)準(zhǔn)規(guī)范大多是泛指的概念,幾乎沒有明確提及政務(wù)微博,這就很難推進(jìn)政務(wù)微博信息歸檔工作常態(tài)化。例如我國《政府網(wǎng)站網(wǎng)頁歸檔指南》、美國《社交媒體文件管理指南》等客體指定性強(qiáng),能夠有效地拉動歸檔工作的開展。因此,盡快出臺《政務(wù)微博信息歸檔指南》或《政務(wù)社交媒體信息歸檔指南》,界定好政務(wù)微博檔案屬性、歸檔主體、歸檔范圍、歸檔工作流程、后續(xù)利用與服務(wù)工作、所有權(quán)的權(quán)屬問題、數(shù)據(jù)安全程度等。
管理理念與方法應(yīng)持續(xù)發(fā)力,管理層的缺憾最容易導(dǎo)致歸檔寸步難行。必須抉擇適配度高、可行性強(qiáng)的最佳管理模式,建構(gòu)能夠良性運轉(zhuǎn)的管理框架。設(shè)計符合政務(wù)微博特性的歸檔程序才能夠增強(qiáng)管理性,參與歸檔活動的主體要明確自身的角色與責(zé)任。理性借鑒既有歸檔理念,使政務(wù)微博歸檔有章可循。由于政務(wù)微博的元數(shù)據(jù)和背景信息具有可存儲性和轉(zhuǎn)換性,反過來說其存在可處理性、不穩(wěn)定性和易更改性,這就大大降低了政務(wù)微博信息的真實可靠性和安全性。在現(xiàn)有的政務(wù)微博信息中,非結(jié)構(gòu)化數(shù)據(jù)占據(jù)著大比重,表現(xiàn)出“量積累”形態(tài)。所以要吃透既有歸檔工作理念,融入數(shù)據(jù)管理觀念,對政務(wù)微博進(jìn)行結(jié)構(gòu)化處理,將數(shù)字形態(tài)的政務(wù)微博轉(zhuǎn)換為數(shù)據(jù)形態(tài)的增值信息。政務(wù)微博歸檔不能局限于信息的固化存儲,止步于存檔。要拆卸管理難題,打破管理瓶頸,回歸政務(wù)微博信息服務(wù)初心,提供優(yōu)質(zhì)的政務(wù)信息資源服務(wù)。
把信息技術(shù)與政務(wù)數(shù)字信息資源歸檔高度融合,充分發(fā)揮信息技術(shù)的工具屬性,是抵御政務(wù)微博信息內(nèi)容與數(shù)據(jù)損失的堅固屏障。第一,加大技術(shù)投入,自主研發(fā)專門應(yīng)用于政務(wù)微博信息捕獲的自動化工具和歸檔軟件。例如奧巴馬白宮社交媒體檔案項目使用Archive Socialist工具、英國UKGWA項目采用WebMirror工具[2]。第二,政務(wù)微博信息歸檔系統(tǒng)需要具備巨大的彈性存儲空間和強(qiáng)勁的計算能力。云計算和云存儲打造的信息存檔環(huán)境,幫助主體專注于管理活動的核心環(huán)節(jié)。如歐盟委員會支持的Archive Community Memory項目中,云計算技術(shù)解決了存檔空間問題,便于后續(xù)社交媒體數(shù)據(jù)挖掘[3]。第三,摸清政務(wù)機(jī)構(gòu)與公眾的雙向互動關(guān)系,注重互動過程中所生成數(shù)據(jù)的機(jī)器可讀性,加以海量政務(wù)微博數(shù)據(jù)處理能力和數(shù)據(jù)挖掘技術(shù)應(yīng)用。通過語義技術(shù)來組織數(shù)據(jù),是未來智能化開發(fā)利用政務(wù)信息的發(fā)展方向。利用信息加工、處理和分析技術(shù)來整合數(shù)字政務(wù)檔案資源,細(xì)粒度高的結(jié)構(gòu)化數(shù)據(jù)的利用價值得到極大的擴(kuò)展。第四,信息技術(shù)的成熟水平不到位,政務(wù)微博數(shù)字信息與元數(shù)據(jù)的安全就無從談及。政務(wù)微博具有快傳播和信息量巨大的特點,在享受互聯(lián)網(wǎng)產(chǎn)品帶來的政務(wù)信息公開便捷時,主體應(yīng)具備預(yù)測安全風(fēng)險的意識,以防由于未及時歸檔造成數(shù)據(jù)丟失、源文件被更改、數(shù)據(jù)傳輸格式錯誤等,而造成無法確認(rèn)政務(wù)微博合法性、喪失檔案記憶的惡果。
歸檔在先,是業(yè)務(wù)需求。增值利用在后,是歸檔動機(jī)。在數(shù)字環(huán)境下,政務(wù)微博信息歸檔從根本上來說是前期的資源型“原料”鋪墊,未來更好地完成資源描述、處理分析、數(shù)據(jù)挖掘等信息組織活動,將其開發(fā)利用,達(dá)成有效復(fù)用的終極目標(biāo)。政務(wù)機(jī)構(gòu)和檔案機(jī)構(gòu)自身就是服務(wù)型機(jī)構(gòu),應(yīng)肩負(fù)起政務(wù)微博信息歸檔管理的重任。以主體職責(zé)為切入點,以政務(wù)微博信息的歸檔動因作為出發(fā)點,將歸檔作為一種信息服務(wù)[4],以信息有效復(fù)用為落腳點,設(shè)計政務(wù)微博信息歸檔模式,以架構(gòu)圖的方式表示政務(wù)微博信息歸檔的管理程序。
在數(shù)字環(huán)境下,憑借單一主體的一方力量完成繁重的政務(wù)微博歸檔工作幾乎是不易實現(xiàn)的,應(yīng)由多方主體高度協(xié)同參與到歸檔流程,集合資源優(yōu)勢、技術(shù)優(yōu)勢、管理優(yōu)勢等,完成各自的份內(nèi)之事,建立多方主體可信任的有機(jī)聯(lián)系。參考圖1,理清各主體間協(xié)作線,打造多方主體交互協(xié)作關(guān)系網(wǎng)絡(luò),明確歸檔主體的直接責(zé)任地位和特定維護(hù)者身份。在政務(wù)微博歸檔運行區(qū)域中,三者的關(guān)系得以表現(xiàn)和鏈接:
圖1 政務(wù)微博信息歸檔架構(gòu)設(shè)計圖
(1)政務(wù)機(jī)構(gòu)
政務(wù)機(jī)構(gòu)開通微博、編輯、即時發(fā)布政務(wù)微博,是真正的信息源。政務(wù)機(jī)構(gòu)是政務(wù)微博的形成者兼核心管理員,具有牽頭和驅(qū)動優(yōu)勢,應(yīng)主動與專業(yè)記憶方、技術(shù)貢獻(xiàn)方商洽規(guī)?;瘏f(xié)同歸檔事宜并促成合作,調(diào)解好控制權(quán)、所有權(quán)、管理權(quán)、開發(fā)利用權(quán)的分配問題。政務(wù)部門需成立政務(wù)微博歸檔工作組,抓取和收集符合歸檔范圍的政務(wù)信息,采集數(shù)據(jù)并生成保管信息。將具有保存價值的政務(wù)信息移交給檔案機(jī)構(gòu),在保證數(shù)據(jù)格式標(biāo)準(zhǔn)的前提下遷移數(shù)據(jù)。雖然政務(wù)微博是政務(wù)機(jī)構(gòu)發(fā)布的,但信息內(nèi)容存儲在微博運營商的服務(wù)器中,微博運營商掌握政務(wù)微博的實際控制權(quán)。因而政務(wù)機(jī)構(gòu)要積極擬定合作協(xié)議,與微博運營商和第三方技術(shù)商簽署合約,明確多方主體的職責(zé),平衡信息權(quán)屬問題。
(2)檔案機(jī)構(gòu)
檔案機(jī)構(gòu)側(cè)重于發(fā)揮檔案管理專業(yè)優(yōu)勢。后保管時代下的政務(wù)微博歸檔工作要求檔案機(jī)構(gòu)主動介入政務(wù)微博運作及歸檔的最前端,與政務(wù)機(jī)構(gòu)和第三方機(jī)構(gòu)展開密切合作。通過指導(dǎo)和監(jiān)督形成者的檔案工作,實現(xiàn)對政務(wù)微博的前端控制和全過程管理。一方面,檔案館在全面調(diào)研后統(tǒng)籌規(guī)劃,制定歸檔標(biāo)準(zhǔn),設(shè)計歸檔流程,規(guī)范政務(wù)微博歸檔業(yè)務(wù)活動。接收歸檔的政務(wù)資料后,完成信息包的清點、檢測和驗證環(huán)節(jié)。另一方面,檔案館負(fù)責(zé)政務(wù)微博檔案管理、數(shù)據(jù)保管與后續(xù)開發(fā)利用。檔案機(jī)構(gòu)要增強(qiáng)跨領(lǐng)域協(xié)作能力,與形成者確定歸檔范疇,對捕獲工作進(jìn)行專業(yè)化示范與引導(dǎo)。歸檔管理的技術(shù)問題并不是檔案機(jī)構(gòu)擅長的強(qiáng)項,需要與微博運營商、第三方技術(shù)商進(jìn)行外包合作來獲取數(shù)據(jù)庫建設(shè)、數(shù)據(jù)存儲、歸檔軟件、系統(tǒng)內(nèi)置工具、應(yīng)用程序接口等技術(shù)支持。
(3)微博運營商與第三方技術(shù)商
它們對接工具服務(wù),是提供歸檔技術(shù)支撐的輔助力量。依據(jù)歸檔目標(biāo),與形成者和記憶機(jī)構(gòu)深度互動與洽談,在歸檔合約或協(xié)議中體現(xiàn)捕獲要求、技術(shù)方法、權(quán)屬確認(rèn)等。此外,負(fù)責(zé)研發(fā)歸檔系統(tǒng),注重系統(tǒng)運行與維護(hù),響應(yīng)信息捕獲與描述、數(shù)據(jù)存儲與整合組織等歸檔要求。政務(wù)微博具有明晰的復(fù)雜交互性,這加大了信息采集的難度系數(shù)。為確保歸檔信息完整、真實可靠、安全可用,這就需要第三方機(jī)構(gòu)適應(yīng)性調(diào)整歸檔工具體系。以捕獲技術(shù)為例,有供應(yīng)API采集、網(wǎng)頁超鏈抓取、網(wǎng)頁快照、網(wǎng)絡(luò)爬蟲等多類技術(shù),需要思量成本、目標(biāo)、對象特征、歸檔能力等層面再予以選擇,并試驗與評估技術(shù)操作全過程。
另外,黃霄羽教授和錢紅梅教授提出社交媒體可以考慮借鑒國外“眾包”項目吸納公眾也參與其中[5]。該觀點得到了張曉娟[6]、趙躍[7]等專家的認(rèn)同,提倡公眾參與歸檔過程。例如加拿大Canadiana在線項目邀請個體參與到著錄歸檔工作中[8]。目前公眾參與模式仍處于起步階段,這是否普遍適用于我國政務(wù)微博歸檔管理實際活動還有待進(jìn)一步探討和試點驗證?;蛟S日后公眾可作為擴(kuò)展主體,在歸檔工作相對成熟后邀請?zhí)囟ü娊槿?,科學(xué)地運用集體智慧。
新興信息技術(shù)加持下,我國檔案工作正由“選時代”走向“全時代”,主張實行全部性管理[9],提倡規(guī)?;男畔w檔。在理想條件下政務(wù)微博信息應(yīng)全歸檔與全留存,但實際上,政務(wù)微博歸檔管理不是輕而易舉的事情。在歸檔行動開展之初,考慮先根據(jù)歸檔能力來設(shè)置歸檔范圍,原創(chuàng)型和職能型內(nèi)容應(yīng)歸盡歸,科普型、轉(zhuǎn)發(fā)型、非職能型、網(wǎng)民的評論及回復(fù)是否劃入歸檔范圍,這需要依照實際工作情況再敲定和調(diào)整。
相比國外,我國理論研究和實踐進(jìn)展仍存在一段距離,且面臨多種制約因素。需要掃清阻礙因素,研討歸檔主體、客體對象、行動目標(biāo)、流程策略,解決用戶隱私、知識產(chǎn)權(quán)、微博內(nèi)容權(quán)屬、運營商把控微博數(shù)據(jù)等問題。囿于現(xiàn)實情況,無法 “一次性”“一步到位”地解決政務(wù)微博信息歸檔問題。政務(wù)微博信息歸檔同類課題的實踐經(jīng)驗不具有普適性,歸檔工作面臨著實際應(yīng)用和發(fā)展風(fēng)險,預(yù)期目標(biāo)與現(xiàn)實效果具有應(yīng)然與實然的沖突。本著維護(hù)政務(wù)微博信息完整與安全,服務(wù)全社會的歸檔原則,可以不預(yù)先設(shè)置最終目標(biāo),而用無限延伸歸檔目標(biāo)深度和廣度的思路來分流政務(wù)微博信息歸檔的重重壓力。值得關(guān)注的是,周文泓教授[10]倡導(dǎo)多元主體構(gòu)建多樣化行動方案來形成歸檔跨時空接力,折中存儲不具有現(xiàn)行價值的信息來降低信息丟失或受損風(fēng)險,最終達(dá)成全景存檔。