劉雨農(nóng) 是沁
摘? ?要:文章基于人文社科研究的特點(diǎn),分析了人文社科知識(shí)服務(wù)在數(shù)據(jù)驅(qū)動(dòng)范式下存在的現(xiàn)實(shí)性困境與訴求,進(jìn)而從資源、功能、制度三個(gè)方面構(gòu)建了知識(shí)服務(wù)框架,并對(duì)部分關(guān)鍵問(wèn)題進(jìn)行討論。研究認(rèn)為,數(shù)據(jù)驅(qū)動(dòng)下的人文社科知識(shí)服務(wù)應(yīng)通過(guò)拓展數(shù)據(jù)源、引入大數(shù)據(jù)處理技術(shù)等方式,為人文社科研究者提供數(shù)據(jù)定制、技術(shù)指導(dǎo)、輔助分析、智慧推送服務(wù),并在數(shù)據(jù)安全、數(shù)據(jù)產(chǎn)權(quán)和人才建設(shè)方面予以保障。
關(guān)鍵詞:人文社科;數(shù)據(jù)驅(qū)動(dòng);知識(shí)服務(wù);服務(wù)創(chuàng)新
中圖分類(lèi)號(hào):G250.2;C3? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2019004
Abstract Focus on the characteristics of social science, this paper analyzes the dilemma and requirement of data-driven knowledge service, introduces a knowledge service framework from three aspects: resource, function and institution, and then discusses some key issues such as the role of service. Data is the core of knowledge services. It is necessary to expand the data source and adopt new technology to help researchers by providing customized data set, technical training, analysis assistance and smart recommendations. Issues such as data security, data property and human resources are also mentioned.
Key words humanities and social sciences; data-driven; knowledge service; service innovation
作為一次重大的時(shí)代轉(zhuǎn)型,大數(shù)據(jù)對(duì)人類(lèi)生活、工作與思維方式產(chǎn)生了深遠(yuǎn)影響[1]。近年來(lái),隨著機(jī)器學(xué)習(xí)、云計(jì)算等相關(guān)技術(shù)走向成熟,基于海量異構(gòu)性數(shù)據(jù)的深度挖掘和場(chǎng)景化應(yīng)用正逐步成為現(xiàn)實(shí)。當(dāng)前,大數(shù)據(jù)浪潮中的人文社科研究正處于全新的歷史機(jī)遇期,大數(shù)據(jù)驅(qū)動(dòng)的“第四范式”在人文社科研究領(lǐng)域獲得了廣泛的推崇[2]。在此背景下,大數(shù)據(jù)環(huán)境不僅為人文社科傳統(tǒng)研究問(wèn)題的驗(yàn)證和解釋帶來(lái)全新思路,也為新現(xiàn)象、新規(guī)律的發(fā)現(xiàn)提供了更多可能。然而,由于特殊的學(xué)科特性,哲學(xué)、政治、歷史等人文學(xué)科在過(guò)去的研究中很少涉及定量數(shù)據(jù),而經(jīng)濟(jì)、管理等社會(huì)學(xué)科對(duì)復(fù)雜數(shù)據(jù)的處理相對(duì)陌生。面對(duì)日益復(fù)雜的大數(shù)據(jù)環(huán)境,人文社科研究人員難以獨(dú)自完成大數(shù)據(jù)的處理工作,急需從與數(shù)據(jù)科學(xué)相關(guān)的專(zhuān)業(yè)領(lǐng)域獲取外部支持。
過(guò)去對(duì)于此類(lèi)面向科研的外部支持獲取途徑主要存在兩種思路:一是開(kāi)展跨領(lǐng)域、跨學(xué)科的學(xué)術(shù)合作。學(xué)術(shù)合作在知識(shí)融合的深度和穩(wěn)定性等方面具有較大優(yōu)勢(shì),但是在實(shí)際操作過(guò)程中需要科研機(jī)構(gòu)和人員建立長(zhǎng)期、穩(wěn)定的關(guān)系。由于在一定程度上會(huì)受到機(jī)構(gòu)組織形式和管理機(jī)制的制約,使得合作的廣度和深度存在較大限制;二是從第三方機(jī)構(gòu)獲取相關(guān)的知識(shí)服務(wù)內(nèi)容。傳統(tǒng)的知識(shí)服務(wù)指圖書(shū)情報(bào)等機(jī)構(gòu)利用自身信息資源優(yōu)勢(shì),按照學(xué)科領(lǐng)域發(fā)展和信息需求規(guī)律提供的一種專(zhuān)業(yè)化服務(wù)。長(zhǎng)期以來(lái),知識(shí)服務(wù)通過(guò)不斷的完善創(chuàng)新滿足了不同學(xué)科研究者對(duì)于文獻(xiàn)、信息和知識(shí)的訴求。隨著大數(shù)據(jù)環(huán)境的不斷加深,面向人文社科科研的知識(shí)服務(wù)體系被寄予更高期望,即不僅要兼顧大數(shù)據(jù)的一般技術(shù)特征,更要扎根于人文社科本身的學(xué)科特點(diǎn)與應(yīng)用場(chǎng)景。因此,探討適應(yīng)數(shù)據(jù)驅(qū)動(dòng)范式下人文社科研究需求的知識(shí)服務(wù)模式與內(nèi)容創(chuàng)新具有緊迫性和現(xiàn)實(shí)性。
1? ?當(dāng)前人文社科知識(shí)服務(wù)的現(xiàn)狀與新訴求
1.1? ? 傳統(tǒng)人文社科知識(shí)服務(wù)模式及其局限性
知識(shí)服務(wù)是在知識(shí)經(jīng)濟(jì)與知識(shí)管理背景下提出的重要概念,作為獲取、加工、共享知識(shí)的一種服務(wù)方式,在人文社科研究中扮演著重要角色。總體來(lái)看,我國(guó)面向人文社科研究的知識(shí)服務(wù)主要包括以下兩種模式:
(1)以傳統(tǒng)圖書(shū)館為背景的文獻(xiàn)服務(wù)。在知識(shí)服務(wù)概念提出前的較長(zhǎng)時(shí)間里,信息匱乏仍是困擾人文社科研究的主要原因之一。由于人文社科研究人員的需求主要集中于文獻(xiàn)方面,如何充分保障文獻(xiàn)資料的供給,成為了圖書(shū)館、情報(bào)所等相關(guān)服務(wù)機(jī)構(gòu)著力解決的核心問(wèn)題。20世紀(jì)80年代末,中國(guó)人民大學(xué)圖書(shū)館對(duì)全國(guó)文獻(xiàn)資源開(kāi)展了一次全面調(diào)查,全國(guó)社科文獻(xiàn)資源調(diào)查與分布研究作為其重要的組成部分,明確提出了海外資源匱乏、學(xué)科分布不均、資源重復(fù)建設(shè)等問(wèn)題[3]。對(duì)此,圖書(shū)情報(bào)界從不同角度展開(kāi)研究,并提出了大量指導(dǎo)性意見(jiàn)[4-5]。作為文獻(xiàn)的主要儲(chǔ)藏和流通中心,傳統(tǒng)圖書(shū)館毫無(wú)疑問(wèn)成為文獻(xiàn)資源服務(wù)的中堅(jiān)力量。21世紀(jì)初,在《高校圖書(shū)館規(guī)程》的引導(dǎo)下,各圖書(shū)館以CALIS建設(shè)為契機(jī),掀起了文獻(xiàn)保障系統(tǒng)建設(shè)熱潮[6]。文獻(xiàn)保障系統(tǒng)不僅促進(jìn)了全國(guó)資源建設(shè)的統(tǒng)一和協(xié)調(diào),也通過(guò)館際互借、文獻(xiàn)傳遞等服務(wù)推動(dòng)了文獻(xiàn)資源的開(kāi)放共享。
然而,21世紀(jì)以來(lái),信息環(huán)境發(fā)生了巨大的變化,以解決“信息稀缺”為目標(biāo)的知識(shí)服務(wù)模式呈現(xiàn)出愈發(fā)明顯的局限性[7]。一方面,信息中心的轉(zhuǎn)移使圖書(shū)館的認(rèn)知度和存在價(jià)值有所降低,研究人員可直接通過(guò)搜索引擎提供的檢索功能在各類(lèi)數(shù)據(jù)庫(kù)中尋找資源;另一方面,在信息爆炸的背景下,人文社科研究迫切需要從海量信息中獲取個(gè)性化、精確化的信息,而這種以圖書(shū)館傳統(tǒng)文獻(xiàn)資源為核心的被動(dòng)式服務(wù)與人文社科研究需求的契合度不高,服務(wù)效果有限。
(2)以學(xué)科嵌入式為核心的信息服務(wù)。自1993年Michel Bauwens第一次提出“嵌入式”概念以來(lái),嵌入式服務(wù)就在教學(xué)科研信息服務(wù)中得到動(dòng)態(tài)展現(xiàn)[8]。嵌入式服務(wù)指以科研服務(wù)用戶為中心,無(wú)縫地、動(dòng)態(tài)地、互動(dòng)地嵌入到一線用戶的科研環(huán)境中,為研究人員提供直接、專(zhuān)業(yè)、個(gè)性化的服務(wù)[9]。隨著Web2.0等技術(shù)在人文社科領(lǐng)域的廣泛普及與人文社科研究人員在獲取信息的網(wǎng)絡(luò)化、數(shù)字化趨勢(shì)愈發(fā)明顯,這種服務(wù)理念受到了廣泛的認(rèn)同,并得到了長(zhǎng)足的發(fā)展[8]。2005年以來(lái),國(guó)內(nèi)外不斷對(duì)嵌入式服務(wù)的深度和廣度進(jìn)行擴(kuò)充,學(xué)術(shù)界甚至提出學(xué)科服務(wù)不僅要嵌入到科學(xué)研究中,更要嵌入到教學(xué)、生活以及社會(huì)活動(dòng)中[10]。
然而,在數(shù)據(jù)驅(qū)動(dòng)環(huán)境下,嵌入式服務(wù)模式仍然存在局限。第一,嵌入式服務(wù)模式建立在學(xué)科化分類(lèi)的基礎(chǔ)上,與大數(shù)據(jù)背景下人文社科研究學(xué)科邊界日益模糊、跨學(xué)科合作研究的主流趨勢(shì)背道而馳;第二,以學(xué)科館員為核心的嵌入式服務(wù)模式始終受到館員自身學(xué)科背景和科研經(jīng)驗(yàn)的制約,使得服務(wù)內(nèi)容多局限于信息資源檢索,服務(wù)深度較為有限。隨著數(shù)據(jù)驅(qū)動(dòng)環(huán)境對(duì)人文社科研究在知識(shí)層面的要求逐漸升高,這種局限將被進(jìn)一步擴(kuò)大。
總體來(lái)看,隨著社會(huì)全面步入大數(shù)據(jù)時(shí)代,人文社科研究者信息需求多樣化與信息環(huán)境復(fù)雜化的矛盾更為突出[11],對(duì)知識(shí)服務(wù)模式與內(nèi)容的創(chuàng)新提出了更高的要求——即打破學(xué)科邊界,注重于數(shù)據(jù)本身的深度挖掘與加工,通過(guò)智慧化數(shù)據(jù)來(lái)驅(qū)動(dòng)面向科研的知識(shí)服務(wù)。然而,當(dāng)前面向人文社科的知識(shí)服務(wù)體系依然習(xí)慣性建立在圖書(shū)館系統(tǒng)的框架下,忽視了實(shí)際情況中人員、技術(shù)、經(jīng)費(fèi)等因素的限制,可操作性依然存在疑問(wèn)。更為重要的是,相關(guān)研究鮮有對(duì)數(shù)據(jù)驅(qū)動(dòng)范式與人文社科研究特殊性的綜合考量,知識(shí)服務(wù)創(chuàng)新的功能、模式等具體內(nèi)容依然有待進(jìn)一步挖掘。
1.2? ? 數(shù)據(jù)驅(qū)動(dòng)下人文社科知識(shí)服務(wù)新訴求
數(shù)據(jù)驅(qū)動(dòng)的人文社科研究改變了傳統(tǒng)人文社科研究的慣用邏輯,在研究范疇、研究重心和研究方法等方面呈現(xiàn)出重大變化。如直接面向總體的多維度分析而非基于局部樣本的抽樣調(diào)查、以大規(guī)模標(biāo)簽化數(shù)據(jù)表示的量化研究而非理論論證為主的歸納性研究、基于海量實(shí)時(shí)數(shù)據(jù)挖掘的前瞻性預(yù)測(cè)而非靜態(tài)數(shù)據(jù)的回溯性解釋。這些變化為相應(yīng)的知識(shí)服務(wù)提出了全新的訴求,需要通過(guò)知識(shí)服務(wù)創(chuàng)新來(lái)解決新環(huán)境下人文社科研究的關(guān)鍵性新問(wèn)題。
(1)橋接人文社科數(shù)據(jù)資源“孤島”。人文社科領(lǐng)域的大數(shù)據(jù)多產(chǎn)生于各類(lèi)社會(huì)活動(dòng)中,要求研究者能夠從海量數(shù)據(jù)中發(fā)現(xiàn)新問(wèn)題、探索新規(guī)律。然而,由于數(shù)據(jù)極大的開(kāi)發(fā)價(jià)值和經(jīng)濟(jì)效益,也涉及更多安全性問(wèn)題,在數(shù)據(jù)資產(chǎn)私有化的背景下,真正意義的大數(shù)據(jù)仍集中于政府、銀行、互聯(lián)網(wǎng)公司等機(jī)構(gòu)中,很少由研究人員和研究機(jī)構(gòu)完整掌握。此外,人文社科的歷史性研究數(shù)據(jù)廣泛的分散于大量研究人員之中,由于缺乏統(tǒng)一有效的共享機(jī)制,難以實(shí)現(xiàn)有效協(xié)同。因此,對(duì)于人文社科研究來(lái)說(shuō),數(shù)據(jù)增長(zhǎng)并未改變研究數(shù)據(jù)稀缺性的現(xiàn)實(shí)[12],反而在數(shù)據(jù)獲取過(guò)程中進(jìn)一步提高了經(jīng)濟(jì)成本和法律、道德門(mén)檻。
科學(xué)研究數(shù)據(jù)的“孤島”現(xiàn)象對(duì)人文社科長(zhǎng)遠(yuǎn)發(fā)展十分不利,會(huì)使“數(shù)據(jù)驅(qū)動(dòng)”淪為空談,無(wú)法解決實(shí)質(zhì)性學(xué)術(shù)問(wèn)題,更難在社會(huì)經(jīng)濟(jì)建設(shè)中發(fā)揮作用。對(duì)此,需要面向人文社科的知識(shí)服務(wù)從資源層加大科研數(shù)據(jù)的建設(shè)力度,提供總量充足、涵蓋面廣、共享性高、適用性強(qiáng)、粒度可縮放、獲取門(mén)檻低的大數(shù)據(jù)資源供給服務(wù),進(jìn)而改善人文社科大數(shù)據(jù)資源的匱乏狀況。
(2)緩解人文社科數(shù)據(jù)技術(shù)壓力。數(shù)據(jù)科學(xué)涉及計(jì)算機(jī)科學(xué)、數(shù)學(xué)、信息科學(xué)、統(tǒng)計(jì)學(xué)等眾多學(xué)科知識(shí)的復(fù)雜協(xié)同,具有較高的技術(shù)門(mén)檻。大數(shù)據(jù)并非人文社科的傳統(tǒng)研究領(lǐng)域,近年來(lái)的研究多側(cè)重于理念解釋?zhuān)形捶e累起太多成熟的實(shí)證經(jīng)驗(yàn)??紤]到傳統(tǒng)人文社科的學(xué)科背景和技術(shù)儲(chǔ)備,在短期內(nèi)提升人文社科研究者的數(shù)據(jù)分析與處理能力,效果相對(duì)有限,獨(dú)自承擔(dān)數(shù)據(jù)驅(qū)動(dòng)的研究工作必然承擔(dān)著一定的技術(shù)壓力。
盡管數(shù)據(jù)驅(qū)動(dòng)的人文社科研究提升了數(shù)據(jù)的地位,提高了大數(shù)據(jù)相關(guān)技術(shù)的要求,但并未改變?nèi)宋纳缈蒲芯康闹匦?。在本質(zhì)上技術(shù)的進(jìn)步最終要服務(wù)于對(duì)人類(lèi)文化、社會(huì)、經(jīng)濟(jì)等問(wèn)題的洞察與規(guī)律的解釋。人文社科背景的學(xué)者不宜在單純的技術(shù)層面耗費(fèi)過(guò)多精力,需要通過(guò)人文社科知識(shí)服務(wù)緩解數(shù)據(jù)驅(qū)動(dòng)研究的技術(shù)壓力,尤其是從專(zhuān)業(yè)的數(shù)據(jù)挖掘、處理、分析的角度獲得充分的幫助和指導(dǎo)。
(3)服務(wù)人文社科數(shù)據(jù)場(chǎng)景應(yīng)用。從數(shù)據(jù)驅(qū)動(dòng)概念引入人文社科領(lǐng)域以來(lái),許多研究者嘗試采用新的范式對(duì)人文社科問(wèn)題進(jìn)行研究。但在近期的研究過(guò)程中逐漸暴露出一個(gè)關(guān)鍵問(wèn)題,即基于大數(shù)據(jù)的主流研究方法多擅長(zhǎng)于發(fā)現(xiàn)不同變量間的相關(guān)性,而非發(fā)現(xiàn)變量間的因果關(guān)系。這就意味著對(duì)待現(xiàn)實(shí)性研究問(wèn)題時(shí)難以對(duì)各類(lèi)相關(guān)性現(xiàn)象進(jìn)行有效解釋?zhuān)谝欢ǔ潭壬蟿?dòng)搖了研究的價(jià)值。如何明確數(shù)據(jù)驅(qū)動(dòng)的人文社科研究?jī)r(jià)值,是對(duì)知識(shí)服務(wù)提出的重要訴求。
現(xiàn)實(shí)場(chǎng)景應(yīng)用是人文社科研究成果重要的價(jià)值實(shí)現(xiàn)途徑。大數(shù)據(jù)來(lái)源于社會(huì)實(shí)踐的積累與探索,在數(shù)據(jù)驅(qū)動(dòng)環(huán)境下將相關(guān)研究成果應(yīng)用于實(shí)踐、并接受實(shí)踐檢驗(yàn)是各界對(duì)人文社科研究的普遍性訴求。因此,需要知識(shí)服務(wù)提供方充分結(jié)合自身資源優(yōu)勢(shì)和技術(shù)優(yōu)勢(shì),對(duì)人文社科多樣化應(yīng)用場(chǎng)景進(jìn)行構(gòu)建或描述,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的人文社科研究成果實(shí)現(xiàn)與應(yīng)用場(chǎng)景的對(duì)接。
基于上述訴求,本文結(jié)合數(shù)據(jù)驅(qū)動(dòng)環(huán)境下人文社科研究的總體過(guò)程和特點(diǎn),充分考慮人文社科研究者的現(xiàn)有條件和現(xiàn)實(shí)需求,提出創(chuàng)新型的知識(shí)服務(wù)的理論框架,以期為相關(guān)服務(wù)內(nèi)容開(kāi)展提供支持。
2? ?數(shù)據(jù)驅(qū)動(dòng)下人文社科知識(shí)服務(wù)框架構(gòu)建
對(duì)于數(shù)據(jù)驅(qū)動(dòng)的人文社科知識(shí)服務(wù)框架,本文將從資源、功能、制度三個(gè)層面展開(kāi)論述。其中,數(shù)據(jù)資源建設(shè)是開(kāi)展知識(shí)服務(wù)的基礎(chǔ)和前提,具體功能實(shí)現(xiàn)是知識(shí)服務(wù)的核心和關(guān)鍵,而科學(xué)的制度安排則是知識(shí)服務(wù)落實(shí)的根本保障。
2.1? ? 資源層:基于“數(shù)據(jù)-科研”閉環(huán)的科學(xué)大數(shù)據(jù)管理框架
面向人文社科數(shù)據(jù)驅(qū)動(dòng)研究的知識(shí)服務(wù),核心問(wèn)題在于大數(shù)據(jù)資源的組織與管理。大數(shù)據(jù)環(huán)境復(fù)雜性增加,數(shù)據(jù)流轉(zhuǎn)速率變大,知識(shí)服務(wù)應(yīng)在總體上力求實(shí)現(xiàn)數(shù)據(jù)輸入、數(shù)據(jù)輸出、科研產(chǎn)出三方面的閉環(huán)(見(jiàn)圖1),即將與科研有關(guān)的大數(shù)據(jù)通過(guò)一系列清洗、存儲(chǔ)、挖掘過(guò)程,以智慧化的方式服務(wù)于科研活動(dòng),助力人文社科科研產(chǎn)出。同時(shí)將分散的高質(zhì)量科研數(shù)據(jù)重新匯集和整理,作為新的數(shù)據(jù)源匯入數(shù)據(jù)管理周期,進(jìn)而服務(wù)于其他的研究工作。
數(shù)據(jù)驅(qū)動(dòng)的人文社科研究已不再局限于傳統(tǒng)意義上的學(xué)科邊界,數(shù)據(jù)來(lái)源極其廣泛,涉及社會(huì)經(jīng)濟(jì)眾多方面,過(guò)去看似不相關(guān)的數(shù)據(jù)均可能在特定的人文社科研究中發(fā)揮重要作用。當(dāng)前,與人文社科研究相關(guān)的數(shù)據(jù)涉及社會(huì)經(jīng)濟(jì)眾多領(lǐng)域,增長(zhǎng)速度空前,盲目地將所有具備潛在價(jià)值的數(shù)據(jù)全部收納顯然缺乏操作性。因此,在數(shù)據(jù)采集階段的重點(diǎn)任務(wù)應(yīng)是打通數(shù)據(jù)輸入渠道,與不同數(shù)據(jù)源形成穩(wěn)定數(shù)據(jù)接口,并根據(jù)科研用戶的具體需求提供定制化的數(shù)據(jù)輸入方案。
隨著大數(shù)據(jù)在社會(huì)生活中的全方位滲透,人文社科研究的數(shù)據(jù)來(lái)源呈現(xiàn)出多樣化的分布態(tài)勢(shì)。除一般性人文社科文獻(xiàn)數(shù)據(jù)庫(kù)、人文社科專(zhuān)題數(shù)據(jù)庫(kù)以及科研團(tuán)隊(duì)主動(dòng)發(fā)布的研究數(shù)據(jù)集外,與人文社科研究對(duì)象相關(guān)的內(nèi)容理論上均可通過(guò)數(shù)字化表示而囊括在內(nèi)。如廣泛分散在行業(yè)或政府部門(mén)的數(shù)據(jù)庫(kù)中的產(chǎn)業(yè)發(fā)展數(shù)據(jù),企業(yè)經(jīng)營(yíng)信息,社會(huì)經(jīng)濟(jì)指標(biāo)等。尤其在移動(dòng)互聯(lián)網(wǎng)高速發(fā)展的背景下,各類(lèi)社會(huì)感知數(shù)據(jù)能夠通過(guò)遙感設(shè)備、可穿戴或移動(dòng)傳感設(shè)備、Web社交媒體進(jìn)行間接測(cè)度,這些數(shù)據(jù)在未來(lái)的人文社科研究中具有極大價(jià)值。顯然,數(shù)據(jù)的復(fù)雜來(lái)源進(jìn)一步加劇了數(shù)據(jù)的異構(gòu)性,對(duì)數(shù)據(jù)的規(guī)范化組織提出了更高的要求。相較于小數(shù)據(jù)的組織模式,大數(shù)據(jù)的清洗、存儲(chǔ)和挖掘工作更加復(fù)雜,需采取全新的技術(shù)策略進(jìn)行應(yīng)對(duì)。如云存儲(chǔ)技術(shù)的應(yīng)用具有擴(kuò)容便捷、管理成本低、安全性高的優(yōu)勢(shì),可以較好地契合大數(shù)據(jù)的量級(jí)特征。而機(jī)器學(xué)習(xí)等算法的實(shí)現(xiàn)有助于從價(jià)值密度較低的數(shù)據(jù)中挖掘出潛在價(jià)值,為智慧預(yù)測(cè)和智能推薦等服務(wù)的實(shí)施提供良好的基礎(chǔ)。
2.2? ? 功能層:面向科研全過(guò)程的知識(shí)服務(wù)內(nèi)容
傳統(tǒng)人文社科研究多以理論和模型驅(qū)動(dòng),由于涉及數(shù)據(jù)量不大,統(tǒng)計(jì)方法相對(duì)簡(jiǎn)單,研究項(xiàng)目?jī)H需要少量研究人員和幾臺(tái)普通計(jì)算機(jī)即可完成。對(duì)于知識(shí)服務(wù)的需求主要集中于研究前端,如選題階段中根據(jù)文獻(xiàn)計(jì)量分析為研究者提供研究熱點(diǎn)發(fā)現(xiàn),以及在模型構(gòu)建過(guò)程中進(jìn)行相關(guān)文獻(xiàn)支持,提供成熟的理論、經(jīng)驗(yàn)、方法供研究人員參考(見(jiàn)圖2)。
數(shù)據(jù)驅(qū)動(dòng)的人文社科研究呈現(xiàn)出同過(guò)去截然不同的研究模式,由于涉及的科研數(shù)據(jù)數(shù)量激增、多源異構(gòu),導(dǎo)致技術(shù)門(mén)檻提高,處理難度增大。在既有條件下,人文社科科研人員很難輕易依靠小規(guī)模團(tuán)隊(duì)完成復(fù)雜的研究工作,需要能夠涵蓋研究全過(guò)程的多元化外部支持(見(jiàn)圖3)。
(1)數(shù)據(jù)資源的提取和定制。根據(jù)研究人員的個(gè)性化需求,提供定制化的研究數(shù)據(jù)集或數(shù)據(jù)采集方案。對(duì)于來(lái)源不同的數(shù)據(jù)集,需要進(jìn)一步清洗和整理,如統(tǒng)一存儲(chǔ)格式和內(nèi)容結(jié)構(gòu)化等。數(shù)據(jù)應(yīng)能夠通過(guò)一致性和可信度檢驗(yàn),在質(zhì)量上達(dá)到人文社科研究的基本要求。
(2)數(shù)據(jù)技術(shù)的推薦與指導(dǎo)。針對(duì)人文社科研究的一線研究團(tuán)隊(duì),開(kāi)展一系列大數(shù)據(jù)研究培訓(xùn)與講座,重點(diǎn)關(guān)注機(jī)器學(xué)習(xí)等大數(shù)據(jù)前沿研究方法的理論和實(shí)操,幫助研究者了解和掌握大數(shù)據(jù)相關(guān)研究范式與技術(shù)的適用范圍、優(yōu)勢(shì)劣勢(shì)、發(fā)展趨勢(shì)。除特定服務(wù)對(duì)象外,還應(yīng)面向人文社科普及數(shù)據(jù)素養(yǎng)教育,引導(dǎo)培育從數(shù)據(jù)中發(fā)現(xiàn)問(wèn)題,從數(shù)據(jù)中驅(qū)動(dòng)研究的新思路。
(3)協(xié)助大數(shù)據(jù)分析和處理。近年來(lái),Rapidminer、Weka等窗口化機(jī)器學(xué)習(xí)工具的出現(xiàn)讓人文社科研究者能夠在不具備較強(qiáng)編程技術(shù)和算法理解的情況下開(kāi)展各類(lèi)大數(shù)據(jù)研究。然而,如果不了解工具的基本原理,很難針對(duì)特定科研需求調(diào)整算法,也無(wú)法獨(dú)自對(duì)可能出現(xiàn)異常情況進(jìn)行調(diào)試。因此,在研究過(guò)程中,上述內(nèi)容需要具備數(shù)據(jù)專(zhuān)業(yè)背景的專(zhuān)業(yè)人員參與,協(xié)助科研大數(shù)據(jù)的分析和處理。
(4)科研訊息的智慧推送。除服務(wù)于用戶研究外,也要充分發(fā)揮自身數(shù)據(jù)資源優(yōu)勢(shì),提供特色化服務(wù)。如基于有關(guān)科研工作者屬性、成果、行為、軌跡、網(wǎng)絡(luò)等海量數(shù)據(jù),結(jié)合特定人文社科研究領(lǐng)域的內(nèi)容與特征構(gòu)建用戶畫(huà)像。進(jìn)而以深度學(xué)習(xí)等算法為基礎(chǔ),建立智慧化推送系統(tǒng),為用戶推薦相關(guān)的科研成果、熱門(mén)研究方向和潛在科研合作者。
2.3? ? 制度層:基于人文社科發(fā)展戰(zhàn)略的機(jī)制化保障
知識(shí)服務(wù)不能僅僅著眼于數(shù)據(jù)驅(qū)動(dòng)熱潮下的人文社科研究需求,應(yīng)緊密結(jié)合大數(shù)據(jù)環(huán)境下人文社科研究的長(zhǎng)期發(fā)展戰(zhàn)略,保障服務(wù)內(nèi)容的持續(xù)、穩(wěn)定和成熟。這就要求將大數(shù)據(jù)服務(wù)的保障措施上升到制度層面,包括安全保障、人力保障、產(chǎn)權(quán)保障等。
(1)數(shù)據(jù)安全制度。數(shù)據(jù)驅(qū)動(dòng)的人文社科研究涉及大量與社會(huì)經(jīng)濟(jì)領(lǐng)域相關(guān)的高價(jià)值數(shù)據(jù),對(duì)特定利益相關(guān)群體具有較強(qiáng)的吸引力。在知識(shí)服務(wù)過(guò)程中,研究數(shù)據(jù)不可避免地出現(xiàn)集中存儲(chǔ)和高頻交換,必須采用相應(yīng)的安全技術(shù)和機(jī)制降低數(shù)據(jù)泄露的風(fēng)險(xiǎn)。首先,應(yīng)在知識(shí)服務(wù)提供方內(nèi)部建立完善的保密制度,尤其是內(nèi)網(wǎng)的數(shù)據(jù)輸出端口(如USB、打印設(shè)備等)應(yīng)受到嚴(yán)格管理,防止敏感數(shù)據(jù)的內(nèi)部泄露;其次,對(duì)于部分核心數(shù)據(jù)和敏感數(shù)據(jù),在技術(shù)上可采取“數(shù)據(jù)沙箱”架構(gòu)[13],使人文社科研究者在不真正取走數(shù)據(jù)的前提下進(jìn)行數(shù)據(jù)的分析與處理,做到數(shù)據(jù)不落地,既能提高數(shù)據(jù)安全性,又能減少數(shù)據(jù)平臺(tái)的維護(hù)成本。
(2)數(shù)據(jù)專(zhuān)員制度。面向大數(shù)據(jù)人文社科研究的知識(shí)服務(wù)除提供數(shù)據(jù)檢索等被動(dòng)式服務(wù)外,還應(yīng)通過(guò)數(shù)據(jù)專(zhuān)員制度,組織專(zhuān)業(yè)團(tuán)隊(duì)以積極主動(dòng)的方式深入到相關(guān)的人文社科研究中。本文認(rèn)為,數(shù)據(jù)專(zhuān)員至少包括三個(gè)方面:數(shù)據(jù)科學(xué)專(zhuān)員,負(fù)責(zé)專(zhuān)項(xiàng)人文社科領(lǐng)域大數(shù)據(jù)的分析與挖掘;數(shù)據(jù)工程專(zhuān)員,負(fù)責(zé)數(shù)據(jù)平臺(tái)的構(gòu)建、運(yùn)維以及人文社科大數(shù)據(jù)的采集、組織和存儲(chǔ);數(shù)據(jù)服務(wù)專(zhuān)員,負(fù)責(zé)外部數(shù)據(jù)源的協(xié)調(diào)、面向人文社科科研人員的咨詢、推薦和數(shù)據(jù)素養(yǎng)的培訓(xùn)等。數(shù)據(jù)專(zhuān)員制度強(qiáng)調(diào)了服務(wù)過(guò)程中服務(wù)人員的主觀能動(dòng)性作用,數(shù)據(jù)專(zhuān)員不僅需要掌握數(shù)據(jù)科學(xué)領(lǐng)域的專(zhuān)業(yè)性技能,熟悉數(shù)據(jù)驅(qū)動(dòng)的研究范式,也需要在不同人文社科領(lǐng)域具備一定研究經(jīng)驗(yàn)和工作基礎(chǔ),這與過(guò)去學(xué)科館員制度側(cè)重于文獻(xiàn)學(xué)背景有所區(qū)別。
(3)數(shù)據(jù)產(chǎn)權(quán)制度。大數(shù)據(jù)時(shí)代,數(shù)據(jù)資產(chǎn)的所有權(quán)歸屬問(wèn)題在學(xué)界存在廣泛的爭(zhēng)議。在人文社科研究中,對(duì)于涉及大量個(gè)人隱私信息的社會(huì)大數(shù)據(jù)使用是否適用于知識(shí)產(chǎn)權(quán)法中的例外條款,目前尚未出現(xiàn)明確和權(quán)威的定論。在以大數(shù)據(jù)為中心的知識(shí)服務(wù)過(guò)程中,尤其要處理好數(shù)據(jù)供給者與數(shù)據(jù)使用者的關(guān)系界定。首先,對(duì)于互聯(lián)網(wǎng)企業(yè)、政府、數(shù)據(jù)庫(kù)等不同數(shù)據(jù)源,應(yīng)簽訂多方數(shù)據(jù)許可協(xié)議,尤其要明確人文社科科研成果轉(zhuǎn)化過(guò)程中的數(shù)據(jù)資產(chǎn)問(wèn)題;其次,對(duì)于涉及隱私問(wèn)題、敏感問(wèn)題的數(shù)據(jù)應(yīng)在提供相關(guān)服務(wù)的過(guò)程中進(jìn)行匿名化和模糊化處理,最低限度減少數(shù)據(jù)倫理爭(zhēng)端;最后,應(yīng)借鑒相對(duì)成熟的學(xué)術(shù)引用體系,全面建立科學(xué)數(shù)據(jù)引用規(guī)范,充分尊重科研數(shù)據(jù)貢獻(xiàn)者的知識(shí)產(chǎn)權(quán)。
3? ?開(kāi)展新型知識(shí)服務(wù)的若干關(guān)鍵問(wèn)題
面向數(shù)據(jù)驅(qū)動(dòng)人文社科研究的知識(shí)服務(wù)與傳統(tǒng)服務(wù)模式既有一定繼承,也存在較大差別,在講求服務(wù)創(chuàng)新的同時(shí),應(yīng)根據(jù)現(xiàn)有條件和實(shí)際需求采取針對(duì)性的措施,盲目地?cái)U(kuò)張服務(wù)內(nèi)容反而會(huì)適得其反。本文認(rèn)為,以下三個(gè)問(wèn)題在具體的知識(shí)服務(wù)過(guò)程中應(yīng)得到充分重視。
3.1? ? 準(zhǔn)確定位知識(shí)服務(wù)角色功能
數(shù)據(jù)驅(qū)動(dòng)范式下的人文社科知識(shí)服務(wù)涉及到眾多學(xué)科、資源、技術(shù),過(guò)去單獨(dú)以圖書(shū)館為基礎(chǔ),簡(jiǎn)單地?cái)U(kuò)充服務(wù)內(nèi)容的思路在實(shí)踐層面缺乏可行性。本文認(rèn)為,知識(shí)服務(wù)的提供者需要匯集多方支持,包括但不限于圖書(shū)館、商業(yè)數(shù)據(jù)庫(kù)、公共部門(mén)、信息產(chǎn)業(yè)以及相關(guān)人文社科學(xué)科領(lǐng)域。這種知識(shí)服務(wù)模式應(yīng)定位為人文社科科研數(shù)據(jù)服務(wù)平臺(tái),該平臺(tái)并不意味擁有并存儲(chǔ)所有人文社科研究的數(shù)據(jù)集,也不要求在用戶使用層面實(shí)現(xiàn)絕對(duì)的開(kāi)放和免費(fèi),而是作為人文社科研究大數(shù)據(jù)的集散中心和人文社科跨學(xué)科研究的孵化培育中心進(jìn)行建設(shè)。即通過(guò)智能化的檢索、發(fā)現(xiàn)、推送系統(tǒng),成為連接學(xué)科、數(shù)據(jù)與技術(shù)的橋梁和紐帶,實(shí)現(xiàn)研究者、數(shù)據(jù)集、工具包之間的三方對(duì)話。
3.2? ? 妥善處理服務(wù)與研究的關(guān)系
科研知識(shí)服務(wù)的本質(zhì)任務(wù)是以用戶為中心,滿足用戶科研知識(shí)需求,幫助用戶解決特定的科研數(shù)據(jù)問(wèn)題。服務(wù)模式的創(chuàng)新并不意味著越俎代庖,替代科研人員的研究工作。研究數(shù)據(jù)處理是人文社科研究中的重要組成,不僅需要數(shù)據(jù)技術(shù)支持,更需要特定人文社科學(xué)科背景的理論知識(shí)作為支撐。如果數(shù)據(jù)服務(wù)人員直接承擔(dān)部分研究工作,由于缺乏對(duì)研究場(chǎng)景必要的理解和經(jīng)驗(yàn),容易陷入到“唯數(shù)據(jù)論”的陷阱中,反而對(duì)服務(wù)對(duì)象的科學(xué)研究造成一定程度的干擾和誤導(dǎo)。因此,知識(shí)服務(wù)應(yīng)重點(diǎn)針對(duì)人文社科研究人員在數(shù)據(jù)獲取和分析技術(shù)方面的短板,數(shù)據(jù)使用與情景解釋等問(wèn)題應(yīng)由科研人員自身承擔(dān)。
3.3? ? 對(duì)傳統(tǒng)服務(wù)模式的科學(xué)揚(yáng)棄
從文獻(xiàn)服務(wù)、學(xué)科服務(wù)、到數(shù)據(jù)服務(wù),不同的服務(wù)模式順應(yīng)了特定環(huán)境下人文社科研究的需求。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)被提升到全新高度,圍繞大數(shù)據(jù)展開(kāi)智能化的知識(shí)服務(wù)逐漸成為新的潮流。然而,這并不意味著過(guò)去文獻(xiàn)保障服務(wù)和嵌入式學(xué)科服務(wù)失去了意義。從人文社科研究的角度上看,當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的研究范式對(duì)因果關(guān)系的解釋力不足、數(shù)據(jù)生成和采集過(guò)程中的“信號(hào)問(wèn)題”、數(shù)據(jù)倫理和規(guī)范等問(wèn)題[14]仍然存在較大的爭(zhēng)議,并非所有人文社科問(wèn)題都適用于數(shù)據(jù)驅(qū)動(dòng)研究范式,大量社會(huì)經(jīng)濟(jì)問(wèn)題依然需要采用過(guò)去較為成熟的方法和手段進(jìn)行的研究。本文提出的知識(shí)服務(wù)模式并不能完全替代以往的圖書(shū)情報(bào)工作,應(yīng)作為一種創(chuàng)新和補(bǔ)充服務(wù)于人文社科研究。
4? ?結(jié)語(yǔ)
數(shù)據(jù)密集型科學(xué)范式是對(duì)傳統(tǒng)科學(xué)研究的一次重大變革,需要?jiǎng)?chuàng)新性的知識(shí)服務(wù)進(jìn)行支持。作為以數(shù)據(jù)資源管理出發(fā)的科學(xué)探索,本文結(jié)合數(shù)據(jù)驅(qū)動(dòng)范式與人文社科學(xué)科特征,提出了以數(shù)據(jù)為核心的知識(shí)服務(wù)框架,并從資源建設(shè)、功能服務(wù)、制度保障層面分別展開(kāi)了論證。
當(dāng)前,數(shù)據(jù)驅(qū)動(dòng)的人文社科研究已受到廣泛重視,已有圖書(shū)館、情報(bào)單位、研究機(jī)構(gòu)在面向人文社科研究的大數(shù)據(jù)服務(wù)方面進(jìn)行了針對(duì)性地探索。但在人文社科研究領(lǐng)域,由于人文社科具有學(xué)科特色鮮明、知識(shí)互相貫通的特征,不同研究者對(duì)大數(shù)據(jù)的理解和需求也存在較大差異,為知識(shí)服務(wù)工作規(guī)范化、體系化、標(biāo)準(zhǔn)化工作帶來(lái)巨大挑戰(zhàn)。針對(duì)普適性推廣不足的現(xiàn)實(shí)困境,亟需根據(jù)特定的現(xiàn)實(shí)條件和用戶需求,進(jìn)行差異性的調(diào)適,形成具有針對(duì)性的精細(xì)化知識(shí)服務(wù),以推進(jìn)我國(guó)人文社科知識(shí)服務(wù)的整體性推進(jìn)。因此,未來(lái)研究可在數(shù)據(jù)服務(wù)、合作協(xié)同、知識(shí)共享等方面進(jìn)一步推進(jìn),進(jìn)一步提高知識(shí)服務(wù)的效率和精準(zhǔn)度,更好地服務(wù)于數(shù)據(jù)驅(qū)動(dòng)下的人文社科研究工作。
參考文獻(xiàn):
[1]? (英)維克托·邁爾·舍恩伯格,肯尼思·庫(kù)克耶.周濤等譯.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2012.
[2]? 鄧仲華,李志芳.科學(xué)研究范式的演化——大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式[J].情報(bào)資料工作,2013(4):19-23.
[3]? 孔令乾,胡廣翔,董焱.全國(guó)文獻(xiàn)資源調(diào)研分報(bào)告之五全國(guó)社科文獻(xiàn)資源調(diào)查與布局研究[J].圖書(shū)館學(xué)通訊(中國(guó)圖書(shū)館學(xué)報(bào)),1990(4):40-43,93.
[4]? 馬繼剛,林平,劉柳.人文社科文獻(xiàn)保障與共建共享的現(xiàn)狀分析與發(fā)展策略[J].大學(xué)圖書(shū)館學(xué)報(bào),2013,31(2):26-30.
[5]? 王新才,王海寧.高校圖書(shū)館期刊文獻(xiàn)保障實(shí)證研究——以武漢大學(xué)為例[J].中國(guó)圖書(shū)館學(xué)報(bào),2015,41(5):4-15.
[6]? 盧章平,袁潤(rùn),王正興.發(fā)現(xiàn)服務(wù):大學(xué)與研究機(jī)構(gòu)圖書(shū)館的趨勢(shì)[J].中國(guó)圖書(shū)館學(xué)報(bào),2014,40(3):20-26.
[7]? Anderson R.The Crisis in Research Librarianship[J].The Journal of Academic Librarianship,2011,37(4):289-290.
[8]? 劉芳.大數(shù)據(jù)時(shí)代高校圖書(shū)館信息服務(wù)創(chuàng)新研究[M].北京:光明日?qǐng)?bào)出版社,2016.
[9]? 羅亞泓.廣州高校圖書(shū)館嵌入式學(xué)科服務(wù)的SWOT分析和策略研究[J].圖書(shū)情報(bào)工作,2015,59(7):112-116.
[10]? 張紅琳,葉文偉.高校圖書(shū)館嵌入式學(xué)科服務(wù)的實(shí)踐與發(fā)展建議[J].圖書(shū)與情報(bào),2015(2):133-136.
[11]? 李桂華.基于美國(guó)大學(xué)參考咨詢提問(wèn)的當(dāng)代社會(huì)科學(xué)信息需求研究[J].情報(bào)學(xué)報(bào),2015,34(10):1079-1087.
[12]? 何勝,熊太純,周冰,等.高校圖書(shū)館大數(shù)據(jù)服務(wù)現(xiàn)實(shí)困境與應(yīng)用模式分析[J].圖書(shū)情報(bào)工作,2015,59(22):50-55.
[13]? 邊衛(wèi)紅,單文.Fintech發(fā)展與“監(jiān)管沙箱”——基于主要國(guó)家的比較分析[J].金融監(jiān)管研究,2017(7):85-98.
[14]? 王世偉,俞平,軒傳樹(shù).國(guó)外社會(huì)信息化研究文摘[M].上海:上海社會(huì)科學(xué)出版社,2016.
作者簡(jiǎn)介:劉雨農(nóng)(1991-),男,南京大學(xué)信息管理學(xué)院博士研究生;是沁(1992-),女,南京大學(xué)信息管理學(xué)院博士研究生。