李展宇,楊道濤
(南京理工大學(xué) 科學(xué)技術(shù)協(xié)會(huì),江蘇 南京 210094)
近年來,黨和國(guó)家高度重視科研誠(chéng)信建設(shè)工作。2019年5月,黨中央專門出臺(tái)《關(guān)于進(jìn)一步弘揚(yáng)科學(xué)家精神加強(qiáng)作風(fēng)和學(xué)風(fēng)建設(shè)的意見》,要求“加強(qiáng)作風(fēng)和學(xué)風(fēng)建設(shè),營(yíng)造風(fēng)清氣正的科研環(huán)境”[1]。2021年5月28日,習(xí)近平總書記在中國(guó)科學(xué)院第二十次院士大會(huì)、中國(guó)工程院第十五次院士大會(huì)、中國(guó)科協(xié)第十次全國(guó)代表大會(huì)上發(fā)表重要講話指出:“誠(chéng)信是科學(xué)精神的必然要求。要做學(xué)術(shù)道德的楷模,堅(jiān)守學(xué)術(shù)道德和科研倫理,踐行學(xué)術(shù)規(guī)范,讓學(xué)術(shù)道德和科學(xué)精神內(nèi)化于心、外化于行,涵養(yǎng)風(fēng)清氣正的科研環(huán)境,培育嚴(yán)謹(jǐn)求是的科學(xué)文化?!盵2]2021年,新修訂的《中華人民共和國(guó)科學(xué)技術(shù)進(jìn)步法》新增了多條科研誠(chéng)信相關(guān)內(nèi)容,明確了科研失信行為的法律責(zé)任。[3]盡管如此,隨著我國(guó)經(jīng)濟(jì)社會(huì)的發(fā)展,科技創(chuàng)新仍然面臨著學(xué)術(shù)不端、學(xué)風(fēng)浮躁的挑戰(zhàn),很多科研誠(chéng)信事件都引發(fā)了全社會(huì)的廣泛關(guān)注。但是,由于科研誠(chéng)信事件發(fā)生機(jī)理、處置方式、處置流程都比較復(fù)雜,信息資源的丟失、斷層、重用率低等現(xiàn)象極為普遍,因此,如何有效進(jìn)行科研誠(chéng)信案例庫(kù)構(gòu)建成為了科研誠(chéng)信事件處置決策的前提與基礎(chǔ)。
本體(Ontology)的概念來源于哲學(xué)領(lǐng)域,是對(duì)客觀存在的系統(tǒng)的闡釋或說明。本體是近年來計(jì)算機(jī)及相關(guān)領(lǐng)域普遍關(guān)注的一個(gè)研究熱點(diǎn),作為一種能在語義和知識(shí)層次上描述信息系統(tǒng)的概念模型建模工具,已被廣泛應(yīng)用于知識(shí)工程、系統(tǒng)建模、信息處理、自然語義理解等領(lǐng)域。近年來,國(guó)內(nèi)外許多學(xué)者對(duì)本體進(jìn)行了深入研究,并將其應(yīng)用到各個(gè)領(lǐng)域。Neche最早將本體概念應(yīng)用于人工智能,規(guī)范了人工智能領(lǐng)域范圍內(nèi)的語義規(guī)則[4]。Etsui等人構(gòu)建了領(lǐng)域本體,解決了同一詞語在不同場(chǎng)景中的語義選擇問題[5]。Amailef.K將本體建模應(yīng)用于突發(fā)事件處理[6]。謝建民構(gòu)建了突發(fā)事件網(wǎng)絡(luò)輿情案例的本體模型[7]。王琳將本體模型應(yīng)用于糧食應(yīng)急案例[8]。李旭研究了建筑領(lǐng)域本體的應(yīng)用流程[9]。
由此可見,本體理論在揭示事物本質(zhì)、對(duì)領(lǐng)域知識(shí)的規(guī)范化表達(dá)方面具有獨(dú)特優(yōu)勢(shì)。因此,本文結(jié)合現(xiàn)有案例庫(kù)信息,在相關(guān)資料搜集的基礎(chǔ)上,研究基于本體的科研誠(chéng)信案例庫(kù)構(gòu)建。
科研誠(chéng)信案例本體的構(gòu)建,以科研誠(chéng)信案例信息為基礎(chǔ),通過領(lǐng)域界定、案例描述、屬性定義等幾個(gè)步驟,構(gòu)建科研誠(chéng)信案例本體表達(dá)模型。整個(gè)流程分為四個(gè)步驟:1.科研誠(chéng)信案例領(lǐng)域。整理目前已公開的科研誠(chéng)信案例信息,實(shí)現(xiàn)對(duì)科研誠(chéng)信案例的準(zhǔn)確界定和識(shí)別;2.建立科研誠(chéng)信案例表示框架。對(duì)科研誠(chéng)信案例進(jìn)行深入剖析。用自然語言描述科研誠(chéng)信案例的要素;3.構(gòu)建科研誠(chéng)信案例本體,對(duì)科研誠(chéng)信案例進(jìn)行要素分析,提取公共屬性,映射為由類、屬性、關(guān)系組成的本體模型;4.科研誠(chéng)信案例本體模型應(yīng)用。通過本體的構(gòu)建,實(shí)現(xiàn)歷史案例檢索、信息查詢和處置方案推薦等應(yīng)用,為決策者提供支持,實(shí)現(xiàn)科研誠(chéng)信案例知識(shí)的重用和共享。綜合以上步驟,得出科研誠(chéng)信案例本體構(gòu)建流程如圖1所示:
圖1 科研誠(chéng)信案例本體構(gòu)建流程
科研誠(chéng)信案例信息表示可以分為兩個(gè)步驟。首先,根據(jù)相關(guān)法律法規(guī)對(duì)科研誠(chéng)信案例進(jìn)行領(lǐng)域界定,篩選出符合要求的案例。然后,對(duì)案例信息進(jìn)行梳理分析,提取案例的公共屬性,為本體建模和案例庫(kù)構(gòu)建打下基礎(chǔ)。
根據(jù)《中華人民共和國(guó)科學(xué)技術(shù)進(jìn)步法》《科學(xué)技術(shù)活動(dòng)違規(guī)行為處理暫行規(guī)定》(科學(xué)技術(shù)部第19號(hào)令),可以將科研誠(chéng)信違規(guī)行為按責(zé)任主體分為受托管理機(jī)構(gòu)及其工作人員、科學(xué)技術(shù)活動(dòng)實(shí)施單位、科學(xué)技術(shù)人員、科學(xué)技術(shù)活動(dòng)咨詢?cè)u(píng)審專家、第三方科學(xué)技術(shù)服務(wù)機(jī)構(gòu)及其工作人員五個(gè)大類,具體內(nèi)容見表1。
表1 科研誠(chéng)信案例分類
根據(jù)表1的領(lǐng)域界定條件,本文通過對(duì)國(guó)家自然科學(xué)基金委、衛(wèi)健委、地方科技主管部門等部門公開的科研誠(chéng)信案例信息進(jìn)行搜集與分析,提取出科研誠(chéng)信案例的公共屬性如表2所示。
表2 科研誠(chéng)信案例公共屬性
科研誠(chéng)信案例用自然語言描述科研誠(chéng)信違規(guī)事件相關(guān)的情況和解決方案。通過對(duì)案例的特征分析,提取出基本信息、責(zé)任主體、違規(guī)行為、處置結(jié)果四個(gè)要素??梢詫⒚總€(gè)案例用一個(gè)四元組進(jìn)行描述,即C={CD,CR,CB,CS}。其中,CD表示事件的基本信息,CR表示事件的責(zé)任主體,CB表示違規(guī)行為,CS表示處置結(jié)果。CD用于描述科研誠(chéng)信案例的基本情況,包括案例的起止時(shí)間、責(zé)任人、責(zé)任單位等;CR用于描述科研誠(chéng)信案例中承擔(dān)責(zé)任的主體,包含責(zé)任單位、責(zé)任人等信息;CB用于描述案例中出現(xiàn)的違規(guī)行為,包括違規(guī)事實(shí)、涉及成果、行為性質(zhì)、情節(jié)輕重等;CS用于描述對(duì)科研誠(chéng)信違規(guī)行為的處置,主要包括處置機(jī)構(gòu)、處置措施、案例影響等。該部分是案例的重要數(shù)據(jù),在案例推理過程中,案例的處置措施也是指導(dǎo)未來事件的重要知識(shí)來源。
科研誠(chéng)信案例本體是描述科研誠(chéng)信案例的基類,是案例公共屬性的集合。本體建模是指將案例公共屬性具體映射為類、實(shí)體、屬性和關(guān)系。其中,類是信息邏輯關(guān)系的集合;實(shí)體是類的具象化表示;屬性是公共屬性中實(shí)體字段的屬性;關(guān)系用來描述類之間的關(guān)系。在科研誠(chéng)信案例本體中,將基本信息、責(zé)任信息、違規(guī)行為、處置結(jié)果作為四個(gè)類,將案例信息映射為類、屬性、關(guān)系和實(shí)例表達(dá)的本體模型,各類、子類和屬性如表3所示。
其中,基本信息、責(zé)任主體、違規(guī)行為、處置結(jié)果是四個(gè)平行的等價(jià)類。每個(gè)類與子類是繼承關(guān)系。四個(gè)等價(jià)類之間的關(guān)系如圖2所示。
每個(gè)子類有相應(yīng)的屬性,每個(gè)屬性有具體的屬性值。以“違規(guī)類型”屬性為例,歸納出適用于不同責(zé)任主體的屬性值,以“科學(xué)技術(shù)人員”作為責(zé)任主體,其“違規(guī)類型”屬性值見表4。
表3 科研誠(chéng)信案例本體模型的類與屬性描述
圖2 各類之間的關(guān)系圖
表4 “違規(guī)類型”屬性值舉例
子類之間存在多種關(guān)系。如責(zé)任人、責(zé)任單位與違規(guī)事實(shí)之間存在實(shí)施關(guān)系,違規(guī)事實(shí)、行為性質(zhì)會(huì)影響處置措施,處置措施會(huì)造成案例影響,案例影響將具體影響到責(zé)任人、責(zé)任單位和涉及成果等。各子類之間的關(guān)系如圖3所示。
圖3 各子類之間的關(guān)系圖
本文提出的科研誠(chéng)信案例庫(kù)是充分利用網(wǎng)絡(luò)信息技術(shù),連接科研機(jī)構(gòu)、期刊出版機(jī)構(gòu)和科研人員的平臺(tái)。案例庫(kù)以科研誠(chéng)信案例本體為核心,具備案例查詢與檢索、案例評(píng)價(jià)、事件決策等功能。案例庫(kù)的數(shù)據(jù)來源于對(duì)已公開的科研誠(chéng)信事件通報(bào)的加工整理,具備較強(qiáng)的可靠性與權(quán)威性。利用案例本體的推理功能,可以對(duì)未來的科研誠(chéng)信事件提供咨詢與決策建議。
科研誠(chéng)信案例庫(kù)的價(jià)值主要體現(xiàn)在三個(gè)方面:一是實(shí)現(xiàn)了科研誠(chéng)信案例信息的規(guī)范化存儲(chǔ)。通過數(shù)據(jù)庫(kù)的建設(shè),將自然語言描述的案例信息加工為規(guī)范的字段與屬性,從而實(shí)現(xiàn)了科研誠(chéng)信案例的查詢與檢索。二是提供了科研誠(chéng)信案例評(píng)價(jià)的平臺(tái)。按照用戶的需求,對(duì)案例相關(guān)字段進(jìn)行梳理與排序,可以實(shí)現(xiàn)不同用戶需求下的科研誠(chéng)信案例評(píng)價(jià)。三是為決策者提供科研誠(chéng)信類事件的決策建議??蒲姓\(chéng)信事件的處置是一個(gè)復(fù)雜的過程,通過對(duì)已發(fā)生案例的違規(guī)事實(shí)、處置情況、案例影響等信息進(jìn)行案例推理,可以在新的科研誠(chéng)信事件發(fā)生時(shí),為決策者提供處置方案和影響預(yù)測(cè),是科研誠(chéng)信事件處置決策的重要參考。
案例庫(kù)分為物理層、數(shù)據(jù)層、業(yè)務(wù)層、應(yīng)用層4個(gè)層次,整體架構(gòu)如圖4所示。物理層包含案例庫(kù)的物理實(shí)體,包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸和數(shù)據(jù)計(jì)算等模塊,各模塊之間通過協(xié)議實(shí)現(xiàn)通信。數(shù)據(jù)層包含基于科研誠(chéng)信案例本體的數(shù)據(jù)核心,通過數(shù)據(jù)的加工整理,可以將各渠道公開的科研誠(chéng)信事件通報(bào)導(dǎo)入科研誠(chéng)信案例本體模型中,實(shí)現(xiàn)科研誠(chéng)信案例的入庫(kù)。同時(shí),通過對(duì)現(xiàn)有案例的分析與推理,為用戶提供決策咨詢與建議。業(yè)務(wù)層包含科研誠(chéng)信案例檢索、案例評(píng)價(jià)、事件決策等系統(tǒng),在業(yè)務(wù)層核心數(shù)據(jù)庫(kù)的支撐下,為用戶提供各類服務(wù)。同時(shí),可根據(jù)用戶的需求,實(shí)現(xiàn)系統(tǒng)功能的個(gè)性化定制。應(yīng)用層包含前端系統(tǒng)與后臺(tái)系統(tǒng)。前端系統(tǒng)是面向所有用戶的PC端及移動(dòng)端平臺(tái),支持所有用戶訪問,具備案例檢索與查詢等功能;后臺(tái)系統(tǒng)是根據(jù)不同的用戶類型,劃分為科研機(jī)構(gòu)后臺(tái)系統(tǒng)、出版機(jī)構(gòu)后臺(tái)系統(tǒng)、科研人員后臺(tái)系統(tǒng),可以實(shí)現(xiàn)對(duì)案例的統(tǒng)計(jì)與管理。
圖4 科研誠(chéng)信案例庫(kù)架構(gòu)圖
科研誠(chéng)信案例庫(kù)前端界面如圖5所示,系統(tǒng)可以實(shí)現(xiàn)案例的創(chuàng)建與檢索,同時(shí)支持根據(jù)不同字段篩選和模糊查詢等功能。在數(shù)據(jù)界面展示案例的編號(hào)、機(jī)構(gòu)、責(zé)任主體名稱、違規(guī)行為類型等基礎(chǔ)信息,用戶可以通過點(diǎn)擊某一個(gè)案例,查看該案例的詳情信息。
圖5 科研誠(chéng)信案例庫(kù)前端界面
創(chuàng)新是一個(gè)國(guó)家的靈魂,而誠(chéng)信則是創(chuàng)新的基石,科研誠(chéng)信是我國(guó)實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略、實(shí)現(xiàn)世界科技強(qiáng)國(guó)目標(biāo)的重要基礎(chǔ)。近年來,我國(guó)科研誠(chéng)信建設(shè)在工作機(jī)制、制度規(guī)范、教育引導(dǎo)、監(jiān)督懲戒等方面取得了顯著成效,但整體上仍存在“短板”和薄弱環(huán)節(jié),違背科研誠(chéng)信要求的行為時(shí)有發(fā)生。因此,需要通過科研誠(chéng)信案例庫(kù)的建設(shè),實(shí)現(xiàn)科研誠(chéng)信信息的全面共享和有效利用。
本文通過對(duì)科研誠(chéng)信案例進(jìn)行領(lǐng)域界定、案例描述、屬性定義等工作,實(shí)現(xiàn)了科研誠(chéng)信案例公共屬性的提取與歸類,構(gòu)建了科研誠(chéng)信案例的本體表達(dá)模型,并以此為基礎(chǔ),提出了科研誠(chéng)信案例庫(kù)的建設(shè)架構(gòu)。案例庫(kù)以科研誠(chéng)信案例本體為核心,按照物理層、數(shù)據(jù)層、業(yè)務(wù)層、用戶層四個(gè)層次建設(shè),實(shí)現(xiàn)了科研誠(chéng)信案例的規(guī)范化存儲(chǔ)、檢索、評(píng)價(jià)等功能,并能夠?yàn)榭蒲姓\(chéng)信事件的決策提供咨詢與建議。
本文主要提出了基于科研誠(chéng)信案例本體的科研誠(chéng)信案例庫(kù)建設(shè)思路與框架,并實(shí)現(xiàn)了案例庫(kù)的部分基礎(chǔ)功能,未涉及案例本體及推理編程實(shí)現(xiàn),未來的研究將從這些方面展開。
南京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2022年3期