連麗艷 李楊 張靜 遼寧省科學(xué)技術(shù)情報(bào)研究所查新檢索科室,沈陽(yáng)110838
基于神經(jīng)網(wǎng)絡(luò)的查新報(bào)告質(zhì)量評(píng)價(jià)方法
連麗艷 李楊 張靜 遼寧省科學(xué)技術(shù)情報(bào)研究所查新檢索科室,沈陽(yáng)110838
針對(duì)科技查新報(bào)告質(zhì)量的評(píng)價(jià)易受多種因素影響的情況,提出了一種基于神經(jīng)網(wǎng)絡(luò)的查新報(bào)告質(zhì)量評(píng)價(jià)方法,避免了人為確定權(quán)重,減少了評(píng)價(jià)過程中的隨機(jī)性和評(píng)價(jià)人員主觀上的不確定性,使評(píng)價(jià)結(jié)果更公平、更有效、更客觀。
神經(jīng)網(wǎng)絡(luò);查新報(bào)告;質(zhì)量評(píng)價(jià)
科技查新是在科技文獻(xiàn)檢索和科技咨詢基礎(chǔ)上發(fā)展起來的一項(xiàng)新型的科技信息服務(wù)業(yè)務(wù)??萍疾樾率侵缚萍疾樾聶C(jī)構(gòu)根據(jù)查新委托人提供的需求查證其新穎性的科學(xué)技術(shù)內(nèi)容,利用各種文獻(xiàn)檢索手段和文獻(xiàn)分析方法,按照科技查新規(guī)范操作,從文獻(xiàn)的角度對(duì)所查證的科學(xué)技術(shù)內(nèi)容作出新穎性判斷,從而為科研課題的立項(xiàng)、科研成果的評(píng)判等提供科學(xué)依據(jù),為國(guó)民經(jīng)濟(jì)的發(fā)展提供快速、全面的文獻(xiàn)信息服[1]。查新報(bào)告是查新工作的主要體現(xiàn)形式,是查新質(zhì)量的重要反應(yīng)[2],是查新機(jī)構(gòu)以書面形式就查新事項(xiàng)及結(jié)論向查新委托人所做的正式陳述[3]。查新報(bào)告是否科學(xué)、客觀、公正、嚴(yán)密直接關(guān)聯(lián)著情報(bào)查新工作的質(zhì)量、科研立題和成果批準(zhǔn)問題,事關(guān)重大,必須嚴(yán)肅認(rèn)真對(duì)待。利用科學(xué)方法,現(xiàn)代化技術(shù)手段對(duì)查新報(bào)告質(zhì)量給出客觀真實(shí)的論證和評(píng)價(jià),是查新機(jī)構(gòu)生存和發(fā)展的重要保證。
查新報(bào)告質(zhì)量評(píng)估現(xiàn)在尚無統(tǒng)一標(biāo)準(zhǔn)和模式,這是一項(xiàng)“軟指標(biāo)”,較難用數(shù)字表示,報(bào)告質(zhì)量的優(yōu)劣又與諸多因素有關(guān),而且各因素影響的程度也不同,評(píng)價(jià)結(jié)果難以用恰當(dāng)?shù)臄?shù)學(xué)解析表達(dá)式來表示,屬于復(fù)雜的非線性分類問題,神經(jīng)網(wǎng)絡(luò)以其能夠充分逼近任意復(fù)雜的非線性關(guān)系,能夠?qū)W習(xí)與適應(yīng)嚴(yán)重不確定性系統(tǒng)的動(dòng)態(tài)特性;有高度的魯棒性和容錯(cuò)能力開辟了新的評(píng)價(jià)途徑,本文將BP網(wǎng)絡(luò)引入查新報(bào)告評(píng)價(jià)體系中,既克服了人為主觀因素對(duì)評(píng)價(jià)結(jié)果的直接影響,又建立了全面合理的綜合評(píng)價(jià)指標(biāo)體系。
BP (Back Propagation)神經(jīng)網(wǎng)絡(luò),即誤差反向傳播算法的學(xué)習(xí)過程,由信息的正向傳播和誤差的反向傳播兩個(gè)過程組成。輸入層各神經(jīng)元負(fù)責(zé)接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元,中間層是內(nèi)部信息處理層,負(fù)責(zé)信息變換,根據(jù)信息變化能力的需求,中間層可以設(shè)計(jì)為單隱層或者多隱層結(jié)構(gòu),最后一個(gè)隱層傳遞到輸出層各神經(jīng)元的信息,經(jīng)進(jìn)一步處理后,完成一次學(xué)習(xí)的正向傳播處理過程,由輸出層向外界輸出信息處理結(jié)果。當(dāng)實(shí)際輸出與期望輸出不符時(shí),進(jìn)入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層逐層反傳。周而復(fù)始的信息正向傳播和誤差反向傳播過程,是各層權(quán)值不斷調(diào)整的過程,也是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程,此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度,或者預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。BP包括輸入層(input)、隱含層和輸出層。其結(jié)構(gòu)如圖1所示:
圖1 BP網(wǎng)絡(luò)模型
(1)輸入層神經(jīng)元的個(gè)數(shù)的確定。影響查新質(zhì)量的主要有7項(xiàng)指標(biāo),因此取輸入層神經(jīng)員數(shù)n=7個(gè).
(2)輸出層神經(jīng)元個(gè)數(shù)的確定。評(píng)價(jià)結(jié)果作為網(wǎng)絡(luò)的輸出,因此取輸出層個(gè)數(shù)m=1.
(3)網(wǎng)絡(luò)隱含層數(shù)的確定??紤]到三層BP網(wǎng)絡(luò)已經(jīng)具有逼近任意非線性函數(shù)的能力,故本文選用一個(gè)3層的BP的網(wǎng)絡(luò)開始進(jìn)行訓(xùn)練。
(4)隱含層神經(jīng)元個(gè)數(shù)的確定,一般來說,隱層的神經(jīng)元越多,結(jié)果越精確,但是隱層的神經(jīng)元過多會(huì)大大的加大訓(xùn)練時(shí)間,同時(shí)隱層的神經(jīng)元的增加會(huì)造成網(wǎng)絡(luò)的容錯(cuò)能力下降,經(jīng)不同的試算,本文中隱含層取5個(gè)神經(jīng)元比較好。
(5)傳輸函數(shù)的確定。本文采用了s形函數(shù)來訓(xùn)練
(6)網(wǎng)絡(luò)精度設(shè)定為0.001。
查新報(bào)告是查新工作質(zhì)量的具體反映,是整個(gè)查新工作的綜述。本文將文獻(xiàn)檢索資源、查新人員的溝通能力、關(guān)鍵詞的確定、檢索策略的制定、相關(guān)文獻(xiàn)的篩選、對(duì)比分析描述、查新結(jié)論的表述總結(jié)能力等因素作為輸入指標(biāo),設(shè)計(jì)了基于神經(jīng)網(wǎng)絡(luò)的查新報(bào)告質(zhì)量評(píng)價(jià)方法。
首先以文獻(xiàn)檢索資源、查新人員的溝通能力、關(guān)鍵詞的確定、檢索策略的制定、相關(guān)文獻(xiàn)的篩選、對(duì)比分析描述、查新結(jié)論的表述總結(jié)能力等7個(gè)指標(biāo)作為網(wǎng)絡(luò)的輸入因子,以報(bào)告質(zhì)量作為輸出因子,選取一組數(shù)據(jù)作為訓(xùn)練樣本,得到系統(tǒng)的神經(jīng)網(wǎng)絡(luò)權(quán)值,再采用一組測(cè)試樣本數(shù)據(jù)對(duì)BP神經(jīng)網(wǎng)絡(luò)模型的精度和泛化能力進(jìn)行檢驗(yàn)(本文章的訓(xùn)練樣本和檢驗(yàn)樣本為查新審核員根據(jù)以上指標(biāo)進(jìn)行打分并通過歸一化來獲得),BP網(wǎng)絡(luò)輸出的評(píng)價(jià)值和實(shí)際評(píng)價(jià)值之間的誤差見表1,該網(wǎng)絡(luò)模型的輸出值與實(shí)際輸出值之間的誤差很小,能準(zhǔn)確地根據(jù)各評(píng)價(jià)指標(biāo)來描述報(bào)告質(zhì)量的好壞。
表1 BP網(wǎng)絡(luò)輸出的評(píng)價(jià)值和實(shí)際評(píng)價(jià)值之間的誤差
仿真結(jié)果表明將神經(jīng)網(wǎng)絡(luò)應(yīng)用于查新報(bào)告質(zhì)量的測(cè)評(píng)中,減少了評(píng)價(jià)過程中的隨機(jī)性和評(píng)價(jià)人員主觀上的不確定性,提高了評(píng)價(jià)的可靠性,使評(píng)價(jià)結(jié)果更有效、更客觀,使查新報(bào)告的考評(píng)更加科學(xué)合理化。
[1]李紅梅.科技查新對(duì)技術(shù)創(chuàng)新的促進(jìn)作用[J].現(xiàn)代情報(bào).2009.29(8).188-190
[2]曾召.科技查新報(bào)告質(zhì)量控制探析
[J].圖書館論壇.2009(2).109-111
[3]謝新洲,滕躍.科技查新手冊(cè)[M]北京:科學(xué)技術(shù)文獻(xiàn)出版社.2004.7
[4]馬景娣, 繆家鼎.關(guān)于查新報(bào)告質(zhì)量評(píng)定標(biāo)準(zhǔn)的探討[J].情報(bào)科學(xué) 2005.23(11).1681-1684
[5]何玉彬,李新忠.神經(jīng)網(wǎng)絡(luò)控制技術(shù)及其應(yīng)用[M]. 北京:科學(xué)出版社. 2003
A Quality Evaluation Method on Novelty Retrieval Reports Based on Neural Network
Lian Liyan Li Yang Zhang Jing Liaoning Institute of Science and Technology Information Shenyang 110838
In this paper, according to quality evaluation on Science and technology novelty retrieval is effected with a number of factors , a quality evaluation method on the reports based on neural network is proposed to avoid the human factor and reduce randomness of the evaluation process.
Neural Network; Novelty Retrieval Reports; Quality Evaluation
G35
A
10.3969/j.issn.1001-8972.2011.07.112
連麗艷 女 1978年4月16日 碩士 館員遼寧省科學(xué)技術(shù)情報(bào)研究所查新檢索中心。