靳健,楊海慈,李凝,耿騫
(1.北京師范大學政府管理學院,北京 100875;2.中央財經(jīng)大學外國語學院,北京 100081)
基于主題契合度的專家推薦模型研究*
靳健1,楊海慈1,李凝2,耿騫1
(1.北京師范大學政府管理學院,北京 100875;2.中央財經(jīng)大學外國語學院,北京 100081)
評審專家遴選是會議、期刊等投稿論文評審的一項重要步驟。本研究首先依據(jù)主題在學科中出現(xiàn)頻率,分析待評審論文及候選專家論文的主題重要性;其次,綜合考慮主題重要性,構(gòu)造整數(shù)優(yōu)化模型以高效地為多篇待審文稿推薦評審專家,并加入專家專長與投稿論文的匹配度、評審專家權(quán)威性、評審專家工作量分配等因素以滿足專家推薦的現(xiàn)實需求;最后,從平均覆蓋率、人均審核率和重要性匹配度三個角度對本模型的有效性進行驗證。結(jié)果表明,提出的優(yōu)化模型可以較好地完成專家推薦任務(wù)。
評審專家推薦;主題契合度;整數(shù)優(yōu)化
投稿論文的評審是學術(shù)會議、學術(shù)期刊組織者的一項重要工作。論文評審組通常需先對投稿論文進行分類,其次邀請合適學者擔任評委完成論文評審。在此過程中,如何高效、準確地遴選出合適的評審專家成為一個值得討論的問題。
評審專家的遴選標準包括專家權(quán)威度[1-2]、專家知識結(jié)構(gòu)與待評審論文主題的匹配程度[3-4]、專家學術(shù)關(guān)系網(wǎng)絡(luò)等[5-6]。針對專家權(quán)威度,部分研究應(yīng)用現(xiàn)有評價指標(如H指數(shù)等),部分研究綜合多方面因素提出新的評價指標[2]。在主題提取方面,有的研究利用主題模型分析論文主題與專家知識結(jié)構(gòu)的相關(guān)性[7],有的研究利用模糊語義分析專家主題[8],也有部分研究利用社會網(wǎng)絡(luò)模型等實現(xiàn)專家推薦[9-10]。
但是,在以主題表示論文或?qū)<抑R結(jié)構(gòu)的相關(guān)研究中,較少考慮不同學科背景下的主題重要性差別。例如,在特定學科內(nèi),部分主題較基礎(chǔ)但研究者較多;相反,在同學科中,可能還存在部分主題關(guān)注度較低的情況。假設(shè)某一待評審論文重點探討了這種關(guān)注度相對較低的主題,為保證評審質(zhì)量,對于該待評審論文,應(yīng)盡可能推薦對該主題相對較了解的評審專家。為此,本研究將首先分析主題在學科中的出現(xiàn)頻率,從而形成一種考慮“非均勻主題”的評審專家推薦優(yōu)化模型。
本研究提出的方法將可應(yīng)用于有關(guān)學術(shù)論文和學術(shù)項目審批的專家推薦場景。本研究的創(chuàng)新點在于:結(jié)合主題在學科背景中的出現(xiàn)頻率,對不同主題的重要性做出標識,使主題向量更好地表達待評審論文特征,進而優(yōu)化評審專家推薦效果。
2.1 專家發(fā)現(xiàn)與專家推薦
專家發(fā)現(xiàn)問題最早出現(xiàn)在問答平臺及社交媒體的相關(guān)研究中。與專家推薦相類似,專家發(fā)現(xiàn)主要考慮如何利用專家的活動來定義和選擇專家。例如,Hwang等假設(shè)專家發(fā)現(xiàn)的目的是幫助用戶跟隨專家的選擇[11],因此,將專家定義為對某一類別產(chǎn)品給出較多評論的用戶;Zhou等對基于鏈接分析專家的方法提出質(zhì)疑,并根據(jù)用戶在某一主題上的專業(yè)性和聲譽來評定專家[12];Wang等提出僅在小圈子活動的專家可能地位虛高,并從內(nèi)容和社區(qū)地位角度考慮專家的衡量標準[13];梁凱春等對專家和知識設(shè)定不同級別的中心度和權(quán)威度,并假設(shè)專家的中心級別由其推薦內(nèi)容的權(quán)威度決定,而知識的權(quán)威度由推薦人的中心度決定[14]。還有許多不同的方法對專家發(fā)現(xiàn)問題做出分析,并利用主題模型對其展開分析,如Daud等分析潛在狄利克雷分配(Latent Dirichlet Allocation)、時間-作者-主題(Temporal-Author-Topic)等模型間的差異,并提出一種考慮時間因素的時間-專家-主題模型(Temporal-Expert-Topic)[7]。
社交問答平臺中的專家發(fā)現(xiàn)與評審中的專家推薦在問題定義、模型算法等方面存在很多相似之處。例如,社交平臺中用戶的提問可以類比評審環(huán)境中的待審論文;網(wǎng)站評論、轉(zhuǎn)發(fā)類比論文中的引用關(guān)系;用戶發(fā)帖量類比學者發(fā)文量。同時,這兩種方式中的研究問題各有其特殊性。例如,社交網(wǎng)絡(luò)環(huán)境中的專家發(fā)現(xiàn)還需要考慮論壇話題、用戶與專家的互動,而在評審環(huán)境中則需要考慮期刊、評審歷史等因素。
在評審專家推薦方面,不少研究主要依據(jù)專家權(quán)威度、待評審論文主題、專家社會關(guān)系等指標。Sun等關(guān)注專家權(quán)威度、出版業(yè)績、項目績效、歷史評價績效和同行評審等方面[8],其研究中的專業(yè)水平和歷史績效通過專家自行填寫表格確定,因而該推薦結(jié)果在一定程度上可能會受主觀因素的影響;Li等利用某一領(lǐng)域的引用關(guān)系計算待審論文和審稿人的相似性[15],通過論文數(shù)量、論文質(zhì)量和時間變量描述專家的權(quán)威度;Han等分析專家論文的發(fā)表歷史、與待評審論文的主題匹配度、專家與投稿者的社會關(guān)系、專家權(quán)威度四個因素,并從準確率和召回率評價實驗結(jié)果[16];Sun等通過論文與專家的相關(guān)性、專家發(fā)文質(zhì)量以及社區(qū)連通性等多個因素實現(xiàn)專家推薦,并借助MapReduce提高運行效率[6];Yukawa等利用余弦相似度描述作者間、作者與論文以及論文間的關(guān)系[17]。也有研究融合多種不同指標并賦予相應(yīng)權(quán)重,以計算專家得分,最終根據(jù)得分排名實現(xiàn)評審專家的推薦。例如,Zheng等提取關(guān)于專家和文檔的多組特征,并利用基于排序?qū)W習的算法推薦評審專家[2];Han等通過單獨評價各指標的準確率和召回率,并根據(jù)各指標的表現(xiàn)來確定權(quán)重[16]。有的研究使用層次分析法確定各指標權(quán)重[6,8,15],但該方法需人工參與,結(jié)果易受主觀因素影響。為克服上述方法存在的弊端,還有研究通過圖論和網(wǎng)絡(luò)模型法均衡各指標權(quán)重,以期實現(xiàn)專家推薦效果最優(yōu)化[1,18,19]。
專家發(fā)現(xiàn)與專家推薦的相關(guān)研究重點分析了專家權(quán)威度、待評審論文與專家論文間的匹配等多個因素,并將評審專家推薦理解為一種檢索問題,而相對較少考慮評審活動的實際現(xiàn)狀,即通常需要對多篇而非單篇論文作出推薦專家等。因此,本研究將綜合考慮多方面因素,并對多篇論文的專家組推薦展開研究。
2.2 評審分配問題
評審分配問題大多考慮多篇論文需邀請多名專家評審等實際問題,并分析許多較實際的限制條件。Xu等強調(diào)評審分配中論文數(shù)量的重要性[3,20],即為每位評審專家分配合適數(shù)量的論文,以保證審稿質(zhì)量;Fan等運用知識規(guī)則最大限度地分析論文的分組問題,以使論文分組的組間相似性較小而組內(nèi)相似度較大[4];Wang等將評審分配問題定義為“組對組”的任務(wù)分配[21],即在優(yōu)化分配前對專家和論文分組,以控制待評審論文的評審者數(shù)量,減少評審者負擔。
整合待評審論文與評審專家的約束條件挑戰(zhàn)。Karimzadehgan等將專家與待評審論文的匹配問題構(gòu)建為一個整數(shù)優(yōu)化模型[22-23],首先利用主題模型分析專家與待評審論文的相關(guān)性,并將被分配論文量、專家興趣、待評審論文主題以及專家主題匹配度等因素納入優(yōu)化模型中;在此基礎(chǔ)上,Wang等將模型進一步擴展為具有多個自變量的優(yōu)化模型[21],以實現(xiàn)專家推薦;Tang等利用優(yōu)化模型實現(xiàn)專家分配,并將結(jié)果應(yīng)用于學生選擇導師等情境[24];還有研究將作者和待評審論文抽象為網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點,利用隨機游走模型實現(xiàn)待評審論文的最優(yōu)化分配[9]。
以上評審分配問題的相關(guān)研究將評審專家的推薦理解為一種任務(wù)分配題,綜合考慮論文評審活動中多個實際因素(如專家工作量、待評審論文的最少評審專家數(shù)量、專家組主題多樣性及專家組主題對評審論文主題的覆蓋等),最終建立優(yōu)化模型為多篇論文推薦合適專家。但相關(guān)研究相對較少地考慮同一學科中不同主題重要性對專家組推薦的影響。
3.1 問題定義
3.2 建模過程
3.2.1 整體思路
在模型構(gòu)建中,本研究以專家已發(fā)表論文為基礎(chǔ)數(shù)據(jù),對待評審論文的主題重要性作出分析,并通過以下4個步驟實現(xiàn)專家組的推薦,具體流程如圖1所示。
表1 符號定義
圖1 專家推薦過程
(1)專家論文主題分析:獲取候選專家已發(fā)表論文,分析這些論文的主題分布。(2)待評審論文及學科論文主題分析:以候選專家?guī)熘袑<野l(fā)表的論文主題分布為依據(jù),分析待評審論文的主題及學科整體環(huán)境中的主題分布。(3)突出主題分析:以待評審論文的主題分布及學科整體環(huán)境中的主題分布為依據(jù),分析各主題在待評審論文中是否為突出主題。(4)專家分配與推薦:在推薦評審專家時,既要保證同一位專家不能分配過多論文,也要保證每篇論文的審稿專家數(shù)量。本文將據(jù)此分別建立優(yōu)化框架,融合主題重要性,得到專家推薦列表。
3.2.2 主題提取
(1)文檔主題生成模型簡介。本研究擬用文檔主題生成模型(Latent Dirichlet Allocation,LDA)模型提取分析專家發(fā)表論文及待評審論文的主題分布。LDA是一種層次貝葉斯模型[25]。模型假設(shè)一篇文檔是由一系列多項式分布的主題表示,而主題由一系列多項式分布的單詞來表示。
在LDA模型中,存在兩個先驗假設(shè),一種是文檔對主題的先驗假設(shè)θd~Dir(?|α),另一種是主題對單詞的先驗假設(shè)Dir(?|β)。由于存在后驗概率無法直接求解的問題,因此主題模型一般采用近似求解的方式求得參數(shù)。如Blei等采用基于變分貝葉斯的方式[25],Griffiths等采用基于吉布斯采樣的方式[26],Minka利用基于期望推進等方式獲取LDA模型的參數(shù)[27]。一般來說,吉布斯采樣由于簡單直觀且效果較好,因此成為一種較常用的參數(shù)求解方式。
(2)主題提取過程。評審專家推薦首先要保證所推薦的專家熟悉待評審論文的研究領(lǐng)域。本研究假設(shè)待評審論文內(nèi)容的最小單元是“主題”,且論文內(nèi)容可用主題向量表示。為實現(xiàn)待評審論文內(nèi)容與專家研究方向的匹配,本研究從待評審論文及專家論文集D中提取主題。
假設(shè)專家ri的全部論文可以拼接成一篇文檔di,以分析專家ri的研究領(lǐng)域。其中,θdi為di中h個主題的概率分布。m位審稿專家的論文形成集合D={d1,d2,…,dm}。本研究利用LDA模型估計集合D的主題概率分布。根據(jù)LDA模型思想,集合D的似然估計可表示為公式(1)。
其中,α和β為LDA的先驗參數(shù),c(w,di)是論文di中詞語w的數(shù)量,p(w│z,β)是主題z生成詞語w的概率,p(z│di,θdi)是論文di包含主題z的概率。本研究利用吉布斯采樣算法估計論文di的主題分布,并輸出h個主題在di中的分布。
以所有候選評審專家的論文集合作為樣本,LDA模型可幫助獲得h個主題及這些主題在集合D中的概率分布C。隨后,以待評審論文作為測試集,分析h個主題在待評審論文中的分布B及在學科整體環(huán)境中的分布Ft。其中,“學科整體環(huán)境”由學術(shù)數(shù)據(jù)庫中與該學科相關(guān)論文模擬。
3.2.3 主題重要性建模
在某一特定學科范圍內(nèi),出現(xiàn)頻率較高的主題可能是較熱門或較基礎(chǔ)的內(nèi)容。對于待評審論文來說,若某一主題在學科中出現(xiàn)頻率低,但在該論文中出現(xiàn)頻率較高,則說明該主題與待評審論文關(guān)系密切,且可能在論文中較重要。因此,為保證待評審論文的評審質(zhì)量,需要為“小眾主題”安排更專業(yè)的評審專家。
在一般情況下,若兩個主題在待評審論文i中出現(xiàn)概率相同,則在學科范圍內(nèi),出現(xiàn)概率相對較小者標識該論文的能力較強。根據(jù)該假設(shè),在學科中出現(xiàn)頻率較高的主題應(yīng)賦予較小權(quán)重,反之賦予較大的權(quán)重。結(jié)合主題提取的結(jié)果,利用TFIDF思想,待評審論文i與主題j的相關(guān)性可定義為公式(2)。
同時,對于某特定待評審論文或?qū)<艺撐?,根?jù)論文與主題的相關(guān)性矩陣,利用聚類算法分析h個主題與論文的相關(guān)度s。然后,選取s值最低的一類主題為待評審論文中的“不突出主題”,其他主題為“突出主題”。
3.3 評審專家推薦的優(yōu)化模型
評審專家的推薦應(yīng)包括限制條件為:每一篇待評審論文有p位專家參與評審,每一位專家評審的論文數(shù)量不超過q,專家與待評審論文重要主題的相關(guān)性強,專家應(yīng)盡可能多地覆蓋待評審論文的各主題,專家在待評審論文重要主題的覆蓋度應(yīng)高于次重要主題。
實驗需要兩部分數(shù)據(jù):一是包括專家個人信息、發(fā)文全文等的專家?guī)鞌?shù)據(jù),二是待審論文集。由于受現(xiàn)實條件限制,本研究采用中文學術(shù)論文數(shù)據(jù)庫中的采樣數(shù)據(jù)完成模型實驗。
4.1 數(shù)據(jù)集
本研究的實驗數(shù)據(jù)來自萬方數(shù)據(jù)庫。數(shù)據(jù)對象為信息管理與信息系統(tǒng)領(lǐng)域下的5 226名學者及其75 880篇論文。學者信息包括姓名、單位、發(fā)文、被引、H指數(shù)、發(fā)表期刊、學科、關(guān)注熱點等,論文信息包括題名、發(fā)表時間、被引頻次、發(fā)文期刊、摘要和關(guān)鍵詞等。信息管理與信息系統(tǒng)領(lǐng)域下的分支較多,涉及內(nèi)容廣泛,包括經(jīng)濟學、哲學、教育學、醫(yī)學、水利工程學等眾多學科。在現(xiàn)實中,期刊和會議通常有較明確的學科范圍。因此,依據(jù)萬方數(shù)據(jù)庫的學科標簽,本研究選擇經(jīng)濟學類目下的相關(guān)論文,構(gòu)建數(shù)據(jù)集A(100篇論文,200名專家)和數(shù)據(jù)集B(300篇論文,400名專家)。
4.2 實驗結(jié)果
本研究借助JAVA庫中的JGibbLDA工具實現(xiàn)專家主題的遴選。JGibbLDA工具適用于在JAVA環(huán)境中運用吉布斯采樣技術(shù)完成LDA主題模型中參數(shù)估計和預測問題。下文所展示的試驗示例中模型參數(shù)設(shè)置為:主題(ntopics)個數(shù)為10,吉布斯采樣迭代次(niters)為1 000,主題中最可能出現(xiàn)的詞語(twords)的返回個數(shù)為10,LDA模型中的參數(shù)和采用默認值,即取值為50/K(K為預測所得的主題數(shù)),取值為0.1。經(jīng)過該模型分析,獲得專家論文集中的10個主題,每個主題的概念可由返回的最有可能出現(xiàn)的詞語及其出現(xiàn)概率表示。表2展示了其中兩個主題及其特征詞語。
本研究通過數(shù)據(jù)集A和數(shù)據(jù)集B分析考慮主題重要性的優(yōu)化模型效果。其中,表3為設(shè)定每篇待評審論文需要有4名專家作出評審,每位專家的最大工作負荷為5,且論文主題個數(shù)為10時為某一篇待評審論文推薦專家的結(jié)果。表3中展示了待評審論文和評審專家與10個主題的相關(guān)性。其中,4名評審專家的突出主題基本覆蓋了待評審論文的所有突出主題。表4所示為推薦結(jié)果中專家評審負荷的人數(shù)分布。其中,每篇論文分配的專家數(shù)為p,且每位專家分配的論文數(shù)量不超過q。
表2 專家論文集預測所得主題示例
表3 主題相關(guān)性
表4 評審專家負荷量對比
4.3 實驗結(jié)果檢驗及評價
對于大部分機器學習問題,人工評判可能是模型評估較有效的方法。對于評審推薦問題,現(xiàn)有研究中人工評估模型可靠性的方法主要包括兩類:一是人工閱讀論文后匹配合適專家,并以此作為標準結(jié)果,計算推薦結(jié)果的召回率和準確率[22];二是請相關(guān)專家或用戶根據(jù)已有評價標準對算法推薦結(jié)果作出評估[8]。然而,人工選擇和認可的“最優(yōu)”結(jié)果受限于標記專家的能力和知識范圍。因此,人工標記的數(shù)據(jù)能否作為標準結(jié)果存在一定爭議。此外,召回率和準確率不能體現(xiàn)實驗結(jié)果中不同重要程度的主題差異。為此,本研究提出通過以下3種評價指標來定性評估和比較不同模型。
4.3.1 評價指標定義
平均覆蓋率(avc):專家擅長的主題占評審論文所有主題的比例。該指標可用來衡量模型推薦的評審組對該論文的總體評審能力,見公式(4)。
hA為該待評審論文被覆蓋的主題數(shù)量,h為論文主題總數(shù)。如果一篇待評審論文的“突出主題”包含在所有評審專家的“突出主題”中,則認為該主題已被覆蓋。
人均審核率(avn):一篇文章中,平均每個主題被覆蓋的頻次占評審組總?cè)藬?shù)的比例。該指標從主題角度評估論文被審核的效果。理想結(jié)果為待評審論文重要主題的人均審核率高,甚至接近1。這意味待評審論文的所有評審專家在重要主題上都具有評審能力,見公式(5)。
nA'為某一待評審論文中所有主題被覆蓋的總頻次,n為待評審論文的總數(shù),h為論文主題數(shù)量,p為每篇待評審論文的評審組人數(shù)。
重要性匹配度(cors):評審專家在各主題上的專業(yè)水平與待評審論文主題重要性的斯皮爾曼相關(guān)系數(shù)。該指標用于衡量待評審論文中較重要的主題是否得到優(yōu)先分配,見公式(6)和(7)。
rs為待評審論文與評審專家關(guān)于主題分布的斯皮爾曼相關(guān)系數(shù),d為待評審論文和評審專家的主題向量秩次差。cors值高則說明待評審論文的重要主題相對于次重要主題可分配到更多資源。
4.3.2 對比算法
本研究選取未考慮主題重要性差別的均勻主題優(yōu)化模型和考慮主題重要性差別的非均勻主題貪心算法作為對比模型,檢驗不同模型針對同一數(shù)據(jù)集的推薦效果。均勻主題模型采用優(yōu)化算法實現(xiàn)專家和待評審論文的匹配,但不區(qū)分同一待評審論文中不同主題的重要性。而貪心算法推薦模型利用貪心算法的原理完成專家推薦。貪心算法具體步驟如下。
(2)依據(jù)非均勻主題模型的計算主題重要性并形成新的專家及待評審論文主題分布矩陣
(3)建立循環(huán),計算第i(i∈[1,n])篇待評審論文與全部m位候選專家的相關(guān)度;
(4)將m位專家按與第i篇待評審論文的相關(guān)度排序,為每篇待評審論文選擇出相關(guān)度最高的前p個專家,同時將被選擇的專家的負擔值加1;
(5)每完成一篇待評審論文的專家分配后,檢驗專家集中所有專家的負擔值是否小于q,若小于q,則將此專家從專家集中去除;
(6)n次循環(huán)后完成m位專家對n篇待評審論文的分配。
4.3.3 實驗結(jié)果及分析
(1)非均勻主題模型與均勻主題模型的比較分析。圖2和圖3為當p=3,q=5時,數(shù)據(jù)集A的3種模型方式分配評審專家的實驗結(jié)果。由圖2和圖3可見,非均勻主題的兩個算法較均勻主題的算法在平均覆蓋率和人均審核率兩個指標上具有顯著優(yōu)勢。由此得出,經(jīng)過主題非均勻化處理的模型可以更好地完成評審專家對待評審論文的分配任務(wù)。
(2)模型中的變量對實驗結(jié)果的影響分析。主題提取過程中需要提前設(shè)定主題數(shù)量h。從圖2和圖3可見,兩種非均勻算法均在h=30時取得最佳結(jié)果,但主題數(shù)量的改變對實驗結(jié)果的影響不顯著。也有研究主題數(shù)量對實驗結(jié)果的影響,但結(jié)果表明表現(xiàn)最好的主題數(shù)量不盡相同。因此,本研究認為主題數(shù)量對模型結(jié)果的影響可能與數(shù)據(jù)集的選擇有關(guān)。
圖2 主題數(shù)量對平均覆蓋率的影響
圖3 主題數(shù)量對人均審核率的影響
如圖4和圖5分別展示了3種分配方式在數(shù)據(jù)集B中的實驗結(jié)果。當p=5,q=5時平均覆蓋率和人均審核率最高。這是因為評審專家數(shù)量增加可能影響評審質(zhì)量,此時每篇待評審論文中有更多主題被審核,并且每個主題接受的審核人次也需要相對增多。
(3)優(yōu)化算法與貪心算法的比較分析。圖2和圖3中非均勻主題的優(yōu)化算法與貪心算法在覆蓋率、審核率兩項指標上差距不大。其主要原因是數(shù)據(jù)集中專家人數(shù)相對于評審需求較充足。因此,即使貪心算法的每輪循環(huán)都“貪心”地選出當前最合適的專家,也不會對整體結(jié)果產(chǎn)生顯著影響。然而,從圖4和圖5可見,隨著待評審論文對評審專家人數(shù)需求的增加,當p=5,q=5時,優(yōu)化算法的優(yōu)勢得以凸顯。為突出各個算法的差異,在數(shù)據(jù)集B中增加一種分配方式p=2,q=2進行實驗。從圖4、圖5可見,在該條件中,兩種算法的差距進一步加大。這說明,當專家?guī)煲?guī)模有限時,優(yōu)化算法相較貪心算法更有利于實現(xiàn)資源的最優(yōu)配置。
圖4 分配方式對平均覆蓋率的影響
圖5 分配方式對人均審核率的影響
從圖6可見,兩種算法在重要性匹配度cors這一指標上的差距較大,且系數(shù)變化主要受數(shù)據(jù)集影響,而與分配方案關(guān)系不大。在數(shù)據(jù)集A中,優(yōu)化算法推薦出的專家主題向量與待評審論文主題向量的相關(guān)系數(shù)為0.40,而貪心算法的相關(guān)系數(shù)為0.12。此外,由于貪心算法在每次循環(huán)中直接選擇適合評審當前論文的最優(yōu)專家,因此論文的循環(huán)順序也會對推薦結(jié)果產(chǎn)生一定影響。這導致貪心算法存在較大不穩(wěn)定性,一定程度上限制了其廣泛應(yīng)用。
圖6 不同算法與數(shù)據(jù)集在重要性匹配度上的比較
本研究分析如何為多篇待審論文推薦評審專家的問題,并提出非均勻主題重要度的專家推薦優(yōu)化模型。該模型考慮不同學科環(huán)境下待評審論文的主題重要度差異,并在優(yōu)化模型中綜合考慮專家與待評審論文主題的相關(guān)程度、待評審論文的被評審人數(shù)、專家評審負荷等因素。最終,針對每篇待評審論文形成評審專家組。
通過與其他兩種模型推薦結(jié)果的比較,驗證本檢驗?zāi)P偷挠行浴=Y(jié)果發(fā)現(xiàn),經(jīng)過非均勻化處理的模型在覆蓋率和人均審核率上均有明顯優(yōu)勢。當專家資源較充足時,優(yōu)化算法與貪心算法差別不大;但隨著待審核論文專家數(shù)量增加,優(yōu)化算法的優(yōu)勢逐漸凸顯。在相關(guān)系數(shù)方面,優(yōu)化算法始終表現(xiàn)出較高相關(guān)性,而貪心算法表現(xiàn)較差。
鑒于模型存在的問題,后續(xù)研究可對數(shù)據(jù)集進行更精細設(shè)置。如結(jié)合學科現(xiàn)狀對網(wǎng)上抓取的學者信息進行人工篩選和過濾,形成高質(zhì)量專家集,更真實地模擬評審環(huán)境下的專家推薦,使模型推薦結(jié)果更易于評價。
[1] 韓曉,郭嘉豐,杜攀,等.一種面向權(quán)威度和多樣性的自動學術(shù)調(diào)研框架[J].計算機學報,2015(2):365-373.
[2] ZHENG H T, LI Q,JIANG Y,et al.Exploiting multiple features for learning to rank in expert finding[C]//9th International Conference on Advanced Data Mining and Applications,December 14-16,Hangzhou, [s.n],2013:219-230.
[3] SUN Y H,MA J,FAN Z P,et al.A hybrid knowledge and model approach for reviewer assignment[J].Expert Systems with Applications,2008,34(2): 817-824.
[4] FAN Z P,CHEN Y,MA J,et al.Decision support for proposal grouping:a hybrid approach using knowledge rule and genetic algorithm[J].Expert Systems with Applications,2009,36(2):1004-1013.
[5] 李春英,湯庸,陳國華,等.面向?qū)W術(shù)社區(qū)的專家推薦模型[J].智能系統(tǒng)學報,2012,7(4):365-369.
[6] SUN J,XU W,MAJ,etal.Leverage RAF to find domain experts on research social network services:a big data analytics methodology with MapReduce framework[J].International Journal of Production Economics, 2015,165:185-193.
[7] DAUD A,LI J,ZHOU L,et al.Temporal expert finding through generalized time topic modeling[J].Knowledge-Based Systems,2010,23(6):615-625.
[8] SUN Y H,MA J,FAN Z P,et al.A group decision support approach to evaluate experts for R&D project selection[J].IEEE Transactions on Engineering Management,2008,55(1):158-170.
[9] TANG J,JIN R,ZHANG J.A topic modeling approach and its integration into the random walk framework for academic search[C]//2008 Eighth International Conference on Data Mining,December 15-19,2008,Washington. New York:IEEE,2008:1055-1060.
[10] Yang C,Ma J,SILVA T,et al.A multilevel information mining approach for expert recommendation in online scientific communities[J].The Computer Journal,2015,58(9):1921-1936.
[11] HWANG W S,LEE H J,KIM S W,et al.Efficient recommendation methods using category experts for a large dataset[J].Information Fusion, 2016,28(C):75-82.
[12] ZHOU G,ZHAO J,HE T,et al.An empirical study of topic-sensitive probabilistic model for expert finding in question answer communities[J]. Knowledge-Based Systems,2014,66(9):136-145.
[13] WANG G A,JIAO J,ABRAHAMS A S,et al.ExpertRank:a topic-aware expert finding algorithm for online knowledge communities[J].Decision Support Systems,2013,54(3):1442-1451.
[14] 梁凱春,蔡淑琴,林森.基于分眾分類的專家推薦算法研究[J].武漢理工大學學報(信息與管理工程版),2007,29(4):87-90.
[15] LI X,WATANABE T.Automatic paper-to-reviewer assignment,based on the matching degree of the reviewers[J].Procedia Computer Science, 2013(22):633-642.
[16] HAN S G,JIANG J P,YUE Z,et al.Recommending program committee candidates for academic conferences[C]//Proceedings of the 2013 Workshop on Computational Scientometrics:Theory & Applications,October 28,2013,San Francisco.New York:ACM,2013:1-6.
[17] YUKAWA T,KASAHARA K,KATO T,et al.An expert recommendation system using concept-based relevance discernment[C]//Proceedings of the 13th International Conference on Tools with Artificial Intelligence,New York:IEEE,2001:257-264.
[18] LIU X,SUEL T,MEMON N.A robust model for paper reviewer assignment[C]//Proceedings of the 8th ACM Conference on Recommender Systems. New York:ACM,2014:25-32.
[19] 鞏軍,劉魯.基于個人知識地圖的專家推薦[J].管理學報,2011,8(9):1365-1371.
[20] XU Y H,MA J,SUN Y H,et al.A decision support approach for assigning reviewers to proposals[J].Expert Systems with Applications,2010, 37(10):6948-6956.
[21] WANG F,ZHOUS R,SHI N.Group-to-group reviewer assignment problem[J].Computers &Operations Research,2013,40(5):1351-1362.
[22] KARIMZADEHGAN M,ZHAI C X.Integer linear programming forconstrained multi-aspect committee review assignment[J].Information Processing & Management,2012,48(4):725-740.
[23] KARIMZADEHGAN M,ZHAI C X,BELFORD G.Multi-aspect expertise matching for review assignment[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management.New York: ACM,2008:1113-1122.
[24] TANG W,TANG J,LEI T,et al.On optimization of expertise matching with various constraints[J].Neurocomputing,2012,76(1):71-83.
[25] BLEI DM,NG A Y,JORDAN M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003(3):993-1022.
[26] GRIFFITHS T L,STEYVERS M.Finding scientific topics[J]. Proceedings of the National Academy of Sciences,2004,10(11):5228-5235.
[27] MINKA T P.Expectation propagation for approximate Bayesian inference[C]//Proceedings of the Seventeenth Conference on Uncertainty in Artificial Intelligence.[S.1.]:Morgan Kaufmann Publishers Inc.,2013(17):362-369.
楊海慈,女,1995年生,研究方向:學術(shù)數(shù)據(jù)挖掘。
李凝,女,1981年生,博士,講師,研究方向:文本分析、語用學。
耿騫,男,1965年生,博士,教授,研究方向:信息檢索、管理信息系統(tǒng)。
A Topic Relevance Aware Model for Reviewer Recommendation
JIN Jian1,YANG HaiCi1, LI Ning2, GENG Qian1
(1.School of Government, Beijing Normal University, Beijing 100875, China; 2.School of Foreign Studies, Central University of Finance and Economics, Beijing 100081, China)
Reviewer assignment is an important step in the phase of paper evaluation for conference organizers and journal editors. In this study, the importance of a topic is initially estimated by its occurrence frequency within a specific research area, which helps to express submissions and reviewers’ expertise. Next, in consideration of topic importance in submissions, an integer optimization model is formulated to recommend a reviewer group. Also, different practical constraints are reckoned in the optimization model, which includes the affinity between reviewers and submissions, reviewers’ expertise, the burden assignment of each reviewer, etc. To evaluate the effectiveness, the proposed approach is benchmarked with two baseline algorithms in terms of coverage, average number of reviewers, relevance between reviewers and topics, etc. Comparative experiment results show that the proposed approach is capable to recommend reviewers effectively.
Reviewer Assignment; Topic Relevance; Integer Optimization
TP301.6
10.3772/j.issn.1673-2286.2017.04.007
靳健,男,1982年生,博士,講師,研究方向:文本挖掘、學術(shù)數(shù)據(jù)挖掘、客戶關(guān)系管理,E-mail:jinjian.jay@bnu.edu.cn。
2017-03-30)
* 本研究得到教育部人文社會科學研究青年基金項目“面向論文評審專家推薦的興趣變化挖掘與回避機制生成的研究”(編號:16YJC870006)和ISTIC-EBSCO文獻大數(shù)據(jù)發(fā)現(xiàn)服務(wù)聯(lián)合實驗室基金項目“融合異構(gòu)科研數(shù)據(jù)的評審專家推薦研究”資助。