□文/丁靖哲
(河南大學(xué)經(jīng)濟(jì)學(xué)院 河南·開封)
[提要]BP神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)功能利用樣本數(shù)據(jù)模擬復(fù)雜的函數(shù),適用于解決科研人才需求預(yù)測問題。本文搜集河南省有關(guān)數(shù)據(jù),利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建科研人才需求預(yù)測模型,并對模型的預(yù)測精度進(jìn)行評估,在科研人才需求預(yù)測結(jié)果基礎(chǔ)上,提出預(yù)測模型的改進(jìn)措施。
BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的傳統(tǒng)模型之一,Lapedees等首先采用非線性神經(jīng)網(wǎng)絡(luò)對時間序列數(shù)據(jù)進(jìn)行了訓(xùn)練并進(jìn)行預(yù)測,結(jié)果表明神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有更高的預(yù)測精度。
神經(jīng)網(wǎng)絡(luò)方法經(jīng)過多年發(fā)展已經(jīng)被學(xué)者們廣泛采納和使用。如何永貴、韓月娥等學(xué)者運(yùn)用神經(jīng)網(wǎng)絡(luò)方法預(yù)測企業(yè)人力資源需求,發(fā)現(xiàn)在企業(yè)人力資源需求領(lǐng)域,神經(jīng)網(wǎng)絡(luò)有其獨(dú)特優(yōu)勢。陳振斌、張萬紅和彭勃運(yùn)用神經(jīng)網(wǎng)絡(luò)模型對江蘇省技術(shù)人才進(jìn)行動態(tài)預(yù)測,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)在預(yù)測動態(tài)人才系統(tǒng)時的優(yōu)點(diǎn)。雷明佳、孫鈺涵等運(yùn)用BP人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測林業(yè)系統(tǒng)從業(yè)人員數(shù)量變化。文嵐和張娜結(jié)合廣西區(qū)域經(jīng)濟(jì)發(fā)展特點(diǎn)應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測廣西科技人才需求量,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)可以對廣西科技人才需求量實(shí)現(xiàn)較好的非線性擬合,并進(jìn)行自學(xué)習(xí)自適應(yīng)。何文章、咸桂彩、陳珂運(yùn)用BP神經(jīng)網(wǎng)絡(luò)預(yù)測了高技能人才數(shù)量隨時間變化的規(guī)律。
既有研究表明,利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的人才需求預(yù)測模型與其他研究方法相比具有一定優(yōu)勢,但仍需不斷完善。鑒于此,本文根據(jù)BP神經(jīng)網(wǎng)絡(luò)相關(guān)理論,選擇相關(guān)指標(biāo),并采用河南省2010~2020年相關(guān)數(shù)據(jù),構(gòu)建了科研人才預(yù)測模型,并采用相關(guān)指標(biāo)對模型進(jìn)行評價,為科學(xué)開展科研人才需求預(yù)測工作提供方法依據(jù)。
BP神經(jīng)網(wǎng)絡(luò)的基本理論是:學(xué)習(xí)過程通過正向傳播信號和反向傳播兩個過程組成。正向傳播時,把樣本的特征從輸入層進(jìn)行輸入,信號經(jīng)過各個隱藏層的處理后,最后從輸出層傳出。對于網(wǎng)絡(luò)的實(shí)際輸出與期望輸出之間的誤差,把誤差信號從最后一層逐層反傳,從而獲得各個層的誤差學(xué)習(xí)信號,然后再根據(jù)誤差學(xué)習(xí)信號來修正各層神經(jīng)元的權(quán)值。BP神經(jīng)網(wǎng)絡(luò)預(yù)測法的優(yōu)勢是對變量間的非線性現(xiàn)象的完美解釋和隨意調(diào)整模型結(jié)構(gòu)。此外,模型結(jié)構(gòu)之間的差異,致使預(yù)測性能也有所不同,在研究多元變量間的預(yù)測領(lǐng)域發(fā)揮獨(dú)特作用。因此,基于BP神經(jīng)網(wǎng)絡(luò)理論,利用Python軟件對科研人才需求進(jìn)行預(yù)測,有助于科學(xué)合理地發(fā)現(xiàn)科研人才需求規(guī)律。
(一)指標(biāo)篩選。指標(biāo)體系的建立是對問題進(jìn)行研究的前提和基礎(chǔ),科研人才需求預(yù)測的難點(diǎn)在于如何選擇高質(zhì)量指標(biāo),這就要求所選取的指標(biāo)能夠解釋影響人才需求的因素。
科研人才的數(shù)量取決于科技的發(fā)展環(huán)境,而科技的發(fā)展環(huán)境包含的要素較多,目前普遍的觀點(diǎn)是影響科技人才的主要因素包括經(jīng)濟(jì)發(fā)展水平、科技教育和居民素質(zhì)狀況、人才工作環(huán)境狀況等。由于科研人才需求預(yù)測容易受到區(qū)域經(jīng)濟(jì)以及政策的影響,與其密切相關(guān)的指標(biāo)具有時序性、復(fù)雜性的特點(diǎn),所以很難建立包羅萬象的指標(biāo)體系,因此必須在此基礎(chǔ)上優(yōu)化選擇,從實(shí)際出發(fā)選出具有代表性和可操作性的指標(biāo),構(gòu)建影響科研人才需求的指標(biāo)體系。
(二)具體指標(biāo)。影響科研人才需求預(yù)測的因素是復(fù)雜多樣的,在選擇科研人才需求預(yù)測的指標(biāo)時,應(yīng)該綜合衡量經(jīng)濟(jì)、社會、科技和教育等其他因素對科技人才需求可能產(chǎn)生的影響。
1、經(jīng)濟(jì)發(fā)展水平指標(biāo)。該類指標(biāo)應(yīng)體現(xiàn)區(qū)域經(jīng)濟(jì)發(fā)展?fàn)顩r,應(yīng)包括區(qū)域生產(chǎn)總值、人均可支配收入、財(cái)政收支、固定資產(chǎn)投資、經(jīng)濟(jì)增長率等指標(biāo)。經(jīng)濟(jì)越發(fā)達(dá)的地區(qū),對科研人才的需求量也越大。
2、社會發(fā)展水平指標(biāo)。該類指標(biāo)應(yīng)考慮就業(yè)人員行業(yè)和就業(yè)者文化水平,應(yīng)包括就業(yè)人數(shù)、高校學(xué)生數(shù)、第三產(chǎn)業(yè)從業(yè)比例等因素。社會生活環(huán)境同樣影響科研人才需求。當(dāng)社會生活環(huán)境優(yōu)化時,地區(qū)對科研人才吸引力提高。因此,在進(jìn)行科研人才需求預(yù)測時,需要充分考慮社會生活環(huán)境對科研人才的需求影響狀況。
3、科技和教育指標(biāo)。科技創(chuàng)新資源尤其是高新技術(shù)產(chǎn)業(yè)具有強(qiáng)大的拉動力量,有利于城市科技創(chuàng)新步伐,對于提高區(qū)域科研人才需求數(shù)量也有一定的促進(jìn)作用。教育文化環(huán)境體現(xiàn)了地區(qū)教育水平、人才受教育程度和教育投入產(chǎn)出狀況。高等學(xué)校規(guī)模與硬件設(shè)施、研究機(jī)構(gòu)數(shù)量等因素同樣對科研人才的需求存在影響。
基于上述分析,結(jié)合現(xiàn)有文獻(xiàn)所構(gòu)建的指標(biāo)體系,本文構(gòu)建了科研人才需求預(yù)測指標(biāo)體系,如表1所示。為保證指標(biāo)的合理性并確保模型預(yù)測精度,在科研人才需求預(yù)測指標(biāo)的篩選中,本文運(yùn)用多元統(tǒng)計(jì)分析法對上述指標(biāo)進(jìn)行分析。使用河南省面板數(shù)據(jù),運(yùn)用SPSS軟件對上述指標(biāo)進(jìn)行分析,再選取與科研人才需求最相關(guān)的指標(biāo)。分析顯示,相關(guān)系數(shù)最高的指標(biāo)為人均區(qū)域生產(chǎn)總值、勞動生產(chǎn)率、區(qū)域生產(chǎn)總值、固定資產(chǎn)投資、人均可支配收入、財(cái)政收入、財(cái)政支出、科研經(jīng)費(fèi)支出、專利申請數(shù)、專利授權(quán)數(shù)、高等學(xué)校平均在校生、高等學(xué)校平均畢業(yè)生、高等學(xué)校專任教師數(shù)、教育支出、科學(xué)技術(shù)支出、科研機(jī)構(gòu)數(shù)量,其相關(guān)系數(shù)分別為:0.94、0.94、0.95、0.93、0.95、0.95、0.95、0.94、0.92、0.9、0.93、0.92、0.95、0.96、0.92、0.83。上述指標(biāo)的相關(guān)系數(shù)均在0.9上下浮動,表明這些指標(biāo)對科研人才需求數(shù)量的影響比較大。因此,本文認(rèn)為影響科研人才需求預(yù)測的主要指標(biāo)為財(cái)政收支、區(qū)域生產(chǎn)總值、人均地區(qū)生產(chǎn)總值、勞動生產(chǎn)率、固定資產(chǎn)投資等16項(xiàng)指標(biāo)。(表1)
(三)模型構(gòu)建。BP神經(jīng)網(wǎng)絡(luò)是最傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),當(dāng)面對大量數(shù)據(jù)時,BP神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)數(shù)據(jù)集中的模式和關(guān)系,自動發(fā)現(xiàn)其中的規(guī)律并進(jìn)行分類、回歸等任務(wù)。BP神經(jīng)網(wǎng)絡(luò)具有可以處理高維數(shù)據(jù)、自適應(yīng)性強(qiáng)、學(xué)習(xí)能力強(qiáng)、并行計(jì)算能力強(qiáng)等優(yōu)點(diǎn),從而可以刻畫出高精度模型?;贐P神經(jīng)網(wǎng)絡(luò)的科研人才預(yù)測模型構(gòu)建的主要任務(wù)是處理樣本數(shù)據(jù)、設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu),并對網(wǎng)絡(luò)進(jìn)行訓(xùn)練與檢驗(yàn)。
1、數(shù)據(jù)樣本的選擇處理。首先,需要選擇具有代表性的數(shù)據(jù),從而使BP神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)的過程中可以處理表現(xiàn)內(nèi)部關(guān)系的數(shù)據(jù),進(jìn)而通過算法發(fā)現(xiàn)數(shù)據(jù)之間的模式關(guān)系。其次,大樣本數(shù)據(jù)可以使模型預(yù)測結(jié)果精度更高。最后,將樣本數(shù)據(jù)歸一化,將數(shù)據(jù)映射在[-1,1]的區(qū)間內(nèi),便于不同單位或量級的指標(biāo)能夠進(jìn)行比較和加權(quán)。使用的公式為:X=(x-xmin)/(xmax-xmin)。其中,X代表歸一化處理后的網(wǎng)絡(luò)數(shù)據(jù),x代表歸一化處理前的原始數(shù)據(jù),xmax與xmin分別代表原始數(shù)據(jù)中的最大值與最小值。經(jīng)過歸一化后,將有量綱的數(shù)據(jù)變成無量綱數(shù)據(jù),還可以達(dá)到簡化計(jì)算的作用。
2、網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)。網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)分為確定網(wǎng)絡(luò)層數(shù)和設(shè)置神經(jīng)元數(shù)量兩項(xiàng)任務(wù)。網(wǎng)絡(luò)層數(shù)和設(shè)置神經(jīng)元數(shù)量的確定需要重復(fù)多次試驗(yàn),根據(jù)實(shí)驗(yàn)的結(jié)果來確定最佳數(shù)量。
(1)確定網(wǎng)絡(luò)層數(shù)。BP神經(jīng)網(wǎng)絡(luò)模型的隱藏層可以選擇一層或者多層,二者的差異主要體現(xiàn)在隱藏層層數(shù)的數(shù)量不同。對于簡單的小數(shù)據(jù)集,通常使用一層或兩層隱藏層。但對于與時間序列相關(guān)的龐大數(shù)據(jù)集,則需要更多的層數(shù)。層數(shù)越多,擬合數(shù)據(jù)的能力更強(qiáng),可以有效降低模型的輸出誤差,效果按理說會更好,但是實(shí)際上更多的層數(shù)可能會引起模型過擬合,同時也會導(dǎo)致訓(xùn)練次數(shù)增加,訓(xùn)練成本過高,模型難以收斂,從而造成BP神經(jīng)網(wǎng)絡(luò)模型難以適應(yīng)新數(shù)據(jù)。因此,在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)時,本文選擇只有一層隱藏層的三層BP神經(jīng)網(wǎng)絡(luò)模型,此種神經(jīng)網(wǎng)絡(luò)模型在處理小規(guī)模時間序列數(shù)據(jù)時性能優(yōu)異,且訓(xùn)練成本較低,速度較快。
(2)設(shè)置神經(jīng)元數(shù)量。輸入層的神經(jīng)元數(shù)量等于待處理數(shù)據(jù)中輸入變量的數(shù)量,輸出層的神經(jīng)元的數(shù)量等于與每個輸入關(guān)聯(lián)的輸出的數(shù)量。隱藏層神經(jīng)元數(shù)量會影響模型學(xué)習(xí)能力。神經(jīng)元數(shù)量過少將導(dǎo)致模型難以從數(shù)據(jù)中提取有效信息,引起欠擬合。當(dāng)神經(jīng)元數(shù)量過多時,需要更大的訓(xùn)練集來確定連接權(quán)值,并且會增加訓(xùn)練成本,減弱容錯性能,導(dǎo)致預(yù)測結(jié)果偏差過大。因此,需要確定合適的隱藏層神經(jīng)元數(shù)量。隱藏層神經(jīng)元個數(shù)的確定需要自己不斷試驗(yàn)。借鑒經(jīng)驗(yàn)公式i=計(jì)算出神經(jīng)元數(shù)量的大致數(shù)量。從一個較小神經(jīng)元數(shù)量開始不斷進(jìn)行網(wǎng)絡(luò)訓(xùn)練,最后選擇可以使網(wǎng)絡(luò)訓(xùn)練誤差達(dá)到最小的神經(jīng)元數(shù)量。
3、網(wǎng)絡(luò)訓(xùn)練與檢驗(yàn)。在網(wǎng)絡(luò)構(gòu)建完成后,接下來輸入樣本數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練與檢驗(yàn)。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),也就是訓(xùn)練過程,指的是輸入層神經(jīng)元接收輸入數(shù)據(jù),將信數(shù)據(jù)傳遞給中間層神經(jīng)元,最后傳遞到輸出層神經(jīng)元,由輸出層輸出數(shù)據(jù)處理結(jié)果的過程。在這個過程中,神經(jīng)網(wǎng)絡(luò)不斷修正網(wǎng)絡(luò)的權(quán)值和閾值,實(shí)現(xiàn)模型的學(xué)習(xí)和訓(xùn)練,當(dāng)網(wǎng)絡(luò)輸出的誤差減少到合理范圍內(nèi),或者完成學(xué)習(xí)次數(shù)后,就可以終止學(xué)習(xí)。在網(wǎng)絡(luò)模型訓(xùn)練中,使用學(xué)習(xí)率來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值。學(xué)習(xí)率直接影響我們的模型能夠以多快的速度達(dá)到最好的精度。一般來說,學(xué)習(xí)率越小,損失梯度下降的速度越慢,可以避免錯過任何局部最優(yōu)解,但也意味著我們要花更多時間來收斂。但是,如果太大,就會導(dǎo)致收斂不穩(wěn)定,始終難以達(dá)到最優(yōu)。通常先以較低的學(xué)習(xí)率開始訓(xùn)練模型,在后續(xù)訓(xùn)練過程中逐漸提高學(xué)習(xí)率,從而估計(jì)出最佳學(xué)習(xí)速率。
網(wǎng)絡(luò)檢驗(yàn)的目的是保證通過訓(xùn)練集數(shù)據(jù)訓(xùn)練出的網(wǎng)絡(luò)模型對測試集數(shù)據(jù)具有良好的泛化能力。通常將數(shù)據(jù)劃分為兩部分,將70%的數(shù)據(jù)作為訓(xùn)練集,剩余30%數(shù)據(jù)作為測試集。如果網(wǎng)絡(luò)模型在訓(xùn)練集正確度比較低,在測試集上測試正確度較低,說明網(wǎng)絡(luò)訓(xùn)練欠擬合,泛化能力良好;反之,則說明泛化能力較差。在網(wǎng)絡(luò)精度不斷提高的前提下,將測試集數(shù)據(jù)輸入到網(wǎng)絡(luò)模型,計(jì)算預(yù)測誤差,誤差越低則模型的擬合效果越好,預(yù)測精度越高。
4、程序?qū)崿F(xiàn)。這一步主要通過Python軟件實(shí)現(xiàn),運(yùn)用Python內(nèi)部自帶的神經(jīng)網(wǎng)絡(luò)工具箱對數(shù)據(jù)進(jìn)行仿真訓(xùn)練。主要使用Train函數(shù)和Sim函數(shù)。Train函數(shù)是一種用來建立模型的機(jī)器學(xué)習(xí)函數(shù),用于從原始數(shù)據(jù)中訓(xùn)練某種模型,從而得出一個最優(yōu)模型,使模型實(shí)現(xiàn)最小誤差的預(yù)測效果。Train函數(shù)用于訓(xùn)練創(chuàng)建好的網(wǎng)絡(luò),指導(dǎo)網(wǎng)絡(luò)連接權(quán)重的更新以及閾值的調(diào)整。Sim函數(shù)用于用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)預(yù)測函數(shù)輸出并修正完善BP神經(jīng)網(wǎng)絡(luò)。
本文基于BP神經(jīng)網(wǎng)絡(luò)基本思想構(gòu)建科研人才需求預(yù)測模型,選擇河南省數(shù)據(jù)作為樣本數(shù)據(jù),并檢驗(yàn)該模型在實(shí)際運(yùn)用時的有效性。
(一)樣本選擇和樣本數(shù)據(jù)來源
1、樣本選擇。本文選擇河南省區(qū)域數(shù)據(jù)作為樣本。河南省作為人口大省,面臨著經(jīng)濟(jì)轉(zhuǎn)型和經(jīng)濟(jì)結(jié)構(gòu)性調(diào)整的重要任務(wù)。在優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)、選擇新的經(jīng)濟(jì)增長點(diǎn)的情況下,現(xiàn)有的科研人才效用難以得到充分發(fā)揮?;谏鲜龇治?,科研人才需求預(yù)測模型的輸入變量為財(cái)政收支、人均地區(qū)生產(chǎn)總值、勞動生產(chǎn)率、固定資產(chǎn)投資等16個變量;輸出變量為科研人才需求量。由此得出,輸入向量為Xk=(xk1,xk2,xk3,…,xkn),k=1,2,3,…,n,輸入單元個數(shù)n=5;期望輸出向量為Yk=(yk1,yk2,yk3,…,ykm),輸出單元個數(shù)m=1,包含一個隱含層。隱含層神經(jīng)元個數(shù)通過多次訓(xùn)練確定為12。該模型的相關(guān)權(quán)值設(shè)置為:學(xué)習(xí)率Lr=1e-3,最大訓(xùn)練次數(shù)Epoch=2000。
2、樣本數(shù)據(jù)來源。為了使科研人才需求預(yù)測具有代表性和穩(wěn)健性,本文搜集了河南省2010~2020年科研人才需求預(yù)測相關(guān)變量指標(biāo)的時間序列數(shù)據(jù)。(表2)
表2 2010~2020年河南省科研人才需求預(yù)測相關(guān)變量時間序列值一覽表
(二)網(wǎng)絡(luò)訓(xùn)練與測試
1、網(wǎng)絡(luò)訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練將2010~2016年數(shù)據(jù)作為訓(xùn)練集。為了提供更快的收斂和更穩(wěn)定的訓(xùn)練,在訓(xùn)練前對訓(xùn)練集數(shù)據(jù)進(jìn)行歸一化處理。訓(xùn)練集數(shù)據(jù)處理完成后,使用多層感知機(jī)(MLP)對數(shù)據(jù)進(jìn)行擬合訓(xùn)練進(jìn)行回歸預(yù)測,運(yùn)用train函數(shù)對測試集數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,網(wǎng)絡(luò)訓(xùn)練結(jié)果見圖1。(圖1)
圖1 隱藏層單元數(shù)為12時的網(wǎng)絡(luò)訓(xùn)練結(jié)果圖
2、網(wǎng)絡(luò)測試。模型訓(xùn)練結(jié)束后,對模型進(jìn)行測試以驗(yàn)證其在真實(shí)預(yù)測過程中的準(zhǔn)確性。使用2017~2020年數(shù)據(jù)為測試集,在對測試集數(shù)據(jù)進(jìn)行歸一化處理后將數(shù)據(jù)輸入已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,進(jìn)行網(wǎng)絡(luò)仿真。比較輸出值與真實(shí)值的誤差,從而檢驗(yàn)網(wǎng)絡(luò)性能。測試結(jié)果見表3。(表3)
表3 2010~2020年河南省科研人才預(yù)測BP神經(jīng)網(wǎng)絡(luò)分析結(jié)果一覽表
由表3可知,2017~2020年河南省科研人才需求數(shù)量預(yù)測值分別為106,339人、110,451人、117,431人、123,913人。通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測得到預(yù)測值與真實(shí)值之間的相對誤差均值約為0.037041021,平均絕對百分比誤差約為0.037041021,說明了預(yù)測值與真實(shí)值之間偏差較小,BP神經(jīng)網(wǎng)絡(luò)在科研人才需求預(yù)測上不僅是有效的,而且精確度較高。
精確有效的科研人才需求預(yù)測是制定科研人才培養(yǎng)和吸引規(guī)劃的前提。基于BP神經(jīng)網(wǎng)絡(luò)的科研人才需求預(yù)測模型借鑒了先前學(xué)者的研究成果,運(yùn)用多元統(tǒng)計(jì)分析法選取影響科研人才需求的各項(xiàng)指標(biāo),構(gòu)建了科研人才預(yù)測模型,有助于發(fā)現(xiàn)河南省科研人才需求數(shù)量的內(nèi)在規(guī)律。
基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的科研人才需求預(yù)測模型有以下優(yōu)點(diǎn):可以在軟件內(nèi)部直接調(diào)用工具箱,易于操作,結(jié)果直觀明確。但也存在局限性,比如隱藏層神經(jīng)元個數(shù)沒有固定標(biāo)準(zhǔn),需要通過重復(fù)多次訓(xùn)練來得到最佳參數(shù),從而提高模型預(yù)測精度。因此,本文認(rèn)為在利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行科研人才預(yù)測時,可以在以下方面進(jìn)行完善:首先,需要關(guān)注科研人才需求預(yù)測高度相關(guān)的指標(biāo)。根據(jù)經(jīng)濟(jì)發(fā)展?fàn)顩r和政策變化完善相關(guān)指標(biāo)體系,重視對預(yù)測指標(biāo)體系研究,關(guān)注預(yù)測指標(biāo)體系的動態(tài)變化,為實(shí)現(xiàn)合理的科研人才需求預(yù)測工作提供基礎(chǔ)。此外在選取預(yù)測指標(biāo)數(shù)據(jù)時,要避免出現(xiàn)極端數(shù)據(jù)和數(shù)據(jù)缺失情況,從而使模型預(yù)測結(jié)果具有穩(wěn)定性。并且需要確保該指標(biāo)統(tǒng)計(jì)口徑一致,防止指標(biāo)數(shù)據(jù)出現(xiàn)不明變化。其次,采用合理的模型變量選擇方法。運(yùn)用多元統(tǒng)計(jì)分析法選擇模型的輸入變量雖然可以提高模型預(yù)測能力,但是變量之間具有多重共線性,而且模型難以解釋各個變量對輸出變量的影響程度。因此,在應(yīng)用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建科研人才需求預(yù)測模型時,需要進(jìn)一步研究并改進(jìn)變量選擇和模型算法。