劉建平,王健,周國民,石蕾,張貴蘭,高飛,韋草原
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081;2.國家科技基礎(chǔ)條件平臺,北京 100862)
基于科學(xué)數(shù)據(jù)的用戶相關(guān)性判斷實證研究*
劉建平1,王健1,周國民1,石蕾2,張貴蘭1,高飛1,韋草原1
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081;2.國家科技基礎(chǔ)條件平臺,北京 100862)
為探索科學(xué)數(shù)據(jù)用戶相關(guān)性判斷中線索、標準與感知價值關(guān)系,發(fā)現(xiàn)科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理,本研究對影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索、標準和感知價值因素進行測量,以問卷調(diào)查形式對“共享杯”參賽人員進行調(diào)研,獲得相關(guān)數(shù)據(jù)。使用探索性因子對線索集、標準集和感知價值集進行探索性分析,基于線索、標準、感知價值間已有理論關(guān)系,通過結(jié)構(gòu)方程方法對三者關(guān)系進行驗證分析。研究發(fā)現(xiàn),影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的主要線索、標準和感知價值因素,通過對線索、標準和感知價值關(guān)系的實證分析,探究科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理。
科學(xué)數(shù)據(jù);標準;線索;感知價值;結(jié)構(gòu)方程;探索性因子分析
相關(guān)性判斷研究是信息查詢與檢索的主題,根據(jù)研究的側(cè)重點劃分為面向系統(tǒng)相關(guān)性判斷研究和面向用戶相關(guān)性判斷研究。面向用戶相關(guān)性判斷研究重視用戶信息查詢與檢索的主體地位,主要根據(jù)信息行為學(xué)、認知心理學(xué)等理論與方法對影響用戶相關(guān)性判斷的各維度因素進行相關(guān)研究。影響用戶相關(guān)性判斷的因素主要包括相關(guān)性線索、相關(guān)性標準及感知價值。相關(guān)性線索是信息的客觀表達,通常表現(xiàn)為用戶能直接看到的元信息,如標題、作者、發(fā)表時間等信息;相關(guān)性標準是用戶進行相關(guān)性判斷的依據(jù)和工具性概念,如用戶通過關(guān)注作者的知名程度形成相關(guān)性標準的判斷;感知價值是從消費心理學(xué)引入的概念,因為用戶對文檔相關(guān)性的判斷和商品價值的感知具有相似性,都是依據(jù)一定心理感知判斷其相關(guān)性或價值(如用戶基于文檔能夠彌補知識上的空白感知文檔相關(guān)性,則用戶是根據(jù)文檔的認知價值進行相關(guān)性判斷的)。研究者基于以上研究理論,對不同信息載體用戶相關(guān)性判斷進行研究,如以文檔類信息、網(wǎng)頁類信息、圖像類信息及音樂類信息為載體進行相關(guān)性判斷研究??茖W(xué)數(shù)據(jù)作為重要的信息載體之一,用戶在科學(xué)數(shù)據(jù)相關(guān)性判斷過程中關(guān)注的主要線索、使用標準、感知價值及三者間關(guān)系將成為本研究重點。
1.1 相關(guān)性判斷研究中的線索、標準及其關(guān)系研究
Saracevic認為線索是使信息或信息實體相關(guān)的因素,具體指在用戶信息查詢過程中能幫助用戶進行相關(guān)性判斷的客觀因素[1];Wang等將文檔元信息定義為影響用戶文檔相關(guān)性判斷的線索[2];Barry等將標準定義為用戶判斷信息相關(guān)或決策使用信息的依據(jù)[3];成穎將標準定義為判據(jù),即相關(guān)性判斷依據(jù)[4]。國內(nèi)外學(xué)者對于相關(guān)性判斷研究大多基于相關(guān)性線索與標準關(guān)系開展,Barry等針對18位學(xué)者在其工作情境中,利用訪談法和內(nèi)容分析法研究用戶判斷文檔相關(guān)的線索,并從中識別出7大類標準[5];Cool等對300名大學(xué)新生在完成課程論文撰寫中查找文獻使用的標準進行研究,利用內(nèi)容分析法等從文檔線索中識別出影響用戶文檔相關(guān)性判斷的6大類標準[6]。有研究者借鑒Barry和Cool等研究成果,基于不同目標信息類型、信息用戶,從用戶關(guān)注的線索中總結(jié)歸納出相關(guān)性判斷的標準集,對Barry等的研究成果進行擴展與延伸。Savolainen[7]和Choi[8]等分別以網(wǎng)頁和圖像為信息載體,研究用戶在信息查詢過程中關(guān)注的線索和標準使用;Laplante以音頻為信息載體,研究用戶音樂類信息查詢過程中關(guān)注的線索和標準使用[9]。
1.2 相關(guān)性判斷中的感知價值及其與線索和標準關(guān)系研究
Wang等提出文檔選擇模型,將消費心理學(xué)中核心概念感知價值引入用戶相關(guān)性判斷研究,利用內(nèi)容分析法從用戶訪談記錄中總結(jié)出影響用戶相關(guān)性判斷的5類感知價值(認知價值、功能價值、條件價值、社會價值及情感價值),同時指出感知價值與標準的關(guān)系(相關(guān)性標準的組合使用形成感知價值)[2,10];后續(xù)研究將消費心理學(xué)的感知價值觀引入信息查詢領(lǐng)域,Gasper等研究情緒和行為的觀念如何改變信息的感知價值和信息搜索,研究結(jié)果表明,積極情緒能幫助個人獲取解決當(dāng)前問題的信息,而消極情緒則能幫助個人獲取還未出現(xiàn)問題的信息[11];Choi等研究網(wǎng)絡(luò)環(huán)境信息的感知價值[12],但關(guān)于價值與線索關(guān)系、價值與標準關(guān)系的后續(xù)研究較少,這也是本文需要進行探索研究的一個方面。
綜上所述,研究者基于影響用戶相關(guān)性判斷的線索、標準、感知價值及三者關(guān)系開展相關(guān)研究,主要存在兩方面不足:第一,目前針對科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的研究較缺乏;第二,缺乏基于線索、標準與感知價值三者間關(guān)系的實證研究。
本文針對相關(guān)性判斷研究的不足,以科學(xué)數(shù)據(jù)用戶為研究對象,構(gòu)建影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索集、標準集、感知價值集,以問卷調(diào)查的形式獲得用戶對不同集合測量指標的評價數(shù)據(jù)。結(jié)合探索性因子法發(fā)現(xiàn)影響科學(xué)數(shù)據(jù)用戶的主要線索、標準和感知價值因素,在因子分析的基礎(chǔ)上,結(jié)合已有研究理論,提出這3類因素間的假設(shè)關(guān)系,利用結(jié)構(gòu)方程方法驗證該關(guān)系的合理性,以期發(fā)現(xiàn)科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理。
2.1 研究目的
本研究的主要目的包括探索影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索、標準、感知價值,識別科學(xué)數(shù)據(jù)相關(guān)性線索、標準、感知價值間的關(guān)系,探索科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理。
2.2 調(diào)查對象
本文以科學(xué)數(shù)據(jù)用戶為研究對象。全國“共享杯”大學(xué)生科技資源共享服務(wù)創(chuàng)新大賽是我國首個以推動科技資源共享和利用為主題的大學(xué)生競賽平臺,通過國家科技基礎(chǔ)條件平臺中心聯(lián)合各地方科技平臺,為參賽人員共享各領(lǐng)域的科學(xué)數(shù)據(jù)集。參賽者通過對相關(guān)數(shù)據(jù)進行查詢與分析形成參賽作品,從而激發(fā)大學(xué)生的科研創(chuàng)新與自主創(chuàng)業(yè)能力。因此,本研究以“共享杯”參賽者為主要研究對象,調(diào)查其科學(xué)數(shù)據(jù)查詢與使用中對線索、標準和感知價值的理解情況。
2.3 問卷設(shè)計
本研究的問卷設(shè)計分3個階段進行,即前期調(diào)研、量表設(shè)計、樣本測試。前期調(diào)研階段主要通過調(diào)研與訪談的形式,對科學(xué)數(shù)據(jù)用戶在數(shù)據(jù)查詢中關(guān)注的線索、所用標準及感知價值情況進行記錄;量表設(shè)計借鑒相關(guān)性判斷中已有研究和前期調(diào)研階段采集的數(shù)據(jù),對量表進行設(shè)計;樣本測試階段通過分析測試樣本,修正和改進問卷。
2.4 問卷發(fā)放與回收
通過網(wǎng)絡(luò)問卷形式,借助全國“共享杯”大學(xué)生科技資源共享服務(wù)創(chuàng)新大賽平臺,對問卷進行有償發(fā)放與回收。為控制網(wǎng)絡(luò)問卷反饋的真實性與準確性,本文采取的過程控制措施主要有4項:第一,在“共享杯”官方網(wǎng)站以正式通知的形式邀請來自全國的參賽者進行問卷填寫;第二,問卷采取有償填寫,要求問卷填寫客觀真實,不可重復(fù)填寫;第三,樣本對象控制,將目標對象定為碩士及以上學(xué)歷和使用數(shù)據(jù)較頻繁的本科生;第四,對問卷填寫者進行隨機抽樣電話訪談,要求重新填寫問卷,測量填寫的一致性。網(wǎng)絡(luò)問卷發(fā)放時間為2016年12月22日—2017年2月7日,累計收到問卷673份,來自全國21個省份、4個直轄市、3個自治區(qū)。在673份問卷樣本中,男生350人,女生323人;年齡段23—30歲的人數(shù)總計569人,占總問卷樣本數(shù)的84.5%;碩士研究生524人、博士研究生115人,共占總?cè)藬?shù)的94.9%。通過過程控制環(huán)節(jié)和問卷填寫時間限制(低于500秒不納入研究范疇),最終篩選出有效問卷542份。
2.5 測量指標
2.5.1 線索集的選取與得分
在以文檔為目標研究類型的相關(guān)性判斷研究中,Wang等將文檔元信息定義為影響用戶文檔相關(guān)性判斷的線索[2],當(dāng)研究對象轉(zhuǎn)為科學(xué)數(shù)據(jù)時,線索的表現(xiàn)形式與文檔不盡相同,具體表現(xiàn)為數(shù)據(jù)元信息(如數(shù)據(jù)覆蓋時間、數(shù)據(jù)格式、數(shù)據(jù)名稱等)。本研究對國內(nèi)各大數(shù)據(jù)共享平臺(包括地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺、氣象科學(xué)數(shù)據(jù)共享中心、國家標準物質(zhì)資源共享平臺、國家標準物質(zhì)資源共享平臺等23個數(shù)據(jù)共享平臺)的元數(shù)據(jù)信息進行調(diào)研,最終總結(jié)出19條線索。調(diào)研對象根據(jù)數(shù)據(jù)相關(guān)性線索對其數(shù)據(jù)查詢的影響程度進行打分,采用5分制李克特量表,量表中變量命名及通過SPSS20.0對各線索均值與方差得分進行統(tǒng)計(見表1)。
2.5.2 標準集的選取與得分
本文相關(guān)性標準集的選取借鑒Schamber[13]和Barry[5]等的研究成果,綜合前人研究和實驗總結(jié)共得出12個標準,調(diào)研對象根據(jù)標準對其數(shù)據(jù)查詢的影響程度進行打分,量表采用李克特5分制,量表中變量命名及通過SPSS20.0對各標準均值與方差得分進行統(tǒng)計(見表2)。
2.5.3 感知價值集的選取與得分
Sheth等提出的消費者價值理論指出,用戶感知價值指用戶在使用或選擇某商品時,對該商品滿足用戶某方面需求的感知[14]。本研究根據(jù)前期調(diào)研將用戶在數(shù)據(jù)查詢和使用過程中,感知數(shù)據(jù)滿足用戶的需求分為9種情況,采用5分制李克特量表,量表中變量命名及通過SPSS20.0對各感知價值均值與方差得分進行統(tǒng)計(見表3)。
表1 線索集均值與方差得分
表2 標準集方差與均值得分
表3 數(shù)據(jù)感知價值集均值與方差得分
2.6 測量指標的信度與效度分析
本研究對測量指標信度的檢驗采用Cronbach’ s α系數(shù),利用SPSS20.0進行信度與效度分析,測得各潛變量對應(yīng)測量指標的α系數(shù)得分。經(jīng)計算19項線索集、12項標準集、9項感知價值集對應(yīng)的α系數(shù)分別為0.91、0.91、0.63,且均在可接受范圍;研究主要通過結(jié)構(gòu)效度檢驗數(shù)據(jù)效度,使用KMO和巴特利特球形檢驗判別數(shù)據(jù)是否適合因子分析,即測量變量間是否存在結(jié)構(gòu)關(guān)系。經(jīng)計算,集合線索集、標準集、感知價值集KMO值得分分別為0.91、0.93、0.64,巴特利特球形檢驗的顯著性均為0,即樣本數(shù)據(jù)能夠反映測量變量間的結(jié)構(gòu)關(guān)系,結(jié)構(gòu)效度顯著。
因子分析是將描述某一事物或概念的多個觀測變量簡化為少數(shù)幾個潛在變量的多元統(tǒng)計分析方法[15]。其前提是觀測變量間存在相關(guān)關(guān)系,即測量變量間存在公因子;公因子是不可直接測量的潛變量,能更具概括性地反映事物特征。因子分析根據(jù)是否使用先驗條件,分為探索性因子分析和驗證性因子分析。探索性因子分析是在事先不知道影響因素的基礎(chǔ)上,利用測量數(shù)據(jù)和統(tǒng)計軟件,根據(jù)一定原則確定公因子的方法[16]。本研究對影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的3類因素集合進行探索性因子分析。
3.1 線索集的因子分析
3.1.1 確定公因子與因子旋轉(zhuǎn)
在測量指標的效度分析中,線索集的KMO值為0.91,表明樣本充足;巴特利特球形檢驗的近似卡方值為4 352.11,對應(yīng)概率值為0(p<0.01),即相關(guān)系數(shù)矩陣與單位矩陣有顯著差異,測量指標間有強相關(guān)關(guān)系,說明線索指標集適合做因子分析。該研究根據(jù)累計方差貢獻率超過70%確定公因子個數(shù)為7,利用主成分提取前7個因子作為公因子;因子負荷矩陣說明公因子與原始測量指標間的關(guān)聯(lián)程度,由于未旋轉(zhuǎn)的因子負荷矩陣結(jié)構(gòu)不夠簡明,因子解釋力較弱。本文使用正交旋轉(zhuǎn)法對因子進行旋轉(zhuǎn),其優(yōu)點是因子間提供的信息不會重疊,使公共因子的負荷系數(shù)趨向0或1。本研究中根據(jù)因子負荷矩陣中,在測量指標因子負荷系數(shù)大于0.5為依據(jù),選擇表示公因子的測量指標,標準集和感知價值集因子分析也采用該標準值。
3.1.2 因子解釋與命名
公因子命名根據(jù)以下兩條原則:第一,公因子方差貢獻率從大到小的順序?qū)?個公因子依次命名;第二,選取因子負荷矩陣中測量指標負荷系數(shù)大于0.5的測量指標對因子進行解釋。(1)第一公因子方差貢獻率為12.75%,該因子在原始測量變量X13、X14、X16、X18上有較大負荷值,其共同反映數(shù)據(jù)的來源信息,因此將其定義為數(shù)據(jù)來源信息;(2)第二公因子方差貢獻率為12.22%,其在X9、X15上有較大負荷值,將其命名為數(shù)據(jù)詳細內(nèi)容信息;(3)第三公因子方差貢獻率為11.88%,其在X2、X4上有較大負荷值,將其命名為主題詳細信息;(4)第四公因子方差貢獻率為11.42%,其在X3、X7、X10上有較大負荷值,將其命名為獲取與質(zhì)量信息;(5)第五公因子方差貢獻率為9.55%,其在X5、X17上有較大負荷值,反映與數(shù)據(jù)時空相關(guān)的信息,將其命名為時空信息;(6)第六公因子方差貢獻率為7.68%,其在X8、X19上有較大負荷值,反映與數(shù)據(jù)評價相關(guān)的信息,將其命名為數(shù)據(jù)評價信息;(7)第七公因子方差貢獻率為6.63%,其在X6、X16上有較大負荷值,但是這兩個測量指標所表達的信息差異較大,X16在第一公共因子中也有較大的負荷值且與第一因子中其他測量指標表達的信息較一致,所以第七公共因子以X6所反映的信息命名,將該因子命名為主題信息。
3.2 標準集的因子分析
3.2.1 確定公因子與因子旋轉(zhuǎn)
在測量指標的效度分析中,標準集KMO值為0.93,巴特利特球形檢驗的近似卡方值為3 231.81,對應(yīng)概率值為0(p<0.01),標準指標集適合做因子分析。在標準集因子分析中,確定公因子與因子旋轉(zhuǎn)和線索集分析過程一樣,此處不再贅述,最終根據(jù)累計方差貢獻率大于70%確定4個公因子。
3.2.2 因子解釋與命名
(1)第一公因子方差貢獻率為24.91%,原始測量變量X25、X26、X30、X31上有較大負荷值,共同反映用戶對數(shù)據(jù)內(nèi)容的理解,將其定義為數(shù)據(jù)內(nèi)容相關(guān)標準;(2)第二公因子方差貢獻率為19.90%,其在X20、X22、X27上有較大負荷值,反映用戶對數(shù)據(jù)質(zhì)量的理解,將其命名為數(shù)據(jù)質(zhì)量相關(guān)標準;(3)第三公因子方差貢獻率為15.13%,其在X21、X28上有較大負荷值,而主題性與可獲得性兩個測量指標理論關(guān)系不大,故根據(jù)因子解釋力較強的Y2對該因子命名,將其命名為數(shù)據(jù)獲取相關(guān)標準;(4)第四公因子方差貢獻率為12.40%,其在X23、X29上有較大的負荷值,反映用戶對數(shù)據(jù)內(nèi)容新與時間新的理解,將其命名為數(shù)據(jù)新穎度相關(guān)標準。
3.3 感知價值集的因子分析
3.3.1 確定公因子與因子旋轉(zhuǎn)
在測量指標的效度分析中,感知價值集的KMO值為0.64(KMO>0.5),表明樣本充足;巴特利特球形檢驗的近似卡方值為823.80,對應(yīng)的概率值為0(p<0.01),說明感知價值指標集適合做因子分析。在感知價值集因子分析中,確定公因子和因子旋轉(zhuǎn)分析與線索集因子分析方法類似,最終根據(jù)累計方差貢獻率大于70%確定4個公因子。
3.3.2 因子解釋與命名
(1)第一公因子方差貢獻率為20.56%,在原始測量變量Y4、Y6上有較大負荷值,反映用戶對數(shù)據(jù)能進行建模和驗證模型的感知,即用戶對數(shù)據(jù)功能價值的感知,將其命名為功能價值;(2)第二公因子方差貢獻率為17.12%,其在Y3、Y5上有較大負荷值,反映數(shù)據(jù)對用戶知識的彌補和理論知識提升,即數(shù)據(jù)對用戶認知的提升作用,將其命名為認知價值;(3)第三公因子方差貢獻率為15.99%,在Y1、Y2、Y8上有較大的負荷值,反映用戶對數(shù)據(jù)未來某一時刻價值的期望,即當(dāng)滿足一定條件時,數(shù)據(jù)能夠帶來的價值,將其命名為條件價值;(4)第四公因子方差貢獻率為15.32%,其在Y7、Y9上有較大的負荷值,反映用戶感知數(shù)據(jù)價值受外界影響較大的情況,將其命名為社會價值。
通過探索性因子分析對影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷主要線索、標準和感知價值因素進行分析,發(fā)現(xiàn)影響科學(xué)數(shù)據(jù)用戶的7類線索及其重要程度、4類標準及其重要程度、4類感知價值及其重要程度。為更好地探究科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理,對各因素關(guān)系的研究尤為重要。
基于以上研究現(xiàn)狀,本研究從科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的認知機理出發(fā),結(jié)合結(jié)構(gòu)方程法,擬通過以下假設(shè)對關(guān)系模型進行驗證。
H1:相關(guān)性線索使用對相關(guān)性標準使用有正向影響作用。
H2:相關(guān)性線索使用對數(shù)據(jù)感知價值有正向影響作用。
H3:相關(guān)性標準使用對感知價值有正向影響作用。
H4-1—H4-7:線索集對應(yīng)的公因子對線索使用有正向影響。
H5-1—H5-4:標準集對應(yīng)的公因子對標準使用有正向影響。
H6-1—H6-4:數(shù)據(jù)感知價值集對應(yīng)的公因子對數(shù)據(jù)價值感知有正向影響。
4.1 關(guān)系模型構(gòu)建
利用結(jié)構(gòu)方程法,使用AMOS21.0,結(jié)合探索性因子分析的結(jié)果,對影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索-標準-感知價值關(guān)系進行二階驗證性因子分析。構(gòu)建科學(xué)數(shù)據(jù)相關(guān)性判斷過程中線索-標準-感知價值關(guān)系模型(見圖1),在探索性因子分析中因子作為一階潛變量,其對應(yīng)的測量指標變量為旋轉(zhuǎn)后因子負荷值大于0.5的指標項。線索集探索性因子分析得出的7類一階潛變量對應(yīng)的二階潛變量為線索使用;標準集探索性因子分析得出的4類一階潛變量對應(yīng)的二階潛變量為標準使用;感知價值集探索性因子分析得出的4類一階潛變量對應(yīng)的二階潛變量為數(shù)據(jù)感知價值。
圖1 科學(xué)數(shù)據(jù)相關(guān)性判斷中線索-標準-感知價值關(guān)系模型
4.2 關(guān)系模型驗證
4.2.1 模型擬合檢驗
結(jié)構(gòu)方程通過構(gòu)建一系列模型擬合指數(shù),測量模型的可靠性與真實性。本研究根據(jù)侯杰泰等的研究[17],選取擬合指數(shù):x2/df(不受模型的復(fù)雜度影響)、GFI(模型解釋力)、RMSEA(比較理論模型與飽和模型的差距)、NFI(比較假設(shè)模型與獨立模型的卡方差異)、CFI(假設(shè)模型與獨立模型的非中央性差異)、RMR(未標準化假設(shè)模型整體殘差)。經(jīng)計算本研究模型中各擬合指數(shù)x2/df、GFI、RMSEA、NFI、CFI、RMR得分分別為2.60、0.90、0.05、0.90、0.92、0.06,各項擬合指數(shù)均在判斷值范圍,該模型總體擬合較理想,樣本數(shù)據(jù)能較充分反映理論模型。RMSEA值在0.05—0.08,表示模型適配度尚可,小于0.05表示模型適配度佳[18];本研究RMSEA為0.05,在可接受范圍,模型適配度較好。
4.2.2 模型參數(shù)估計與假設(shè)檢驗
模型參數(shù)主要是對路徑系數(shù)值和殘差項的估計,本研究采用極大似然估計,路徑系數(shù)的檢驗采用t檢驗。
(1)模型回歸路徑系數(shù)估計與假設(shè)檢驗。如表4所示,模型的回歸路徑系數(shù)與假設(shè)檢驗結(jié)論,標準化路徑系數(shù)說明了研究假設(shè)中原因變量對結(jié)果變量的解釋力。其中標準化路徑系數(shù)均較高,僅個別路徑系數(shù)較低;在路徑系數(shù)t檢驗中,只有H3不顯著,其他均為顯著,且大部分是在0.01水平下顯著,這充分說明研究假設(shè)的合理性。表4的研究結(jié)果驗證了該研究提出的H1、H2、H4-1—H4-7、H5-1—H5-4、H6-1—H6-4的合理性,同時根據(jù)H3對應(yīng)的標準化路徑系數(shù)得分與p值判斷應(yīng)拒絕研究假設(shè),即標準使用對數(shù)據(jù)感知價值有正向影響不成立。
(2)模型相關(guān)性路徑系數(shù)估計與假設(shè)檢驗。模型中相關(guān)關(guān)系說明變量間互相影響程度,該研究理論假設(shè)沒有對測量變量間關(guān)系進行相應(yīng)假設(shè),表5列出測量變量間相關(guān)關(guān)系通過結(jié)構(gòu)方程修正系數(shù)M.I建立。修正指數(shù)是優(yōu)化結(jié)構(gòu)方程模型的主要方法,通過建立變量間關(guān)系以減少卡方統(tǒng)計量,進而提升模型整體擬合效果,同時通過建立變量關(guān)系發(fā)現(xiàn)有意義的信息。表5中研究假設(shè)關(guān)系建立遵循兩條原則:第一,變量間關(guān)系的建立必須有理論解釋力;第二,變量間關(guān)系建立能夠較明顯減少卡方統(tǒng)計量,提升模型整體擬合度。表5中t檢驗結(jié)果顯示,通過修正指數(shù)建立的測量指標變量誤差項間的相關(guān)關(guān)系均顯著,驗證了H7—H14的合理性。探索性發(fā)現(xiàn)測量變量相關(guān)關(guān)系信息。
表4 模型回歸路徑系數(shù)估計與假設(shè)檢驗
續(xù)表
表5 模型相關(guān)性路徑系數(shù)估計與假設(shè)檢驗
本研究從影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索、標準、感知價值及三者關(guān)系出發(fā),通過探索性因子分析發(fā)現(xiàn)影響科學(xué)用戶相關(guān)性判斷的主要線索、標準以及感知價值因子;在已有研究基礎(chǔ)上,通過結(jié)構(gòu)方程法對三者關(guān)系進行驗證性分析,構(gòu)建科學(xué)數(shù)據(jù)相關(guān)性判斷線索-標準-感知價值關(guān)系模型。
用戶相關(guān)性判斷以用戶信息查詢與檢索中的主體地位為研究出發(fā)點,探究影響用戶相關(guān)性判斷的主要影響因素:線索是用戶形成相關(guān)性判斷的刺激因素,標準是線索刺激而產(chǎn)生或者激活的用戶相關(guān)性判斷的工具性概念,感知價值是用戶基于信息需求對信息作用的感知。線索是對信息的客觀表達,標準與感知價值是用戶對信息的主觀理解。探究影響用戶相關(guān)性判斷的主要因素及三者關(guān)系,能夠揭示用戶相關(guān)性判斷的認知機理。本文探索性研究了影響科學(xué)數(shù)據(jù)用戶相關(guān)性判斷的線索、標準、感知價值三者之間的影響關(guān)系,從以下三方面內(nèi)容揭示科學(xué)數(shù)據(jù)用戶相關(guān)性判斷過程中的認知機理特征。
5.1 線索使用對標準使用的正向影響作用
通過科學(xué)數(shù)據(jù)相關(guān)性判斷中線索-標準-感知價值關(guān)系模型顯示,線索使用對標準使用正向影響力達0.91,這充分說明科學(xué)數(shù)據(jù)用戶通過關(guān)注客觀線索形成相關(guān)性標準進行相關(guān)性判斷的理論假設(shè)。通過探索性因子分析發(fā)現(xiàn),科學(xué)數(shù)據(jù)用戶關(guān)注的線索及根據(jù)探索性因子分析中各因子方差解釋率由高到低依次為數(shù)據(jù)來源信息、數(shù)據(jù)詳細內(nèi)容信息、主題詳細信息、獲取與質(zhì)量信息、時空信息、數(shù)據(jù)評價信息、主題信息;使用的標準及根據(jù)探索性因子分析中各因子方差解釋率由高到低依次為與數(shù)據(jù)內(nèi)容相關(guān)標準、數(shù)據(jù)質(zhì)量相關(guān)標準、數(shù)據(jù)獲取相關(guān)標準、新穎度相關(guān)標準。
同時,線索使用與標準使用的關(guān)系還體現(xiàn)在具體測量指標間的關(guān)系,本文通過結(jié)構(gòu)方程修正系數(shù)M.I建立測量指標誤差項間相關(guān)關(guān)系,對應(yīng)研究假設(shè)H7—H14,結(jié)果表明研究假設(shè)H7—H14是合理的。該結(jié)論探索性揭示了線索與標準生成的對應(yīng)關(guān)系:數(shù)據(jù)共享級別與可獲得性、是否支持下載與可獲得性、關(guān)鍵詞與主題性、數(shù)據(jù)訪問量與新穎性、數(shù)據(jù)質(zhì)量說明與質(zhì)量、數(shù)據(jù)覆蓋時間與時效性、數(shù)據(jù)評級與可用性、數(shù)據(jù)名稱與主題性。如用戶通過關(guān)注數(shù)據(jù)共享級別形成相關(guān)性判斷標準可獲得性進行判斷,同時用戶如果在判斷數(shù)據(jù)相關(guān)性時對標準可獲得性較重視,他會首先關(guān)注數(shù)據(jù)共享級別,其他相關(guān)關(guān)系解釋類似。該結(jié)論從科學(xué)數(shù)據(jù)用戶關(guān)注的線索、用到的標準及三者間關(guān)系的角度,揭示科學(xué)數(shù)據(jù)用戶認知機理的主要內(nèi)容。
5.2 線索使用對數(shù)據(jù)價值感知正向影響作用
模型驗證分析中,線索使用對數(shù)據(jù)價值感知正向的標準回歸路徑系數(shù)為0.67,說明用戶對數(shù)據(jù)價值的感知同樣是通過關(guān)注數(shù)據(jù)的客觀線索形成的,科學(xué)數(shù)據(jù)用戶主要的數(shù)據(jù)感知價值及根據(jù)探索性因子分析中各因子方差解釋率由高到低依次為功能價值、認知價值、條件價值、社會價值,該結(jié)論探索性驗證了消費心理學(xué)中價值理論在用戶相關(guān)性判斷研究中的適用性。
5.3 標準使用對數(shù)據(jù)價值感知的影響不明顯
在模型驗證分析中,標準使用對數(shù)據(jù)價值感知的標準回歸路徑系數(shù)為-0.24,顯著性檢驗p值為0.25,拒絕原假設(shè),即相關(guān)性標準使用對數(shù)據(jù)價值感知正向影響不明顯。因為從用戶認知的角度出發(fā),相關(guān)性標準和感知價值是用戶基于客觀線索的主觀感知,二者影響關(guān)系不明顯。這一結(jié)論對Wang等提出的文檔選擇模型中的結(jié)論(相關(guān)性標準的組合使用形成感知價值的理論假設(shè))進行了驗證,從實證分析的角度證明該關(guān)系不成立。
在大數(shù)據(jù)時代,科學(xué)數(shù)據(jù)作為一種非常重要的信息表現(xiàn)形式,科學(xué)數(shù)據(jù)相關(guān)性判斷研究顯得尤為重要。該研究結(jié)論為科學(xué)數(shù)據(jù)查詢與檢索理論研究提供一定的理論支持和方法借鑒,同時為開發(fā)更加高效、便捷、用戶友好型的新一代智能數(shù)據(jù)搜索引擎提供一定的理論支持。
[1] SARACEVIC T.Relevance:a review of the literature and a framework for thinking on the notion in information science.Part III:behavior and effects of relevance[J].Journal of the Association for Information Science and Technology,2007,58(13):2126-2144.
[2] WANG P,SOERGEL D.A cognitive model of document use during a research project.Study I.Document selection[J].Journal of the Association for Information Science and Technology,1998,49(2):115-133.
[3] BARRY C L,SCHAMBER L.Users’ criteria for relevance evaluation:a cross-situational comparison[J].Information Processing & Management an Internation Journal,1998,34(2/3):219-236.
[4] 成穎.信息檢索相關(guān)性判據(jù)及應(yīng)用研究[M].北京:科學(xué)出版社,2011.
[5] BARRY C L,CAROL L.User-defined relevance criteria:an exploratory study[J].Journal of the Association for Information Science and Technology, 1994,45(3):149-159.
[6] COOL C,BELKIN N J,FRIEDER O,et al.Characteristics of text affecting relevance judgments[J].Automotive News,1993,17(4):77-84.
[7] SAVOLAINEN R,KARI J.User-defined relevance criteria in web searching[J].Journal of Documentation,2006,62(6):685-707.
[8] CHOI Y,RASMUSSEN E M.User’s relevance criteria in image retrieval in American history[J].Information Processing & Management,2002,38(5): 695-726.
[9] LAPLANTE A.Users’ relevance criteria in music retrieval in everyday life:an exploratory study[C]//International Society for Music Information Retrieval Conference,August 2010,Utrecht,[S.1.]:[s.n],2012.
[10] WANG P L,WHITE M D.A cognitive model of document use during a research project.Study II.Decisions at the reading and citing stages[J]. Journal of the Association for Information Science and Technology, 1999,50(2):98-114.
[11] GASPER K,ZAWADZKI M J.Want information?How mood and performance perceptions alter the perceived value of information and influence information-seeking behaviors[J].Motivation and Emotion,2013, 37(2):308-322.
[12] CHOI D,SHAH C.Perceived value of information sharing in online environments:user engagement and social reputation[J].Proceedings of the American Society for Information Science & Technology,2015,51(1):1-10.
[13] SCHAMBER L.Users’criteria for evaluation in a multimedia environment[J].American Society for Information Science & Technology, 1991,28(6):126-133.
[14] SHETH J N,NEWMAN B I,GROSS BL.Why we buy what we buy:a theory of consumption values[J].Journal of Business Research,1991,22(2):159-170.
[15] 杜智敏,樊文強.SPSS在社會調(diào)查中的應(yīng)用[M].北京:電子工業(yè)出版社,2015.
[16] 王松濤.探索性因子分析與驗證性因子分析比較研究[J].蘭州學(xué)刊, 2006(5):155-156.
[17] 侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社,2004:70-74.
[18] 吳明隆.結(jié)構(gòu)方程模型——AMOS的操作與應(yīng)用:第2版[M].重慶:重慶大學(xué)出版社,2010.
周國民,男,1969年生,研究員,博士生導(dǎo)師,研究方向:農(nóng)業(yè)科學(xué)數(shù)據(jù)共享技術(shù)、農(nóng)業(yè)網(wǎng)絡(luò)信息智能搜索技術(shù)、果園信息化技術(shù)。
石蕾,女,1982年生,副研究員,研究方向:科學(xué)數(shù)據(jù)管理與共享。
張貴蘭,女,1993年生,博士研究生,研究方向:信息查詢與檢索。
高飛,女,1987年生,博士研究生,研究方向:信息查詢與檢索。
韋草原,女,1993年生,碩士研究生,研究方向:信息查詢與檢索。
An Empirical Study on User’s Relevance Judgment Based on Scientific Data
LIU JianPing1, WANG Jian1, ZHOU GuoMin1, SHI Lei2, ZHANG GuiLan1, GAO Fei1, WEI CaoYuan1
(1. Agricultural Information Institute, CAAC, Beijing 100081, China; 2. National Science &Technology Infrastructure, Beijing 100862, China)
In order to explore the relationship among clues, criteria and perceived value in the process of scientific data relevance judgement and find the cognitive mechanism of user’s relevance judgment in scientific data. This study measures the variables of clues, criteria and perceived value that affect scientific data relevance judgement. By investigating the participants who took part in“The Shared Cup” through questionnaire survey in China, this study obtains relevant data. The exploratory factor method is used to explore the clue set, the criteria set and the perceived value set. Based on the existing theoretical relationship between the clues, the criteria and the perceived value, and the relationship are verified by the method of structural equation modeling. The study finds the main clues, criteria and perceived value that affect theuser’s relevance judgementin scientific data. Through the empirical analysis of the relationship between the cues, the criteria and the perceived value, the cognitive mechanism of the relevance judgment in the scientific data is explored.
Scientific-Data; Criteria; Clue; Perceived-Value; Structural Equation Modeling; Exploratory Factor Analysis
G202
10.3772/j.issn.1673-2286.2017.04.004
劉建平,男,1989年生,碩士研究生,研究方向:信息查詢與檢索,E-mail:1592126095@qq.com。
王健,男,1971年生,博士,通訊作者,研究員,研究方向:信息處理,E-mail:wangjian01@caas.cn。
2017-03-21)
* 本研究得到中國農(nóng)業(yè)科學(xué)院協(xié)同創(chuàng)新工程重點任務(wù)“多源異構(gòu)農(nóng)業(yè)大數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)與計算挖掘”和國家社會科學(xué)基金“科學(xué)數(shù)據(jù)用戶相關(guān)性標準與使用模式實證研究”(編號:14BTQ056)資助。