国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)序相關(guān)性的信息效用評(píng)價(jià)模型研究

2016-08-11 05:43:57杜曉艷
關(guān)鍵詞:平均數(shù)效用差分

杜曉艷

(深圳大學(xué) 圖書館,廣東 深圳 518060)

?

基于時(shí)序相關(guān)性的信息效用評(píng)價(jià)模型研究

杜曉艷

(深圳大學(xué) 圖書館,廣東深圳518060)

事務(wù)處理中的時(shí)間相關(guān)性數(shù)據(jù)蘊(yùn)涵著對預(yù)測與決策具有情報(bào)效用的信息,可以通過構(gòu)建一定的特征模式對其效用大小進(jìn)行評(píng)價(jià)。文章對時(shí)變序列數(shù)據(jù)的相關(guān)性特征進(jìn)行了分析,研究了基于時(shí)序與波動(dòng)變化的特征抽取模式;在時(shí)變序列的差分及相對變化基礎(chǔ)上,進(jìn)一步綜合利用偏態(tài)、離散、相關(guān)等特征構(gòu)建了影響變量與響應(yīng)變量之間的相關(guān)度計(jì)算模型。該模型可降低效用評(píng)價(jià)計(jì)算復(fù)雜度,增強(qiáng)評(píng)價(jià)的可靠性并可用于模型預(yù)測。

時(shí)序特征;相關(guān)性;特征模式;信息效用;信息資源

一、引 言

按照服務(wù)職能,信息系統(tǒng)包括事務(wù)處理系統(tǒng)、管理系統(tǒng)、決策支持系統(tǒng)、人工智能/專家系統(tǒng)。[1]因此,在決策支持系統(tǒng)層次會(huì)產(chǎn)生自下而上的信息流動(dòng)及相關(guān)的信息資源轉(zhuǎn)換,將信息資源提升為知識(shí)資源,充分發(fā)揮信息資源的作用。[2]但是,在不確定性日益增強(qiáng)的自然與社會(huì)環(huán)境中,信息量不斷膨脹及不確定性日益增加,信息的數(shù)據(jù)結(jié)構(gòu)與表現(xiàn)方式也日趨多元與復(fù)雜,呈現(xiàn)出大數(shù)據(jù)或準(zhǔn)大數(shù)據(jù)環(huán)境特征。在大數(shù)據(jù)環(huán)境下,數(shù)字信息資源具有連續(xù)性、周期性、高維度、高自由度等非線性特征。數(shù)據(jù)雖然價(jià)值越來越大,但價(jià)值密度低,數(shù)據(jù)挖掘難度大。這些因素使決策層與其他相關(guān)層次的信息協(xié)作與轉(zhuǎn)換流程更加復(fù)雜,極大地影響決策情報(bào)實(shí)時(shí)形成的效率與可靠性。

因此,針對事務(wù)處理中信息系統(tǒng)歷史數(shù)據(jù)體量大、價(jià)值密度低、時(shí)序性強(qiáng)、非隨機(jī)性及速度要求高等處理特點(diǎn),需要建立簡單、快速的數(shù)據(jù)分析與約簡模型,通過建立一定的特征模式來降低信息情報(bào)效用評(píng)價(jià)的維度以獲得更高的計(jì)算效率,滿足決策與預(yù)測實(shí)時(shí)性與可靠性的要求。

二、信息效用評(píng)價(jià)模型和要素分析

目前針對信息的決策效用價(jià)值評(píng)價(jià)研究主要集中于兩個(gè)方面:一是針對信息效用評(píng)價(jià)指標(biāo)體系的構(gòu)建,以定性研究為主,如面向歷史檔案的情報(bào)效用,提出針對檔案信息情報(bào)效用的評(píng)價(jià)體系,包括知識(shí)發(fā)現(xiàn)難易程度、需求量、可獲取性和使用效果[3];二是基于定量評(píng)價(jià)的概率模型或線性效用模型,如基于某個(gè)具體任務(wù)的完成對用戶的有用程度,提出面向任務(wù)網(wǎng)絡(luò)的信息效用度量標(biāo)準(zhǔn)、平均認(rèn)知評(píng)分等。[4]

基于預(yù)測、決策需要的信息一般分為兩類:一類是完全信息,即可以得到肯定答案的客觀狀態(tài)的信息;另一類是抽樣信息,一般通過調(diào)查或抽樣獲得原始信息,用統(tǒng)計(jì)方法來推斷客觀狀態(tài)出現(xiàn)的概率[4]及對客觀狀態(tài)可能影響程度的大小。二者均面臨信息的情報(bào)效用分析與評(píng)價(jià)問題。在具體實(shí)踐中,評(píng)價(jià)的要素主要包括:一是信息單元對決策主題產(chǎn)生影響的程度大小,它在量化方面需要通過比較產(chǎn)生的相對價(jià)值來體現(xiàn)。這種比較應(yīng)該建立在動(dòng)態(tài)變化的相關(guān)性上,而相關(guān)性除了與變化本身相關(guān)外一般還與時(shí)序關(guān)系有關(guān);二是在多元信息環(huán)境下,各影響因素之間本身存在一定的相互作用與影響,需要克服因素之間的重疊作用;再有就是抽樣信息本身發(fā)生的概率,這是需要估計(jì)的先驗(yàn)概率。對于信息系統(tǒng)內(nèi)基于歷史數(shù)據(jù)的信息,主要應(yīng)該考慮其發(fā)生變動(dòng)的可能性大小,而系統(tǒng)外部相關(guān)信息發(fā)生可能性的大小則相對難以判斷,具有更大的隨機(jī)性與不確定性。

信息系統(tǒng)中的數(shù)據(jù)時(shí)變序列不僅蘊(yùn)涵著相對影響程度的信息,也在一定程度上包含了共線性信息及先驗(yàn)概率信息。本文的評(píng)價(jià)模型基于事務(wù)數(shù)據(jù)所蘊(yùn)含的信息,建立在被影響因素與影響因素時(shí)序變化與波動(dòng)相關(guān)性基礎(chǔ)上,具有統(tǒng)計(jì)確定性、過程的完整性及數(shù)據(jù)的可靠性等特性,能夠通過構(gòu)建的特征模型來體現(xiàn)評(píng)價(jià)要素的綜合性。

三、抽樣信息的時(shí)序特征及波動(dòng)相關(guān)性

1.數(shù)據(jù)選定及預(yù)處理

假設(shè)Y是預(yù)測或決策方案中的一個(gè)重要量化指標(biāo),稱為響應(yīng)變量。響應(yīng)變量可能受到m個(gè)變量X1,X2、,……,Xm的影響,稱為影響變量。響應(yīng)變量和影響變量的抽樣結(jié)果,一方面可用于評(píng)價(jià)影響變量對響應(yīng)變量產(chǎn)生影響的效用價(jià)值,另一方面可建立線性回歸表達(dá)式對響應(yīng)變量進(jìn)行預(yù)測。

分別按照一定的時(shí)間周期間隔對響應(yīng)變量和影響變量進(jìn)行抽樣。其中,響應(yīng)變量Y抽樣獲得的序列為時(shí)點(diǎn)數(shù)列,是在具有明顯變動(dòng)時(shí)刻或指定變動(dòng)周期的統(tǒng)計(jì)值;影響變量的抽樣值為時(shí)變序列,序列中的值反映一定時(shí)間內(nèi)指標(biāo)的統(tǒng)計(jì)量。

假設(shè)已獲得相當(dāng)數(shù)量的抽樣測量值。對各變量均找出相對穩(wěn)定的起始值,則可獲得測量值絕對時(shí)序關(guān)系,如表1所示。其中,第1行為響應(yīng)變量Y及其測量值yj(j=0~n),第2行到第(m+1)行為影響變量Xi(i=1~m)及其測量值xij。

表1 測量數(shù)據(jù)

2.基于差分的波動(dòng)序列

為使評(píng)價(jià)建立在變動(dòng)相關(guān)性基礎(chǔ)上,用差分描述變量的變動(dòng)情況,同時(shí)將得到的差分序列進(jìn)行標(biāo)準(zhǔn)化,使變動(dòng)相關(guān)性在量綱上一致。為此,定義響應(yīng)變量測量值的差分序列標(biāo)準(zhǔn)化參數(shù)為:

(1)

類似地,定義影響變量測量值的差分序列標(biāo)準(zhǔn)化參數(shù)為:

(2)

對表1中的測量值分別按式(1)和式(2)進(jìn)行處理,得到響應(yīng)變量及影響變量增量△Y和△Xi(i=1~m)的標(biāo)準(zhǔn)化參數(shù)數(shù)據(jù),如表2所示。各變量相對變化數(shù)據(jù)均與本身量綱無關(guān)。

表2 變量的標(biāo)準(zhǔn)化數(shù)據(jù)

3. 樣本的位置度量及偏向特性

眾數(shù)、中位數(shù)和算術(shù)平均數(shù)是序列的位置度量指標(biāo)。眾數(shù)為序列中出現(xiàn)最多的標(biāo)志值,中位數(shù)為序列的中間值,算術(shù)平均數(shù)是序列值和的平均數(shù)[5]。同時(shí),眾數(shù)、中位數(shù)和平均數(shù)之間的大小關(guān)系反映了序列的偏向特性,它們體現(xiàn)了響應(yīng)變量與影響變量在波動(dòng)變化上的一致性狀態(tài)。偏向上越接近,說明在變化方面接近程度越高,影響變量起促進(jìn)作用;偏向若表現(xiàn)出背離形態(tài)則起反制作用;若響應(yīng)變量與影響變量變化無關(guān)則相關(guān)性較小或不存在相關(guān)性。無論是促進(jìn)還是制約均體現(xiàn)了一定程度的作用,在影響程度上同樣是有價(jià)值的。

分別計(jì)算表2中各序列的眾數(shù)、中位數(shù)和算術(shù)平均數(shù),列于表3。其中,響應(yīng)變量的增量△Y測量值的眾數(shù)、中位數(shù)和算術(shù)平均數(shù)位于第1行,分別表示為ρ,μ,ν;影響變量的增量△Xi測量值的眾數(shù)、中位數(shù)和算術(shù)平均數(shù)位于第2行到第(m+1)行,分別表示為ρi,μi,νi,(i=1~m)。

表3 眾數(shù)、中位數(shù)、算術(shù)平均數(shù)

一般情況下,有三種分布特性,右偏分布(ρi<μi<νi)、左偏分布(ρi>μi>νi)、對稱分布(ρi=μi=νi)。

4.序列極值與波動(dòng)特性指標(biāo)

采用平均離差來反映樣本序列的總體變動(dòng)程度。對表2中的相對數(shù),按照下式(3)計(jì)算每個(gè)序列的平均離差。對應(yīng)響應(yīng)變量,平均離差為:

(3a)

對應(yīng)于影響變量,平均離差為:

(3b)

由于序列為基于差分的相對數(shù)序列,平均離差不僅反映了樣本序列綜合波動(dòng)的大小,而且每一個(gè)序列的離差在數(shù)值上具有可比性,也在一定程度上體現(xiàn)了不同序列之間的波動(dòng)相關(guān)性特征。根據(jù)離差,偏斜程度可以采用三次中心動(dòng)差相對數(shù)來表示。假設(shè)序列中的值具有相等的權(quán)重值,則采用下式(4)計(jì)算偏度值。響應(yīng)變量的偏度值為:

(4a)

影響變量的偏度值為:

(4b)

5.序列的特征模式與相關(guān)度

現(xiàn)將計(jì)算出的眾數(shù)、中位數(shù)、算術(shù)平均數(shù)、離差及偏度作為序列的特征模式。該五元組特征模式體現(xiàn)了序列的偏向特征、極值特征、均值特征和波動(dòng)特征。同時(shí),由于事先通過差分及標(biāo)準(zhǔn)化處理,數(shù)列本身已經(jīng)體現(xiàn)了同一序列之間的差分及相對大小特性。將表3及利用式(3)和式(4)得到的計(jì)算結(jié)果合并成表4,其第1行對應(yīng)響應(yīng)變量,第2行到第(m+1)行則為影響變量的響應(yīng)結(jié)果。

表4 樣本的特征值列表

序列的眾數(shù)、中位數(shù)和平均數(shù)之間的大小關(guān)系反映響應(yīng)變量與影響變量的同向或異向性,這種偏向特性是相關(guān)度的一項(xiàng)重要指標(biāo)。因此,以算術(shù)平均數(shù)為中心增加一個(gè)方向相關(guān)系數(shù),以體現(xiàn)序列偏向的相近程度,定義方向相關(guān)系數(shù):

(i=1~m)

(5)

現(xiàn)利用經(jīng)過改造的歐氏距離計(jì)算相關(guān)度,其表達(dá)式為:

(i=1~m)

(6)

相關(guān)度體現(xiàn)了影響變量對響應(yīng)變量的效用價(jià)值。

四、多元回歸預(yù)測模型

構(gòu)造如下線性回歸模型[6]:

Y=θ0+θ1X1+……+θmXm

(7)

式中,θ0為回歸模型的常數(shù)項(xiàng),系數(shù)θi(i=1~m)反映了各影響變量對響應(yīng)變量的影響權(quán)重,而相關(guān)度反映了各影響變量對響應(yīng)變量的貢獻(xiàn)率。將回歸方程的系數(shù)表示為:

θi=kdi,(i=1~m)

(8)

其中,k為待定參數(shù)。將式(8)代入回歸方程(7),得:

Y=θ0=kd1X1=kd2X2……+kdmXm

(9)

式(9)表明,回歸模型的系數(shù)估計(jì)轉(zhuǎn)換成了求 k之值。利用表1的測量數(shù)據(jù)并使用最小二乘法,有:[5]

(10)

與表1一致,上式(10)中的yj(j=0~n)為響應(yīng)變量Y的測量值,xij為影響變量Xi(i=1~m)的測量值。

(11)

五、 結(jié) 語

系統(tǒng)各因素時(shí)變序列中的波動(dòng)特征蘊(yùn)涵著各因素之間的相關(guān)性,但是在信息效用評(píng)價(jià)分析過程中,需要克服因素過多、結(jié)構(gòu)復(fù)雜等所帶來的計(jì)算與分析難度。為此本文通過兩個(gè)層次的變換來獲得特征模式。通過序列的差分及標(biāo)準(zhǔn)化獲得序列的波動(dòng)時(shí)變序列,使波動(dòng)相關(guān)性分析的數(shù)據(jù)基礎(chǔ)更加客觀可靠,也克服了由于數(shù)據(jù)不同單位、不同大小所帶來的問題;在標(biāo)準(zhǔn)化差分序列基礎(chǔ)上,將序列的極值特征、平均特征、偏向特征、離差特征、偏態(tài)特征作為特征模式構(gòu)建評(píng)價(jià)回歸模型。由此顯著降低信息分析的維數(shù),且由于上述特征在同一序列中具有無關(guān)性,因此分析相對更加客觀可靠。

[1](美)斯?fàn)柼?(美)雷諾茲.信息系統(tǒng)原理[M].張靖,等譯.北京:機(jī)械工業(yè)出版社,2000.

[2]朱曉峰,許發(fā)見.論信息資源轉(zhuǎn)換[J].情報(bào)科學(xué),2006(3):331-337.

[3]麻新純,徐辛酉.基于效用性的歷史檔案情報(bào)價(jià)值實(shí)現(xiàn)[J].檔案學(xué)通訊,2010(3):32-35.

[4]Sharanya Eswaran,David Shur and Sunil Samtani.A metric and framework for measuring information utility in mission-oriented networks[J].Pervasive and Mobile Computing,2011,7(4):416-433.

[5]劉紅云,駱方.應(yīng)用心理統(tǒng)計(jì)學(xué)[M].北京:北京師范大學(xué)出版社,2015.

[6]Ronald E Walpole等.概率與統(tǒng)計(jì)[M].周勇,等譯.北京:機(jī)械工業(yè)出版社,2014.

責(zé)任編校:裴媛慧,孫詠梅

Research on Evaluation Model of Information Utility Based on Timing Correlation

DU Xiao-yan

(Library of Shenzhen University, Shenzhen 518060, China)

The time-related data obtained by processing transaction contain the information with different utility values for supporting prediction and decision-making, and can be used to evaluate utility magnitudes by establishing definite feature patterns. In this paper, the correlations of are analyzed, and the extraction patterns of feature of time series data are studied based on timing and fluctuation characteristics. Built on the difference and relative change of time-varying series, the computation module of correlation degree is constructed between influence variables and response variables by comprehensive utilization of partial state, discrete, correlation, etc..The algorithm reduces the computational complexity ,enhances the reliability of the evaluation, and can be applied to the prediction.

timing characteristics;correlation;feature pattern;information utility;information resource

2016-04-09

杜曉艷,女,江蘇新沂人,主要研究方向?yàn)閳D書館讀者服務(wù)和學(xué)科服務(wù)。

G271.4

A

1007-9734(2016)04-0128-04

DOI:10.19327/j.cnki.zuaxb.1007-9734.2016.04.021

猜你喜歡
平均數(shù)效用差分
加權(quán)平均數(shù)的應(yīng)用
數(shù)列與差分
小學(xué)美術(shù)課堂板書的四種效用
關(guān)注加權(quán)平均數(shù)中的“權(quán)”
平均數(shù)應(yīng)用舉隅
說說加權(quán)平均數(shù)
納米硫酸鋇及其對聚合物的改性效用
中國塑料(2016年9期)2016-06-13 03:18:48
基于差分隱私的大數(shù)據(jù)隱私保護(hù)
幾種常見葉面肥在大蒜田效用試驗(yàn)
玉米田不同控釋肥料效用研討
沁水县| 临安市| 汝阳县| 成安县| 万安县| 孙吴县| 紫阳县| 吴忠市| 舟曲县| 上杭县| 东乌| 五大连池市| 安康市| 阳泉市| 江西省| 嘉祥县| 湖北省| 栾川县| 休宁县| 乐清市| 泊头市| 长宁区| 河曲县| 淳化县| 大渡口区| 广州市| 滨海县| 黄陵县| 新宁县| 深水埗区| 洛南县| 德庆县| 金秀| 黑山县| 邵阳县| 垫江县| 独山县| 安康市| 龙里县| 内乡县| 乐安县|