国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

加入皮爾遜相關系數的局部保持投影方法

2016-11-30 21:37于顏儒
中國科技縱橫 2016年17期

于顏儒

【摘 要】隨著多媒體技術的不斷發(fā)展,基于內容的圖像檢索技術發(fā)展迅猛。本篇文章提供一種面向多媒體信息檢索領域的特征維數約簡技術,它針對多媒體圖像、視頻數據特征維數很高、容易引起“維數災難”的特點,利用檢索結果與查詢之間的相關程度信息,加入皮爾遜相關系數,對傳統(tǒng)的局部保持投影(Local Preserving Projection, LPP)[1]進行了改進,達到了提高維數約簡效果的目的。

【關鍵詞】維數約簡 LPP 皮爾遜相關系數

1 研究背景

隨著信息技術的快速發(fā)展,圖像和視頻等多媒體數據大量涌現,成為人們獲取信息的重要途徑之一。然而,這些數據通常具有高維特性,直接其進行分析和處理會出現如下重要問題:(1)計算復雜度高;(2)存儲代價高昂;(3)維數災難。這些問題嚴重制約多媒體內容分析和檢索。維數約簡是有效解決這些問題的重要方法,其目標是通過對原始數據進行變換而得到的有效的低維表示。維數約簡的定義為給定一批觀察樣本,記作,即包含n個樣本,每個樣本均是D維,根據某個準則,找到數據的低維表示,同時保持數據的幾何結構。

局部保持投影方法能較好解決數據處理中的“維數災難”問題,保持原始數據的拓撲結構不變[2],作為拉普拉斯特征映射的一種線性逼近可以較好的反映樣本的流形結構,已經被廣泛的應用到圖像檢索和圖像修復中。局部保持投影方法有著非常重要的一步是構建所有點的鄰接圖,距離定義為歐氏距離,即相似度的計算。有時在做相似度計算的時候經常會用到皮爾遜相關系數[3],它描述了兩個定距變量間聯(lián)系的緊密程度(線性關系)。在歐式距離的基礎之上加入皮爾遜相關系數,能夠得到更加準確的鄰接圖。

2 加入皮爾遜相關系數的局部保持算法

LPP是一種最近提出的能夠較好保持非線性局部數據特征的線性流形學習算法,它是Laplace-Beltrami算子[4]特征函數的一個線性估計,其目的是保持數據之間原有的相似關系,即原始數據空間上相鄰的數據點在投影后的空間上也保持相應的相鄰關系。LPP算法中的無向圖構造和相似矩陣的建立都需要計算任意兩點之間的距離,最經典的距離計算方式是歐式距離[5],但是歐式距離只是從數據的角度,并沒有考慮到數據本身的結構,不能準確的體現數據間的關系。所以引入了皮爾遜相關系數,提出了加入皮爾遜相關系數的局部保持算法(PCC-LPP)。PCC-LPP能夠更加準確保持每個數據點的近鄰關系,使維數約簡之后的數據更加接近原始數據特征。

皮爾遜相關系數是一種度量兩個變量間相關程度的方法。樣本之間的相關系數一般用表示,計算公式為:

的取值在-1與+1之間,若,表明兩個變量是正相關,即一個變量的值越大,另一個變量的值也會越大,為1時,為完全正相關;若,表明兩個變量是負相關,即一個變量的值越大另一個變量的值反而會越小,為-1時,為完全負相關。在這里我們認為值越大表示兩個樣本的相似程度越高[6][7]。

在計算兩點距離時將皮爾遜相關系數加入到原始的歐式距離中,新的距離計算公式為:

PCC-LPP能夠更加準確的體現數據之間的關系,使得維數約簡算法更加準確。PCC-LPP是對LPP算法的改進,沒有加入其他標注信息,所以依然是一個無監(jiān)督的線性降維算法。

3 實驗結果

從Google搜索引擎上搜索10個查詢主題,包括 “Bike”、“Greet Wall”、“White House”、“Ice cream”、“Football”、“Fish”、“Baby”、“Tree”、“Summer”、“Stars”。分別涉及動物,人物,運動,景物。下載每個主題查詢結果的前500幅圖像,并且為每幅圖像人工標注相關性等級。相關性等級分為三個級:非常相關、一般相關、不相關。實驗前為每個查詢主題選擇一少部分圖像作為訓練圖像,非常相關、一般相關、不相關每組選出若干圖像組成標注樣本集合,其余樣本作為未標注樣本集合。

實驗首先提取圖像的特征向量,然后用不同的維數約簡方法處理圖像特征向量,再用降維之后得到的數據和部分標注的相關性等級進行排序訓練得到排序模型,利用排序模型對所有樣本進行排序,最后評價各個維數約簡算法在重排序中的效果。(如圖1所示)為查詢的初始結果和重排序之后的結果。

參考文獻:

[1]Niyogi X. Locality preserving projections[C]//Neural information processing systems. 2004,16:153.

[2]林晟.人臉圖像特征提取和識別算法研究[D].哈爾濱理工大學,2009.

[3]Derrick T R,Bates B T, Dufek J S. Evaluation of time-series data sets using the Pearson product-moment correlation coefficient[J].Medicine and science in sports and exercise, 1994,26(7):919.

[4]Andreotti A,Vesentini E.Carleman estimates for the Laplace-Beltrami equation on complex manifolds[J].Publications Mathématiques de lIH?S,1965,25(1):81-130.

[5]張忠林,曹志字,李元韜.基于加權歐式距離的k_means算法研究[J].鄭州大學學報:工學版, 2010,31(1):89-92.

[6]王翠茹,田振清.兩隨機變量簡單相關系數圖式的算法設計[J].中國教育技術裝備,2011(006):69-70.

[7]郭洪燕.工業(yè)企業(yè)安全投入與產出模型研究[D].蘭州理工大學,2011.

丰宁| 肥东县| 寻甸| 青海省| 深水埗区| 盐池县| 东莞市| 凤阳县| 南涧| 湖北省| 湘西| 新丰县| 尚义县| 义马市| 怀柔区| 明光市| 华容县| 岐山县| 双柏县| 贞丰县| 会理县| 弥渡县| 耒阳市| 田阳县| 鄂州市| 滨海县| 榆社县| 延边| 武鸣县| 京山县| 闻喜县| 铜川市| 宾阳县| 响水县| 营山县| 长治县| 东源县| 广东省| 鹿邑县| 株洲县| 慈溪市|