鄧豪, 周一廷, 謝從霜
(西南科技大學(xué) 信息工程學(xué)院,四川 綿陽(yáng)621010)
1950年,圖靈在《心靈》發(fā)表論文“計(jì)算機(jī)器與智力”,給機(jī)器思維下了影響深遠(yuǎn)的定義:“如果自動(dòng)機(jī)能在某些制定的條件下模仿一個(gè)人把問題回答得很好,以致在很長(zhǎng)一段時(shí)間里能夠迷惑提出該問題的人,那么這種自動(dòng)機(jī)就可以認(rèn)為是能夠進(jìn)行思維的”[1]。而現(xiàn)今采用傳統(tǒng)人工智能方法設(shè)計(jì)的機(jī)器人存在無法離線學(xué)習(xí)、任務(wù)確定以及智能擴(kuò)展性差、無法適應(yīng)多變的環(huán)境等多種局限性問題[2]。隨著各學(xué)科技術(shù)的發(fā)展,受到認(rèn)知科學(xué)、神經(jīng)生物學(xué)和心理學(xué)等學(xué)科交叉的啟發(fā),研究人員開始著眼于機(jī)器人認(rèn)知這一新的思路解決上述問題與局限[2]。
類人智能一直是人工智能和機(jī)器人領(lǐng)域的研究目標(biāo)。目前,比較成熟的機(jī)器人主要是應(yīng)用在特定環(huán)境下,針對(duì)于特定任務(wù)而特殊設(shè)計(jì)的機(jī)器人。但隨著對(duì)智能化水平需求的不斷提高,越來越需要能在高度復(fù)雜環(huán)境下工作,執(zhí)行非特定任務(wù)和具有高度自治性的智能機(jī)器人[3]。但當(dāng)工作環(huán)境動(dòng)態(tài)多變時(shí),周邊環(huán)境不完整和不確定的信息會(huì)導(dǎo)致機(jī)器人在執(zhí)行任務(wù)的過程中遇到困難[4]。而目前對(duì)于機(jī)器人在完整周邊環(huán)境信息、任務(wù)完成、學(xué)習(xí)、記憶與遺忘等情況下獲得與產(chǎn)生的大數(shù)據(jù),已經(jīng)難以用現(xiàn)有的數(shù)據(jù)工具進(jìn)行管理利用[9-10]。但這些大數(shù)據(jù)是機(jī)器人通過信息世界認(rèn)識(shí)現(xiàn)實(shí)世界的基礎(chǔ)數(shù)據(jù)和智慧源泉[11],與機(jī)器人應(yīng)用密切相關(guān)[12-13]。因此,如何讓完善機(jī)器人周邊信息及對(duì)于大數(shù)據(jù)的獲取、處理、存儲(chǔ)、讀取、利用是當(dāng)前熱點(diǎn)。
本文通過將生物特性與機(jī)器人學(xué)習(xí)機(jī)制及遺忘機(jī)制聯(lián)系,利用多信息綜合對(duì)周邊環(huán)境進(jìn)行完善,采用數(shù)據(jù)降維與稀疏學(xué)習(xí)的技術(shù)完成大數(shù)據(jù)的處理及信息挖掘,從而提出一種機(jī)器人自主思維模型。
生物在單位時(shí)間內(nèi)與環(huán)境交互的信息量是異常龐大的,且信息相對(duì)于時(shí)間是形式多樣、維度多種的。傳感器類似人與環(huán)境進(jìn)行信息交互的各種媒介,是機(jī)器人與環(huán)境進(jìn)行信息交互的橋梁,但目前各類傳感器處理的是相對(duì)時(shí)間單維、形式單一的信息,且對(duì)環(huán)境信息的復(fù)用性差。這也是機(jī)器人只能在特定環(huán)境下、機(jī)械地完成特定任務(wù),而無法進(jìn)行自主性思維的一個(gè)重要原因。而對(duì)于復(fù)雜和動(dòng)態(tài)多變的工作環(huán)境,周邊環(huán)境不完整和不確定的信息經(jīng)常導(dǎo)致機(jī)器人在執(zhí)行任務(wù)的過程中遇到困難。故機(jī)器人如何更全面地與環(huán)境進(jìn)行信息交互及各類信息融合及復(fù)用是目前機(jī)器人智能化亟待解決的問題。
對(duì)于機(jī)器人與周邊環(huán)境進(jìn)行信息交互,信息量應(yīng)是各類單一信息的有機(jī)結(jié)合,為了盡可能完善周邊信息,而不是針對(duì)特定環(huán)境、特定任務(wù)的單一信息,機(jī)器人與周邊環(huán)境交互信息量可表示為
Y(t)表示機(jī)器人與環(huán)境交互的多維信息量,Xi(t)表示各傳感器傳送至機(jī)器人的單一維度信息向量。由式(1)可知,機(jī)器人在復(fù)雜和動(dòng)態(tài)多變的環(huán)境下,所需要的環(huán)境信息需要多種傳感器共同提供,并且各單一維度信息量相對(duì)于時(shí)間具有一致性,即同一時(shí)刻各類信息有相應(yīng)的映射關(guān)系。機(jī)器人進(jìn)行決策時(shí),同一時(shí)間下的不同環(huán)境信息量(次信息量)對(duì)主信息量具有輔助作用,使事件決策獲得最優(yōu)解。因此,多數(shù)量、全種類的傳感器為機(jī)器人完善周邊信息提供必要條件。
因?yàn)闄C(jī)器人與環(huán)境交互是多維信息量,需要多傳感器從環(huán)境中采集,而目前各傳感器多為單一用途,信息為一維信息量,且機(jī)器人體表面積及負(fù)荷有限。而生物同一信息交互媒介可以完成多種環(huán)境信息交互,故設(shè)計(jì)一種陣列式傳感器,信息采集單元分為散射式與同心式,采用通道復(fù)用及時(shí)間復(fù)用算法,使一種傳感器完成相應(yīng)多維環(huán)境信息交互。
目前數(shù)據(jù)降維分為線性降維和非線性降維,降維方法也多種多樣,而對(duì)于機(jī)器人采集得到的環(huán)境信息,應(yīng)能使數(shù)據(jù)降維之后在思維決策時(shí)快速?gòu)?fù)原,因此需要盡可能地保留數(shù)據(jù)信息,所以采取線性降維的PCA降維方法,文獻(xiàn)[15]列出了其主要算法。假設(shè)對(duì)于環(huán)境信息向量,我們有 m 個(gè)數(shù)據(jù) X1,X2,X3,…,Xm,其中 Xi∈Rn,這些數(shù)據(jù)已經(jīng)被中心歸零化,即
定義其協(xié)方差矩陣
因?yàn)镃為半正定矩陣,對(duì)其進(jìn)行去角化,得
其中 Λ=diag(λ1,λ2,…λn)VVT=1。假設(shè) C 的秩為 p,那么C有個(gè)非零的特征值,記為
我們?nèi)∏発個(gè)特征值所對(duì)應(yīng)的特征向量V1,V2…Vk作為我們的投影方向,那么對(duì)于任何一個(gè)樣本Xi,我們計(jì)算 Yi=Vi,i=1,2,....,k,那么我們可以用[Y1,Y2,…Yk]T來表示樣本Xi,這樣便將數(shù)據(jù)從n維降到k維。當(dāng)k=n=p時(shí),即C滿秩,并且我們?nèi)個(gè)基進(jìn)行投影時(shí),PCA就相當(dāng)于對(duì)坐標(biāo)系進(jìn)行了正交變換。
PCA主要思想是將數(shù)據(jù)向使得投影方差較大的方向投影,這樣可以盡可能地保留數(shù)據(jù)信息,可以用圖1說明。對(duì)于機(jī)器人與環(huán)境信息交互,在機(jī)器人思維決策,需要盡可能完整復(fù)原原信息來說,PCA是有很明確的物理意義的。
圖1 PCA示意圖
稀疏是感知的重要特征之一,稀疏學(xué)習(xí)只需要少量的觀察值和特征集合就能夠很好的對(duì)高維數(shù)據(jù)進(jìn)行處理分析,這將克服傳統(tǒng)的信號(hào)表示中由于基函數(shù)的正交性和完備性帶來的缺陷[16]。機(jī)器人在與環(huán)境進(jìn)行信息交互及思維決策時(shí),需要快速讀取記憶庫(kù)數(shù)據(jù)并進(jìn)行匹配,因此處理的數(shù)據(jù)量應(yīng)盡量小,從而保證響應(yīng)速度,因此需要對(duì)少量觀察值及特征值進(jìn)行處理。根據(jù)機(jī)器人與周邊環(huán)境進(jìn)行信息交互的特征,對(duì)比各種稀疏學(xué)習(xí)算法,應(yīng)用文獻(xiàn)[17]中Sparse K_SVD算法進(jìn)行稀疏學(xué)習(xí)。
任意長(zhǎng)度為N的一維信息Xi∈RN,通過冗余字典D∈RN×K,可稀疏表示為
素心道:“就為二阿哥認(rèn)床,主子不是囑咐乳母把潛邸時(shí)二阿哥睡慣的床挪到了阿哥所么?宮里又足足添了十六個(gè)乳母嬤嬤照應(yīng),斷不會(huì)有差池的。”
式中:α為信息的稀疏表示系數(shù),為K×1的向量;dk為給定冗余字典D中的一個(gè)原子;αk為α向量中與dk相對(duì)應(yīng)的值。信息的稀疏表示是從冗余字典中選擇具有最佳線性組合的若干原子來表示信號(hào),實(shí)際上是一種逼近過程,從稀疏逼近角度出發(fā),希望在逼近殘差達(dá)到最小的情況下得到α最稀疏的一個(gè)解,這等同于解決下述問題:
考慮機(jī)器人與環(huán)境交互信息為加性信息,其單一維度信息模型表示如下:
式中:Xi為原始信息;Xt為特征信息;Xz為雜散信息。根據(jù)式(6)從冗余字典D中選取最佳線性組合的若干原子來表示原始信息Xi,當(dāng)逼近殘差足夠小時(shí),利用式(6)求解的稀疏矩陣,通過重構(gòu)的和特征信息Xt近似,從而把特征信息從信息中提取出來。
按照人工智能大師H.Simon的觀點(diǎn),機(jī)器學(xué)習(xí)就是系統(tǒng)在不斷重復(fù)的過程中對(duì)本身能力的增強(qiáng)或改進(jìn),使得系統(tǒng)再執(zhí)行同樣或類似的任務(wù)時(shí),會(huì)比原來做得更好或效率更高。機(jī)器學(xué)習(xí)是一個(gè)有特定目的的知識(shí)獲取過程,其內(nèi)部表現(xiàn)為從未知到已知這樣一個(gè)知識(shí)增長(zhǎng)過程,其外部表現(xiàn)為系統(tǒng)的某些性能和適應(yīng)性的改善,使得系統(tǒng)能夠完成原來不能完成或更好地完成原可以完成的任務(wù)。機(jī)器學(xué)習(xí)旨在如何使機(jī)器通過識(shí)別和利用現(xiàn)有知識(shí)來獲取新知識(shí)的技能,既要注重知識(shí)本身的增加,也注重獲取知識(shí)的技能的提高[14]。
傳統(tǒng)機(jī)器學(xué)習(xí)算法如圖2所示,其對(duì)當(dāng)前周邊信息進(jìn)行的思維決策根據(jù)主要來自于知識(shí)庫(kù)以及當(dāng)前環(huán)境信息,但其機(jī)器學(xué)習(xí)知識(shí)來自于當(dāng)前環(huán)境信息,而未與知識(shí)庫(kù)構(gòu)成反饋。改進(jìn)后機(jī)器學(xué)習(xí)模型如圖3所示。機(jī)器人思維決策根據(jù)來自于當(dāng)前環(huán)境信息,機(jī)器人知識(shí)學(xué)習(xí)由知識(shí)庫(kù)與學(xué)習(xí)行為構(gòu)成反饋閉環(huán),再與當(dāng)前環(huán)境信息共同影響機(jī)器人學(xué)習(xí)行為。使其得到更好的決策結(jié)果,且機(jī)器人進(jìn)行思維決策之后,對(duì)知識(shí)庫(kù)中的知識(shí)有重學(xué)習(xí)及重記憶的反饋過程。
圖2 傳統(tǒng)機(jī)器人學(xué)習(xí)模型
圖3 改進(jìn)機(jī)器學(xué)習(xí)算法
根據(jù)生物特性,生物對(duì)于信息的記憶性主要由信息的重要性、使用頻率、經(jīng)過時(shí)間來決定。人對(duì)環(huán)境信息以及新學(xué)習(xí)知識(shí)對(duì)于經(jīng)過時(shí)間的遺忘規(guī)律有著名的艾賓浩斯遺忘曲線,即遺忘在學(xué)習(xí)之后立即開始,而且遺忘的進(jìn)程并不是均勻的。最初遺忘速度很快,以后逐漸緩慢,保持和遺忘是時(shí)間的函數(shù)。設(shè)記憶后經(jīng)歷了時(shí)間t0,則記憶量為
可見,生物的記憶對(duì)于時(shí)間是指數(shù)性反比關(guān)系,而指數(shù)型數(shù)據(jù)處理難度較大,對(duì)機(jī)器人的信息響應(yīng)速度影響也較大,故對(duì)于機(jī)器人記憶相對(duì)于時(shí)間采用線性反比性函數(shù)關(guān)系,設(shè)機(jī)器人記憶后經(jīng)歷了時(shí)間t0,記憶量為
如式(7)及式(8),Xi(t+t0)為經(jīng)過t0后記憶庫(kù)中的信息,Xi(t)為原始信息,k為時(shí)間比例系數(shù),其取值由擬合逼近使式(8)與式(7)殘差最小化。
對(duì)于信息使用頻率對(duì)機(jī)器人記憶庫(kù)中信息的影響,具有時(shí)間一致性的各信息,使用頻率越大,在經(jīng)過同樣時(shí)間后,記憶庫(kù)中信息量各異,使用頻率對(duì)機(jī)器人記憶庫(kù)信息的影響為正向性關(guān)系。如經(jīng)過時(shí)間對(duì)機(jī)器人記憶庫(kù)影響,建立線性正比關(guān)系:
式中:Xi(t)為記憶庫(kù)原始信息;Fu為該信息被機(jī)器人使用頻率;m為頻率系數(shù),根據(jù)信息不增性,應(yīng)滿足mFu≤1。
由上述,信息的重要性對(duì)記憶庫(kù)中信息也有影響,信息重要性分為相對(duì)重要性及絕對(duì)重要性。某一信息量若具有絕對(duì)重要性,那么對(duì)其他信息量具有信息屏蔽(信息阻塞)作用。某一信息具有相對(duì)重要性,那么相對(duì)其他信息量在機(jī)器人進(jìn)行多信息綜合決策具有優(yōu)先權(quán)。令X0(t)為標(biāo)記信息量,對(duì)各信息量重要性進(jìn)行線性加權(quán),則
式中:PXi(t)為信息量Xi(t)的相對(duì)重要性;qi為其相對(duì)比例系數(shù),若其具有絕對(duì)重要性,則qi>>1。
生物的思維可建立成如下模型,環(huán)境信息刺激,生物對(duì)信息分析,思維決策,信息學(xué)習(xí)、記憶或重記憶,其具體模型如圖4所示。根據(jù)生物思維模型,機(jī)器人思維模型如圖5所示,機(jī)器人獲得的環(huán)境信息,是具有時(shí)間一致性的各單一維度信息集合,經(jīng)過分解成單一維度信息向量,再經(jīng)過單一維度信息向量的信息降維,減少數(shù)據(jù)計(jì)算量,然后經(jīng)過適合機(jī)器學(xué)習(xí)的K_SVD稀疏算法,并結(jié)合機(jī)器人記憶庫(kù)中的的已有知識(shí),進(jìn)行當(dāng)前信息的思維決策、機(jī)器人學(xué)習(xí)以及記憶庫(kù)的完善等。對(duì)于機(jī)器人存在的遺忘機(jī)制,對(duì)于信息缺失,信息遺忘等問題,由記憶庫(kù)完善及機(jī)器人再學(xué)習(xí)及重記憶完成。
圖4 生物思維模型
圖5 機(jī)器人思維模型
提出了一種機(jī)器人自主思維方法,根據(jù)生物特性,結(jié)合PCA降維方法及Sparse K_SVD算法,建立機(jī)器人學(xué)習(xí)機(jī)制及遺忘機(jī)制,解決傳統(tǒng)機(jī)器人無法離線學(xué)習(xí)、任務(wù)確定以及智能擴(kuò)展性差、無法適應(yīng)多變的環(huán)境等多種局限性問題,有效提升了機(jī)器人的實(shí)用性及智能性。
[1] 陳巍.聚焦“機(jī)器思維”的跨學(xué)科思維盛宴[J].科技導(dǎo)報(bào),2011,29(14):80.
[2] 翟心昱.基于仿人腦認(rèn)知計(jì)算模型的機(jī)器人視覺學(xué)習(xí)方法[D].杭州:浙江工業(yè)大學(xué),2012.
[3] 張麗.基于HTN方法的記憶機(jī)器人任務(wù)規(guī)劃研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[4] United Nations Global Pulse.2012,Big Data for Development:Challenges&Opportunities[R].2012.
[5] Office of Science and Technology Policy.Executive Office of the President.2012,F(xiàn)act Sheet:Big Dataacrossthe Federal Government[R/OL].[2012-12-21].Http://www.whiteHouse.gov/Ostp.
[6] Office of Science and Technology Policy.Executive Office of the President.2012,Obama Administration Unveils “Big Data”Initiative:Announces$200 Million in New R&D Investments[R/OL].[2012-03-19].http://WWW.WhiteHouse.gov/OSTP.
[7] Mckinsey Global Institute.2011 Big Data the Next Frontier for Innovation,Competition,and Productivity[R].2011.
[8] Rajaraman A,Ullman J D.Mining of Massive Data-sets[M].Cambridge:Cambridge University Press,2011.
[9] Lapkin A.Hype Cycle for Big Data[R].Gartner,Inc.2012.
[10] Miller H J,Han J.Geographic Data Mining and Knowledge Discovery[M].London:Taylor and Francis,2009.
[11] Barabasi A L.Bursts:The Hid den Patterns Behind Everything We Do[M].Plume Books,2011.
[12] 舍恩伯格,庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
[13] 李健宏.人工智能中的機(jī)器學(xué)習(xí)研究及其應(yīng)用[J].江西科技師范學(xué)院學(xué)報(bào),2004(5):84-86.
[14] 馬小龍.數(shù)據(jù)降維方法綜述[D].北京:清華大學(xué),2005.
[15] 宋彩風(fēng),劉偉鋒,王延江.基于稀疏學(xué)習(xí)的人臉表情識(shí)別[J].山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,32(3):28-34.
[16] 黃玲,李琳,王薇,等.基于Sparse K-SVD學(xué)習(xí)字典的語音增強(qiáng)方法[J].廈門大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,53(1):36-40.