秋林
從鋼鐵俠的瀟灑和智慧,到變形金剛的勇敢與堅(jiān)韌,從盜夢(mèng)空間的詭異和震撼,到阿凡達(dá)的宏偉與感動(dòng)?,F(xiàn)代的科幻大片似乎都離不開(kāi)人機(jī)互動(dòng)??萍疾粩喑祟?lèi)感官與計(jì)算機(jī)程序巧妙結(jié)合大步邁進(jìn)。曾經(jīng),我們無(wú)數(shù)次幻想的未來(lái),或許馬上就可以來(lái)到我們的生活中了。
在科技與人文發(fā)展的進(jìn)程中,英特爾無(wú)疑起到了推動(dòng)作用,它讓我們離幻想中的生活越來(lái)越近,同時(shí)也對(duì)人類(lèi)的想像力提出了挑戰(zhàn)。據(jù)國(guó)外媒體報(bào)道,英特爾正式在其近期召開(kāi)的IDF大會(huì)(英特爾開(kāi)發(fā)論壇)上推出了感知計(jì)算軟件開(kāi)發(fā)工具包2013測(cè)試版。雖然,目前我們對(duì)該軟件的了解還僅僅停留在極富科幻色彩的名稱(chēng)上,但是,僅依靠字面意思,我們也可以猜測(cè)到該款軟件的實(shí)質(zhì)功能。據(jù)說(shuō)這種感知計(jì)算軟件是幫助研發(fā)者開(kāi)發(fā)專(zhuān)用應(yīng)用程序的,它可以完美的實(shí)現(xiàn)以下功能:由人類(lèi)通過(guò)語(yǔ)音以及機(jī)器視覺(jué)成功的向計(jì)算機(jī)傳達(dá)出指令,而計(jì)算機(jī)也能夠通過(guò)鍵盤(pán)、鼠標(biāo)以及直接觸摸屏等設(shè)備完整的接收到所有指令信息,經(jīng)過(guò)分析計(jì)算,巧妙的結(jié)合多模式界面,達(dá)到人類(lèi)與計(jì)算設(shè)備互動(dòng)的最終目的。
自計(jì)算機(jī)誕生以來(lái),其應(yīng)用與發(fā)展的速度就始終是令人感嘆與充滿(mǎn)希望的。計(jì)算機(jī)發(fā)展的最終目的也無(wú)外乎是服務(wù)人類(lèi),接收人類(lèi)發(fā)出的指令,給出對(duì)應(yīng)的計(jì)算并輸出結(jié)果不過(guò)是計(jì)算機(jī)最平常的工作流程了。然而,就是在這樣平常的流程中,英特爾看到了巨大的開(kāi)發(fā)潛質(zhì)。鼠標(biāo)、鍵盤(pán)已經(jīng)不能完全滿(mǎn)足人類(lèi)輸入的需求,在不斷的實(shí)踐中,我們總是探索著更為方便而簡(jiǎn)潔的輸入方法,觸摸屏應(yīng)運(yùn)而生。在現(xiàn)代手機(jī)早已不需要鍵盤(pán)這一強(qiáng)大事實(shí)面前,我們更深刻的體會(huì)到,人類(lèi)不必再辛苦的掌握0和1關(guān)系的同時(shí),還要求計(jì)算機(jī)的工作模式不斷地向人類(lèi)的感官和習(xí)慣靠攏。不需要再學(xué)習(xí)枯燥的計(jì)算機(jī)語(yǔ)言,取而代之的是計(jì)算機(jī)“辨識(shí)”人類(lèi)的語(yǔ)言,“分析”人類(lèi)的動(dòng)作,給出精準(zhǔn)的計(jì)算,從而實(shí)現(xiàn)人類(lèi)預(yù)期的目的。英特爾就是在這樣的需求中看到了商機(jī),而這正是英特爾發(fā)展的關(guān)鍵,因?yàn)檠芯亢烷_(kāi)發(fā)這一套科幻電影中才會(huì)頻繁出現(xiàn)的軟件,不僅要組織大量的科研人員和軟件工程師,還要耗費(fèi)大量的財(cái)力物力,投入相當(dāng)長(zhǎng)的時(shí)間和精力。因此,該項(xiàng)目的成功,對(duì)英特爾未來(lái)的發(fā)展十分的重要。
近期人機(jī)互動(dòng)的發(fā)展方向主要集中在語(yǔ)音識(shí)別和機(jī)器視屏兩個(gè)方面。
通過(guò)語(yǔ)音進(jìn)行輸入的研究早已不再新鮮,但至今為止,尚未有可靠而且精準(zhǔn)的系統(tǒng)推出。語(yǔ)音識(shí)別和機(jī)器視覺(jué)都已被廣泛的應(yīng)用于軍事方面,由于9·11事件的影響,美國(guó)政府大力資助此項(xiàng)研究,因而語(yǔ)音識(shí)別技術(shù)也取得了大跨度的發(fā)展,但是由于種種原因,它并未成為平常的主流應(yīng)用。民間的語(yǔ)音識(shí)別技術(shù)也出現(xiàn)了很長(zhǎng)一段時(shí)間,各種新舊版本的Windows都曾預(yù)裝過(guò)語(yǔ)音識(shí)別,但終究因?yàn)樵摷夹g(shù)不能真正的達(dá)到自然互動(dòng)、準(zhǔn)確率較低,而且需要使用耳機(jī),最終沒(méi)能取得成功。
說(shuō)到語(yǔ)音識(shí)別,也并不都是壞消息。在蘋(píng)果iOS和谷歌上,語(yǔ)音識(shí)別技術(shù)就得到了發(fā)展,美中不足的是,該技術(shù)仍未精準(zhǔn)到可以不用鍵盤(pán),它必須要連接到互聯(lián)網(wǎng)才能工作的特點(diǎn),也讓這款語(yǔ)音識(shí)別技術(shù)的發(fā)展受到了不小的限制。微軟研發(fā)的語(yǔ)音識(shí)別在游戲中的使用可圈可點(diǎn),但在跨不同設(shè)備廣泛應(yīng)用時(shí)的不自然,還是局限了其大范圍的發(fā)展。
機(jī)器視覺(jué)的發(fā)展時(shí)間要比語(yǔ)音識(shí)別晚一些,主要是通過(guò)微軟的Kinect才流行起來(lái)的。就如同人要判斷距離時(shí),需要兩只眼睛同時(shí)使用一樣,Kinect也需要使用兩個(gè)攝像頭,通過(guò)不同的視角來(lái)對(duì)人的動(dòng)作進(jìn)行判斷。遺憾的是,這種判斷只是大概的、籠統(tǒng)的,它并不能準(zhǔn)確的檢測(cè)到特定的手指和關(guān)節(jié),而且對(duì)用戶(hù)所在的位置也有一定的要求,這無(wú)疑局限了該技術(shù)的發(fā)展。而計(jì)算資源不能過(guò)于復(fù)雜等條條框框也最終導(dǎo)致微軟這款機(jī)器視覺(jué)軟件不能大規(guī)模的發(fā)展。
機(jī)器視覺(jué)不能簡(jiǎn)單的等同于照相機(jī),它的最終目的不是保存所“看到”的影像,而是最終完成判斷功能。一些電腦制造商,甚至連谷歌的Nexus 7都提供了面部識(shí)別功能,但這種識(shí)別顯得有點(diǎn)低級(jí),它不能很好的分辨出哪個(gè)是真實(shí)的人臉、照片、視頻畫(huà)面還是面具,達(dá)不到機(jī)器視覺(jué)識(shí)別人臉的基本要求。
在高科技手段不斷應(yīng)用于電影的客觀事實(shí)中,我們可以體會(huì)到3D技術(shù)的大規(guī)模發(fā)展不但為電影本身增添了可觀性,更為機(jī)器視覺(jué)提供了新思路。我們所要完成的工作,不過(guò)是3D游戲的逆向工程而已。但是,這仍然需要大量的硬件作為實(shí)現(xiàn)的基礎(chǔ),高分辨率的攝像頭是必不可少的,在給計(jì)算設(shè)備輸入像素信息、多邊形和紋理的同時(shí),也需要大量的處理性能和電力,這不僅僅是要滿(mǎn)足計(jì)算引擎,高分辨率立體攝像頭對(duì)此也有很高的要求,以上步驟完成后,3D“圖”還需要與本地?cái)?shù)據(jù)庫(kù)的圖案進(jìn)行匹配,這也對(duì)計(jì)算性能和電力提出了較高的要求。
在技術(shù)上,即使能夠逐步完善以上所有的不足,英特爾還是需要考慮用戶(hù)的隱私,怎樣既方便用戶(hù)操作使用,又能?chē)?yán)格保守用戶(hù)的秘密,也是該項(xiàng)目要考慮的一個(gè)重點(diǎn)問(wèn)題,這樣我們才不需要擔(dān)心網(wǎng)絡(luò)上是否會(huì)有無(wú)數(shù)雙眼睛盯著自己“穿拖鞋跳探戈”。
雖然,要達(dá)到真正實(shí)現(xiàn)自然、準(zhǔn)確的人機(jī)互動(dòng),還有很長(zhǎng)的一段路要走。但是,現(xiàn)在對(duì)語(yǔ)音識(shí)別和機(jī)器視覺(jué)的初步嘗試,也給未來(lái)帶來(lái)了無(wú)數(shù)的可能性??苹秒娪爸械那楣?jié)將不再僅僅停留在大屏幕上,走下大屏幕的科幻橋段,無(wú)疑會(huì)給我們的生活帶來(lái)更多新鮮的感受。
想像一下,早上被鬧鐘溫柔的叫醒,并根據(jù)一天的活動(dòng)安排和天氣變化設(shè)計(jì)好你的出行計(jì)劃和著裝風(fēng)格;工作中,你不必再辛苦的敲擊鍵盤(pán)和為記不住文件被放在哪個(gè)路徑下而苦惱,取而代之的只是“有事兒您說(shuō)話(huà)”;忙了一整天,想放松一下,不必再繁瑣的一首一首挑選喜歡的歌曲,你的情緒早已被音響察覺(jué),它會(huì)自動(dòng)奉上一段符合心境的音樂(lè);看電視也不必到處尋找遙控器了,動(dòng)動(dòng)手指,所有頻道任你選。
計(jì)算機(jī)已經(jīng)從各個(gè)方面滲透到了人類(lèi)的生產(chǎn)生活中,它在為人類(lèi)服務(wù)的同時(shí),也在不斷地挑戰(zhàn)人類(lèi)的智慧。怎樣把想像變成現(xiàn)實(shí)早已不是新鮮的想法,充分利用計(jì)算機(jī),把人類(lèi)智慧與機(jī)器功能完美結(jié)合已不僅僅是英特爾想要完成的任務(wù)了。在科技公司百家爭(zhēng)鳴、百花齊放的時(shí)代,技術(shù)的發(fā)展也是空前迅速的,相信想像與現(xiàn)實(shí)的界限在未來(lái)的生活里終將不復(fù)存在。