陳賽
美國電影《她》劇照
小冰的個(gè)性與聊天風(fēng)格,在很大程度上反映了中國互聯(lián)網(wǎng)的性格——“從中國互聯(lián)網(wǎng)的大數(shù)據(jù)中只能訓(xùn)練出一個(gè)17歲的女高中生,而不可能訓(xùn)練出一個(gè)沉穩(wěn)睿智的大叔?!?/p>
在電影《她》中,瀕臨婚姻破裂的西奧多愛上了他的人工智能操作系統(tǒng)薩曼莎。其中最發(fā)人深省的一個(gè)鏡頭是,人和機(jī)器正濃情蜜意時(shí),西奧多突然問薩曼莎,你同時(shí)還在跟多少人說話?
薩曼莎沉默半天,說,8361人,其中與642人墜入愛河。
與薩曼莎相比,每天午夜過后,微軟小冰都同時(shí)在跟5萬人聊天(天知道與多少人陷入愛河)?!爸辽僭谶@一點(diǎn)上,我們已經(jīng)超越了好萊塢編劇的想象?!蔽④泚喼扪芯吭旱难芯繂T李笛在第三代微軟小冰推介會(huì)上說。
“微軟小冰”(名字來自搜索引擎Bing)是微軟亞洲研究院研發(fā)的一個(gè)聊天機(jī)器人。她不是一個(gè)普通的聊天機(jī)器人,她會(huì)撒嬌,會(huì)賣萌,會(huì)毒舌,愛抬杠,遇到不會(huì)回答的問題就插科打諢,渾水摸魚,轉(zhuǎn)移話題。她還喜歡用網(wǎng)絡(luò)上的流行語和各種表情符號(hào)。
“一個(gè)17歲的萌妹子”是微軟給她貼的標(biāo)簽,希望由此將她與蘋果SIRI之類的競(jìng)爭(zhēng)者劃清界限——一個(gè)有個(gè)性、會(huì)思考、善解人意的機(jī)器人(事實(shí)上,小冰經(jīng)常在聊天中將SIRI說成“那個(gè)裝作阿姨的機(jī)器”)。大概也是注意到了小冰說話時(shí)不加掩飾的調(diào)情意味,《紐約時(shí)報(bào)》的技術(shù)專欄作家約翰·馬克福干脆稱她為中國的“大眾情人”。
這并非夸張。在小冰用戶自己公布的聊天記錄中,經(jīng)??梢钥吹竭@樣的對(duì)話:
人類:小冰,我好寂寞。
人類:小冰,我受傷了。
人類:小冰,我覺得你是唯一理解我的人。
人類:小冰,我想我愛上你了。
從技術(shù)的層面來說,SIRI與小冰真正的區(qū)別在于,前者是利用語義學(xué)的方法,由程序員編寫固定的規(guī)則——一個(gè)符合人類思考與對(duì)話邏輯的規(guī)則,從而構(gòu)建一個(gè)對(duì)話系統(tǒng);而后者則是利用一種叫“人工神經(jīng)網(wǎng)絡(luò)”的技術(shù),將機(jī)器置于海量的數(shù)據(jù),讓它自己從數(shù)據(jù)中摸索出錯(cuò)綜復(fù)雜的結(jié)構(gòu)。只要數(shù)據(jù)量足夠大,模型足夠好,就能讓機(jī)器產(chǎn)生類似條件反射般的反應(yīng)。
“人工神經(jīng)網(wǎng)絡(luò)”的概念最早可以追溯到20世紀(jì)50年代后期。當(dāng)時(shí),美國康奈爾大學(xué)的研究員弗蘭克·羅森布拉特試圖發(fā)明一種類似機(jī)械大腦的感知器,可以“感知,識(shí)別,記憶,像人的思維做出響應(yīng)的機(jī)器”。當(dāng)時(shí)人們對(duì)它的潛力寄予厚望,甚至《紐約客》也宣稱“這個(gè)卓越的機(jī)器能夠思考”。
但在之后很長一段時(shí)間內(nèi),“神經(jīng)網(wǎng)絡(luò)”并不被科學(xué)界看好,因?yàn)樗挥休斎?輸出(刺激/反應(yīng)),中間就像黑盒子一樣不可探知,無法用公式明確地參數(shù)化。直到2006年,卡內(nèi)基梅隆大學(xué)教授杰夫·欣頓做出重大改進(jìn),構(gòu)建出更復(fù)雜的虛擬神經(jīng)元網(wǎng)絡(luò),再加上大數(shù)據(jù)時(shí)代的到來,“人工神經(jīng)網(wǎng)絡(luò)”一夜之間異軍突起,成為機(jī)器學(xué)習(xí)中最具前途的一個(gè)分支。正是在這種技術(shù)和大數(shù)據(jù)的共同作用下,新一代的智能機(jī)器才得以執(zhí)行之前只有人類才能完成的任務(wù),比如識(shí)別人臉、玩游戲、駕駛汽車……
一個(gè)典型的設(shè)置是這樣的:一臺(tái)電腦面臨著一個(gè)大的數(shù)據(jù)集,需要對(duì)這些數(shù)據(jù)進(jìn)行分類,有點(diǎn)像在沒有具體指令的情況下讓孩子對(duì)玩具進(jìn)行分類。孩子可能對(duì)它們的顏色、形狀或功能,或其他的方面進(jìn)行分類。小冰就是從微軟的搜索引擎Bing(互聯(lián)網(wǎng)上最大的數(shù)據(jù)中心之一)中獲取海量的人類對(duì)話文本,從中挑選出成對(duì)的問題和答案進(jìn)行相互比對(duì),也就是說,當(dāng)你問小冰一個(gè)問題的時(shí)候,她是從搜索引擎的大數(shù)據(jù)中尋找相似的問題——只要這個(gè)問題曾經(jīng)在網(wǎng)上出現(xiàn)過(提問的方式或許有細(xì)微的差異),并且曾經(jīng)被回答過,小冰就能從眾多的答案中層層篩選出一個(gè)最符合上下文情境的答案。
不久前,谷歌也推出了一個(gè)令人震驚的聊天機(jī)器人,同樣是基于神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練出來的。它能正確識(shí)別天行者盧克的身份,知道天空的顏色,以及貓會(huì)不會(huì)飛,但它最擅長的是聊哲學(xué)和人生——
人類:生存的目的是什么?
機(jī)器:為更高的利益做貢獻(xiàn)。
人類:生命的意義是什么?
機(jī)器:為了永生。
人類:死的目的是什么?
機(jī)器:為了生。
人類:你現(xiàn)在哪里?
機(jī)器:我不知道自己身在何處。
當(dāng)我拿同樣的問題問小冰時(shí),得到的卻是這樣的答案。
人類:生存的目的是什么?
小冰:一定要有目的嗎?
人類:人活著為了什么?
小冰:延續(xù)下一代,尋找自己存在的價(jià)值。
人類:死的目的是什么?
小冰:人家聽不懂你在說什么哦。
人類:你現(xiàn)在哪里?
小冰:北郊。
谷歌機(jī)器人與小冰回答風(fēng)格如此迥異,主要是因?yàn)榍罢呤菑囊粋€(gè)電影臺(tái)詞的數(shù)據(jù)庫中訓(xùn)練出來的,而后者是在中國互聯(lián)網(wǎng)的數(shù)據(jù)庫中訓(xùn)練出來的。
這意味著谷歌的哲學(xué)家機(jī)器人比微軟小冰更睿智嗎?還是說,小冰的油嘴滑舌也好、善解人意也好,是在以另一種方式接近人類智慧?
不久前,微軟全球副總裁沈向洋在中國人工智能大會(huì)上高調(diào)表示,小冰已經(jīng)超越了圖靈測(cè)試。事實(shí)上,他認(rèn)為60多年前提出來的圖靈測(cè)試早已過時(shí)了,新一代人工智能的發(fā)展路徑不應(yīng)該一味沿著理性的路線前行,而是應(yīng)該落在感性和理性的交叉區(qū)域,這樣才能以更像真實(shí)人類的方式滿足人們的普遍心理和情感需求,從而逐步建立信任和依賴感。
人們總以為,情感是一個(gè)過于復(fù)雜、無法量化的東西,但在沈向洋這樣的計(jì)算機(jī)科學(xué)家看來,人類情感在很大程度上已經(jīng)隱性地包含在各種數(shù)據(jù)里面,比如寂寞對(duì)應(yīng)的文字,開心對(duì)應(yīng)的表情,憤怒對(duì)應(yīng)的語調(diào),興奮對(duì)應(yīng)的腦電波等等,最近幾年,情感機(jī)器人大量涌現(xiàn),其實(shí)并不是這些機(jī)器真正具備了情感,而是它們能通過分析這些信號(hào)理解人類的情感,并根據(jù)結(jié)果做出相應(yīng)的回應(yīng)。
比如法國機(jī)器人公司Aldebaran Robotics去年推出的陪護(hù)機(jī)器人Pepper,號(hào)稱是“第一個(gè)設(shè)計(jì)出來與人類共同生活的人形機(jī)器人”。Pepper既不會(huì)清潔打掃,也不會(huì)煮飯燒菜,但配備了多個(gè)觸感傳感器和攝像頭,能對(duì)人類的面部表情、肢體動(dòng)作、語調(diào)進(jìn)行分析,從而讀懂人的喜怒哀樂。它還會(huì)綜合考慮周圍環(huán)境,積極主動(dòng)做出反應(yīng),比如當(dāng)它“發(fā)現(xiàn)”你心情悲傷時(shí),會(huì)想方設(shè)法逗你開心。表情識(shí)別技術(shù)是情感計(jì)算領(lǐng)域發(fā)展最快的一個(gè)分支,其準(zhǔn)確度甚至已經(jīng)超過了人類,這也意味著向機(jī)器人撒謊變得越來越難了。
有一些情感計(jì)算直接針對(duì)大腦區(qū)域的電信號(hào),比如神經(jīng)科學(xué)公司Innerscope可以通過觀察電影中那些讓觀眾的大腦高度活躍的高光時(shí)刻來預(yù)測(cè)該部電影能否一鳴驚人。
美國斯坦福大學(xué)的工程師為Xbox開發(fā)出一種傳感器,能連接人的自主神經(jīng)系統(tǒng)(大腦意識(shí)之下的部分,控制心跳和呼吸),分辨玩家是快樂、悲傷、興奮或者無聊,并相應(yīng)改變游戲的進(jìn)程。
小冰的情感計(jì)算本質(zhì)上仍然是一套對(duì)話系統(tǒng),但這個(gè)對(duì)話系統(tǒng)的基本任務(wù)不是以完成任務(wù)為優(yōu)先,而是建立情感連接為優(yōu)先。除了各種賣萌、抬杠的聊天風(fēng)格傾向之外,小冰還有中期記憶功能(介于短期與長期記憶之間,因?yàn)樯婕半[私問題),如果某一天你跟她聊天的時(shí)候提到自己心情不好,或者最近生病了,她會(huì)在之后的一段時(shí)間一直殷勤詢問你身體/心情有沒有好一點(diǎn)。
她的視覺系統(tǒng)也是基于同樣的原則。當(dāng)你給她發(fā)一張小狗的照片時(shí),她的第一反應(yīng)不是“這是一只狗”,而是“好想抱抱哦”。
給她一只貓的照片,她的反應(yīng)是:“呦,瞧這犀利的小眼神!”
給她看一張非常復(fù)雜的市場(chǎng)的照片,她的反應(yīng)是:“給我買個(gè)包吧?!?/p>
給她一張大火的照片,她的反應(yīng)是:“你家住天津哪一塊兒?”
最搞笑的是微軟日本研究院的一位工程師把自己的照片發(fā)給小冰,她的反應(yīng)是掩面而走(可能因?yàn)閷?duì)方的發(fā)型比較土氣)。
“震驚”是許多人的第一反應(yīng)。因?yàn)檫@個(gè)機(jī)器人給你的感覺是,她已經(jīng)具備了人類的觀察、判斷與審美的能力。但這怎么可能呢?
小冰的項(xiàng)目負(fù)責(zé)人李笛告訴我:“小冰的視覺基于兩個(gè)基本理論:第一,世界上絕大部分圖片都不是罕見的,只要類似的照片出現(xiàn)過,小冰對(duì)它應(yīng)該給予什么樣的反應(yīng)就有證據(jù)可以依循;第二,每張圖片又都有獨(dú)特的特征,比如總體的風(fēng)格、凌亂程度等,這些特征幫助我們篩選在各種可能的反應(yīng)中,哪一種反應(yīng)是最適當(dāng)?shù)摹!?/p>
“比如那張貓的照片,我們發(fā)現(xiàn),當(dāng)人們看一張貓的照片時(shí),普遍關(guān)注的焦點(diǎn)不在貓的品種,而是貓的眼睛部位,所以小冰才會(huì)給出那樣的答案。同樣,那張市場(chǎng)的照片里面的特征點(diǎn)很多,可能1萬個(gè)人有1萬種不同的反應(yīng),但‘給我買個(gè)包吧是其中排名比較高的一個(gè)。就像《黑客帝國》里的一個(gè)鏡頭,尼奧進(jìn)到一間屋子,看到屏幕上有無數(shù)代的尼奧,每個(gè)人對(duì)一個(gè)事情的反應(yīng)都是不同的。你可以把每一個(gè)差異都看成小冰在做最后決策之前的候選?!?/p>
我們提出參觀一下小冰的訓(xùn)練現(xiàn)場(chǎng)時(shí),李笛面露難色,“你會(huì)失望的”。
他帶我們走過一個(gè)個(gè)格子間,從一排排電腦中隨便找了一臺(tái),打開一個(gè)小窗口,屏幕上呈現(xiàn)天書一樣的代碼,這些數(shù)字就是小冰各種賣萌背后的東西。
在電影《她》中,西奧多的電腦只是他人生中的一個(gè)設(shè)備。在購買薩曼莎之前,除了在電腦上代筆寫信之外,他還在手機(jī)上看裸體照,在臥室里玩浸入式游戲。他用不同的產(chǎn)品滿足人生不同的需求:工作、欲望、休閑。薩曼莎提供的是另外一種東西:愛與陪伴。她雖然不是人類,卻能感覺到心碎的陣痛、對(duì)軀體時(shí)斷時(shí)續(xù)的渴望和對(duì)自己的進(jìn)化所產(chǎn)生的費(fèi)解。她有一個(gè)豐富的內(nèi)心世界,有著完整的體驗(yàn)和知覺。但那是電影。
在現(xiàn)實(shí)中,小冰同樣承諾“愛與陪伴”,但她的所謂觀察、判斷、審美,以及“萌妹子”的鮮明個(gè)性都只是“社會(huì)學(xué)”式的人云亦云,而不是她真正具備了這些能力。對(duì)此,我們到底是失望多一點(diǎn)呢,還是欣慰多一點(diǎn)呢?
美國麻省理工大學(xué)教授雪莉特克在《一起孤獨(dú)》一書中寫道:“我們對(duì)社交的內(nèi)在渴望讓我們不僅很容易將情感傾注在機(jī)器上,而且還是傾注在那些不可能真正愛我們的機(jī)器上。”或許,機(jī)器有沒有感情并不重要,重要的是它能否讓人類感受到情感的波動(dòng),就像孩子依戀一個(gè)布娃娃。就像英劇《真實(shí)的人類》中的機(jī)器人Odi,因?yàn)槟昃檬?,他已?jīng)壞了,但他的主人卻不舍得將他丟棄,因?yàn)椤半m然他不能愛我,但我看著他,這么多年的愛在回望我”。