国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

聽風(fēng)者

2016-10-18 17:39:29鄭晶敏
第一財(cái)經(jīng) 2016年38期
關(guān)鍵詞:歐文斯物體人工智能

鄭晶敏

在好萊塢電影《她》中,人工智能系統(tǒng)OS1不僅擁有迷人的聲線,還具備理解人類情感的能力。這個(gè)時(shí)而溫柔時(shí)而幽默的人工智能系統(tǒng),讓男主人公西奧多甚至無(wú)法分清“她”與人類的區(qū)別。

盡管現(xiàn)在的人工智能還達(dá)不到電影里以假亂真的程度,但至少讓人工智能理解聲音已經(jīng)成為可能。

來(lái)自麻省理工學(xué)院(MIT)計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的安德魯·歐文斯(Andrew Owens)正在研究一款視頻訓(xùn)練系統(tǒng)(Visually Indicated Sounds,簡(jiǎn)稱VIS)。它通過(guò)學(xué)習(xí),不僅理解人類世界中的聲音,以達(dá)到和物理世界互動(dòng)的效果,甚至,還可以自行模擬出聲音。

在一次實(shí)驗(yàn)中,歐文斯播放了兩個(gè)內(nèi)容相同的視頻。其中一個(gè)視頻的聲音由人工智能系統(tǒng)合成。受試者需要在觀看后分辨出擁有真實(shí)聲音的視頻。結(jié)果顯示,受試者選擇偽造聲音的次數(shù)是真實(shí)聲音的兩倍,尤其是聲音與樹葉、泥土等室外物體有關(guān)的時(shí)候。

歐文斯的實(shí)驗(yàn)分明是在模仿著名的圖靈測(cè)試。

1950年,英國(guó)計(jì)算機(jī)科學(xué)家艾倫·圖靈曾提出了一個(gè)關(guān)于判斷計(jì)算機(jī)能否思考的實(shí)驗(yàn)。他對(duì)人工智能的定義是:如果一臺(tái)機(jī)器能夠與人類對(duì)話而不能被辨別出其機(jī)器身份,那么這臺(tái)機(jī)器具有智能。這個(gè)假設(shè)證明了人工智能的可行性,艾倫·圖靈也因此被稱為“人工智能之父”。只不過(guò)當(dāng)時(shí)的對(duì)話還是使用計(jì)算機(jī)語(yǔ)言,而現(xiàn)在,人工智能已經(jīng)可以用人類語(yǔ)言甚至自然聲音直接和人對(duì)話或者傳遞信息了。

人工智能可以通過(guò)多種感官和人類世界互動(dòng),比較容易習(xí)得的是文本和圖像。而關(guān)于如何讓人工智能學(xué)習(xí)聲音的研究,最早是在20年前開始的。

神經(jīng)網(wǎng)絡(luò)(Neural Network)—一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的計(jì)算模型,曾被用于解決機(jī)器視覺和語(yǔ)音識(shí)別等問題,它們都是很難用基于傳統(tǒng)規(guī)則的編程解決的問題。隨著時(shí)間推移,人工智能需要應(yīng)對(duì)更加龐雜的學(xué)習(xí)任務(wù),人類對(duì)它的要求也發(fā)生了變化。這催生了“深度學(xué)習(xí)”算法。比較常見的人工智能在聲音方面的應(yīng)用或許是一些音樂軟件的聽音識(shí)曲功能,它們通過(guò)某一個(gè)音樂片段找到對(duì)應(yīng)的單曲,這是人工智能對(duì)聲音學(xué)習(xí)能力的初級(jí)表現(xiàn)。

同樣基于“深度學(xué)習(xí)”算法的VIS智能系統(tǒng)則更進(jìn)了一步。在實(shí)驗(yàn)中,歐文斯他們將4.6萬(wàn)種初始聲音制作成1000條有內(nèi)容的視頻。這些聲音由同一根木棍與不同物體以多種方式碰撞產(chǎn)生,從而保證所有的聲音都是用同一個(gè)方式發(fā)出的。研究人員將這些視頻輸入視頻訓(xùn)練系統(tǒng),“深度學(xué)習(xí)”算法就會(huì)解構(gòu)視頻中的聲音,并分析和記錄不同撞擊下各種音色、音強(qiáng)和頻率的物理特征,比如木棍拂動(dòng)樹葉的聲音或是木棍敲擊地面的聲音,并存入數(shù)據(jù)庫(kù)中。

隨后,當(dāng)系統(tǒng)再接收到一個(gè)無(wú)聲視頻時(shí),“深度學(xué)習(xí)”算法就能在觀看視頻后,從這個(gè)數(shù)據(jù)庫(kù)中檢索出和視頻畫面匹配的各種音色、音強(qiáng)的聲音片段,并制作成一段連續(xù)的音頻。

“如今,人工智能除了要擁有智商,還必須具備情商。”微軟語(yǔ)音助手小冰項(xiàng)目總負(fù)責(zé)人李笛對(duì)《第一財(cái)經(jīng)周刊》說(shuō)。歐文斯的項(xiàng)目獲得了微軟研究院的資助。其中的關(guān)鍵是要讓系統(tǒng)看懂視頻,也就是說(shuō),VIS的深度學(xué)習(xí)技術(shù)融合了聲音和視覺,它知道每一幀畫面有哪些物體發(fā)生了什么樣的事情,并懂得通過(guò)它們的物理特征匹配相應(yīng)的聲音。包括語(yǔ)音和視頻在內(nèi)的流媒體則是人工智能學(xué)習(xí)中最困難的部分。在以往的學(xué)習(xí)過(guò)程中,人工智能只能單獨(dú)進(jìn)入接受信息或發(fā)送信息的狀態(tài),但學(xué)習(xí)流媒體時(shí),接收和發(fā)送兩者需要并存?!熬拖裨诤土硪粋€(gè)人打電話,人工智能真正發(fā)揮了溝通功能?!崩畹颜f(shuō)。

學(xué)會(huì)溝通是人工智能與人類建立聯(lián)系的第一步,也是其一切商業(yè)應(yīng)用的基礎(chǔ)。人類可以用人工智能幫自己叫外賣或者播視頻,這在技術(shù)上并不難實(shí)現(xiàn)。但只有當(dāng)它能獲得人的信任,如電影《她》中的OS1一樣,成為與人類世界平行的第三極的存在,商業(yè)需求才是穩(wěn)定的。因此“情商”成了人工智能學(xué)習(xí)的另一個(gè)內(nèi)容。

人工智能學(xué)習(xí)聲音的過(guò)程與嬰兒類似,都是在頻繁接觸某一物體后找出規(guī)律,然后形成幾種潛在的學(xué)習(xí)方案,最后保留效率最高的一種。不同于嬰兒有意識(shí)地完成學(xué)習(xí)過(guò)程,人工智能完全憑借經(jīng)驗(yàn)學(xué)習(xí)。比如贏了圍棋大師李世石的Alpha Go,其實(shí)并不知道自己在下圍棋。

但這并不妨礙人工智能完成學(xué)習(xí)聲音的任務(wù)。事實(shí)上,在某些領(lǐng)域,人工智能對(duì)聲音的理解程度已經(jīng)超過(guò)了人類?!吧疃葘W(xué)習(xí)算法可以通過(guò)聲音判斷物體的形狀和材質(zhì)?!睔W文斯說(shuō),“比如聽到手指與紅酒杯碰撞的聲音,推測(cè)出酒杯里裝了多少紅酒?!敝悄芟到y(tǒng)還能準(zhǔn)確把握聲音的音色和波長(zhǎng),從而精確模擬出不同材質(zhì)物體撞擊時(shí)的細(xì)微差別。在分辨發(fā)聲材料的軟硬程度上,人工智能系統(tǒng)的準(zhǔn)確率達(dá)到67%。不過(guò),包括VIS在內(nèi)的智能系統(tǒng)在聲音識(shí)別方面仍有局限。目前的智能系統(tǒng)學(xué)習(xí)聲音的方法仍基于視覺,這就會(huì)對(duì)其學(xué)習(xí)能力帶來(lái)限制。比如,當(dāng)視頻中有物體不規(guī)律地?cái)[動(dòng)卻未發(fā)出聲音時(shí),系統(tǒng)常常會(huì)做出錯(cuò)誤的判斷。而像風(fēng)聲這類幾乎沒有相應(yīng)視覺呈現(xiàn)的聲音,智能系統(tǒng)更是無(wú)法察覺。

“能夠預(yù)測(cè)聲音是人工智能與物理世界互動(dòng)的重要一步?!睔W文斯說(shuō),他們未來(lái)的研究重點(diǎn)就是讓人工智能系統(tǒng)能模擬出與視覺聯(lián)系更少的聲音。

如此,這一技術(shù)在商業(yè)上的想象空間就更大了。比如電影中各種非常規(guī)環(huán)境下的聲音,都可以交給機(jī)器來(lái)生成—電影制作者不再需要借助各種道具來(lái)完成音效,一個(gè)人工智能系統(tǒng)就足夠了。另外,如果人工智能系統(tǒng)能夠理解風(fēng)聲,那么在駕駛時(shí),導(dǎo)航系統(tǒng)還能根據(jù)風(fēng)聲對(duì)周圍環(huán)境做一些假設(shè),以達(dá)到更加安全的駕駛目的?,F(xiàn)在的智能系統(tǒng)基于視頻學(xué)習(xí),也是出于學(xué)習(xí)成本的考慮,比如VIS學(xué)習(xí)的那1000段視頻中就包含了4.6萬(wàn)種聲音的數(shù)據(jù)。

李笛認(rèn)為,人工智能會(huì)學(xué)習(xí)是一回事,更重要的是能否在極少量數(shù)據(jù)輸入的情況下學(xué)習(xí)?!鞍凑宅F(xiàn)在的技術(shù),拿過(guò)億的數(shù)據(jù)去訓(xùn)練機(jī)器已經(jīng)不是難事,難的是我教它兩下教它三下它就會(huì)了?!边@也是技術(shù)公司在不斷嘗試解決的問題。

猜你喜歡
歐文斯物體人工智能
杰西·歐文斯:田徑史上最具影響力的運(yùn)動(dòng)員(下)
北廣人物(2020年12期)2020-04-01 15:06:41
深刻理解物體的平衡
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
我們是怎樣看到物體的
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
為什么同一物體在世界各地重量不一樣?
歐文斯奧運(yùn)金牌創(chuàng)紀(jì)錄拍賣
懸浮的雞蛋
米林县| 长丰县| 南部县| 连南| 普定县| 湘阴县| 固安县| 高密市| 公安县| 洛川县| 康保县| 寿宁县| 鄄城县| 团风县| 公安县| 襄樊市| 洪湖市| 益阳市| 蓬莱市| 嘉荫县| 山西省| 六枝特区| 喜德县| 徐闻县| 六安市| 奈曼旗| 左贡县| 灌云县| 凉山| 东兰县| 墨玉县| 江永县| 兴海县| 武宣县| 黄大仙区| 云和县| 逊克县| 当阳市| 依安县| 莱阳市| 安达市|