莎倫·高丁
吳恩達(dá)認(rèn)為,深度學(xué)習(xí)是機器學(xué)習(xí)的一種,但它更像是模擬人腦過程來進行學(xué)習(xí)
下一代深度學(xué)習(xí)算法將助力搜索、物聯(lián)網(wǎng)和機器人設(shè)備。
研究人員正在竭力開發(fā)一套新的算法,以支持更方便的搜索、自動駕駛汽車、更靈巧的智能手機以及物聯(lián)網(wǎng)。
深度學(xué)習(xí)算法基于對大腦進行的松散模擬,已用于推動諸多技術(shù)的發(fā)展,比如語音識別、自然語言處理和機器人自主等技術(shù)。
現(xiàn)在,研究人員致力于研發(fā)下一代的此類算法,下一代算法將廣泛應(yīng)用于機器學(xué)習(xí)和人工智能領(lǐng)域,有望成為重大技術(shù)發(fā)展賴以生存的基礎(chǔ)。
加布里埃爾咨詢集團(Gabriel Consulting Group)的分析師丹·奧爾茲(Dan Olds)表示,如果我們想要看到“影響深遠(yuǎn)”的技術(shù)進步——比如可以讓我們小睡或閱讀的自動駕駛汽車,以及會飛起來、自動將人載往目的地的汽車,就需要更好的深度學(xué)習(xí)算法。
“這些自動駕駛汽車依賴這個本領(lǐng),即能夠‘觀察路面上的障礙,然后靈活避開障礙。汽車辨別行人和路標(biāo)的水平越高,察覺潛在危險的能力就越強。”奧爾茲說,“此外,受影響的不僅僅是我們未來的數(shù)字化生活,還有我們的現(xiàn)實生活。如果我們可以把在全國或全世界運送貨物的重任交給系統(tǒng)去處理,那會怎樣?如果我們可以在開車去上班的路上,坐在后面睡覺,又會怎樣?”
從根本上說,盡管大多數(shù)人連深度學(xué)習(xí)算法聽都沒聽說過,但更好的算法有望帶來這種美好的未來:家居更智能化,機器人設(shè)備能夠替我們照顧父母以及遛狗。
Moor Insights & Strategy公司的分析師帕特里克·穆爾黑德(Patrick Moorhead)說:“這種研究意義重大,因為它有望帶來更有效的方式,以便處理物聯(lián)網(wǎng)和移動技術(shù)帶來的無限擴展的數(shù)據(jù)集。盡管大多數(shù)人對深度學(xué)習(xí)一無所知,但它是未來數(shù)字化生活的一個重要組成部分?!?/p>
吳恩達(dá)(Andrew Ng)是斯坦福大學(xué)的計算機系副教授,也是百度公司的首席科學(xué)家。百度是一家中國互聯(lián)網(wǎng)服務(wù)公司,也是數(shù)一數(shù)二的中文搜索引擎。吳恩達(dá)正與斯坦福大學(xué)和百度的科學(xué)家進行合作,潛心研發(fā)下一代深度學(xué)習(xí)算法。
近日,他在《麻省理工科技評論》(MIT Technology Review)雜志于馬薩諸塞州坎布里奇市舉辦的新興技術(shù)大會上作了發(fā)言,暢談深度學(xué)習(xí)技術(shù)如何應(yīng)用于搜索和未來的技術(shù)。
吳恩達(dá)擁有這方面所需的扎實背景。他曾在谷歌公司效力過一年半,一手創(chuàng)辦了谷歌的深度學(xué)習(xí)項目Google Brain。
除了谷歌外,微軟、Facebook和百度等公司也在致力于研發(fā)更好的深度學(xué)習(xí)算法,因為它們都有大量的數(shù)據(jù)需要處理。
吳恩達(dá)在接受采訪時表示,“你將數(shù)量越來越多的數(shù)據(jù)交給傳統(tǒng)算法處理時,它們就開始停頓、變慢,最終束手無策。深度學(xué)習(xí)算法卻不是這樣。這種算法的魅力在于,交給它們的數(shù)據(jù)越多,它們處理起來就越順暢?!?/p>
人腦的處理分析能力非常強,因為大腦里面充斥著大量通過電脈沖進行聯(lián)系的神經(jīng)元?;谀M神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法正是模仿了人腦。
吳恩達(dá)解釋:“隨著我們建立起越來越龐大的人腦模擬體系,這些模型在消化并理解大量數(shù)據(jù)方面顯得比較高效。這些是能力非常強的學(xué)習(xí)算法?!?h3>語音和可視化的未來
眼下,這方面的工作正在迅速開展之中。
大概4年前,規(guī)模最大的神經(jīng)網(wǎng)絡(luò)(即深度學(xué)習(xí)算法集合)大約有1000萬個連接節(jié)點。吳恩達(dá)指出,而到2011年年初,當(dāng)時他剛開始啟動Google Brain項目,那個模型里面的連接節(jié)點數(shù)量已激增至10億個。去年,他已與斯坦福大學(xué)的科研團隊一起建立約有100億個連接節(jié)點的模型。
吳恩達(dá)的一部分工作是改進算法,不過他及其同事還在致力于使用GPU(即圖形處理單元),而不是使用較傳統(tǒng)的CPU(即中央處理單元)。事實證明,專門為處理計算機圖形而設(shè)計的芯片用來構(gòu)建大型神經(jīng)網(wǎng)絡(luò)的效果好得多,因為它們更善于處理這類運算。
吳恩達(dá)說:“我們正在搭建使用GPU硬件的新型深度學(xué)習(xí)平臺,有助于提高可擴展性。我和合作伙伴是最早大規(guī)模開展這項工作的。其他公司也在開始亦步亦趨;不過據(jù)我所知,百度是第一家針對深度學(xué)習(xí)構(gòu)建大規(guī)模GPU集群的公司。”
讓這些算法擁有更強大的能力,意味著語音識別和可視化搜索方面將獲得巨大進展。據(jù)吳恩達(dá)稱,那將具有重大意義。
由于越來越多來自落后貧困地區(qū)的人們上網(wǎng),會有越來越多的用戶將通過語音、而不是通過打字來進行搜索。預(yù)計還會有越來越多的人對搜索對象拍照,而不是輸入描述內(nèi)容。
“5年內(nèi),會有一半的查詢請求將通過語音和圖片來進行,所以我們在往這項技術(shù)投入巨資?!眳嵌鬟_(dá)說。
經(jīng)過改進的語音識別意味著,司機在駕駛過程中可以大聲發(fā)出指令,放在乘客座位上的手機會向朋友發(fā)送短信,表示晚點才到。
“全世界在向移動邁進,我認(rèn)為沒人設(shè)計出真正適合移動設(shè)備的用戶界面,這就是為什么在智能手機上的那些超小鍵盤上打字速度那么慢?!眳嵌鬟_(dá)說,“語音識別技術(shù)已大有改進,但還沒有達(dá)到我們的預(yù)期要求。等這項技術(shù)變得更完善后,我樂意圍繞語音識別,重新設(shè)計手機上的用戶界面?!?/p>
深度學(xué)習(xí)算法還可以用在我們的智能設(shè)備、智能汽車和可穿戴式設(shè)備上——通過得到大力倡導(dǎo)的物聯(lián)網(wǎng),把一切串聯(lián)起來。
吳恩達(dá)說:“我認(rèn)為,到時遙控器會從你家消失。如果你在家里,想聽某首歌曲,用不著掏出手機,給手機解鎖,再按一大堆按鈕,只要舒服地躺在沙發(fā)上,讓百度設(shè)備播放Justin Timberlake的某首歌曲。我希望在將來孫兒女會問我:‘以前家電設(shè)備果真聽不懂你說的話嗎?他們會很好奇家里怎么會有五、六只遙控器?!?/p>