馬冉冉
“十三年了,久等了,你們辛苦了,很久不見,你們還好嗎?昨天已經(jīng)過去了很久,我現(xiàn)在很好,哪里都沒有去,始終我在光陰里。”在2016百度世界大會現(xiàn)場,百度公司董事長兼CEO李彥宏現(xiàn)場展示了運(yùn)用情感語音合成技術(shù)還原的張國榮聲音的音頻。
這是以張國榮在影視、電臺等留存下來的原聲建模,通過情感語音合成技術(shù)實現(xiàn)與粉絲“隔空對話”。據(jù)了解,任何一個人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語音合成技術(shù)模擬出這個人的聲音,這意味著,今后每個人都可以擁有自己的聲音模型。這是百度大腦所具備的基礎(chǔ)能力之一,從語音、圖像到自然語言理解再到用戶畫像……百度在這些領(lǐng)域的應(yīng)用已經(jīng)深入到人們的日常生活中。當(dāng)這些能力賦予全社會的每個人,就能變換出無窮無盡的可能性,讓我們重塑對未來的想象。
人工智能的這種神奇魅力吸引了各大科技公司,谷歌、Facebook、IBM等國外科技巨頭紛紛通過成立人工智能實驗室、并購初創(chuàng)公司等方式,在人工智能領(lǐng)域進(jìn)行多點布局。百度亦不例外,在人工智能方面的研發(fā)可謂不遺余力,更是第一個把人工智能提到核心技術(shù)創(chuàng)新地位的國內(nèi)互聯(lián)網(wǎng)公司。
2015年底,百度挖來NEC美國智能圖像研究院的負(fù)責(zé)人林元慶擔(dān)任百度深度實驗室主任,由他帶領(lǐng)深度學(xué)習(xí)實驗室研發(fā)具有統(tǒng)治級別的人工智能技術(shù)。在本刊的專訪中,林元慶表示,“我覺得中國的互聯(lián)網(wǎng)節(jié)奏非??欤绕涫侨斯ぶ悄艿陌l(fā)展?,F(xiàn)在人工智能的剛需已經(jīng)很明顯了,可以說非常旺盛,關(guān)鍵是如何把剛需挖掘出來,做出來,這才是重要的?!?/p>
百度大腦是百度人工智能的核心
《網(wǎng)絡(luò)傳播》:百度大腦目前有哪些階段性成果,其價值體現(xiàn)在哪里?
林元慶:百度大腦已建成超大規(guī)模的神經(jīng)網(wǎng)絡(luò),擁有萬億級的參數(shù)、千億樣本、億級特征訓(xùn)練,能模擬人腦的工作機(jī)制。通過深度學(xué)習(xí)、大規(guī)模計算和大數(shù)據(jù)三大部分,百度大腦目前已經(jīng)具備了語音、圖像、自然語言理解和用戶畫像四大前沿能力。以語音識別為例,目前百度語音識別的準(zhǔn)確率能夠達(dá)到97%。在人工智能時代,百度大腦將是百度向社會輸出人工智能技術(shù)能力的核心,經(jīng)過長期的投入與布局,未來百度大腦不僅將像百年以前的電力一樣成為商業(yè)新能源,更將深入到生活中,將電影中的場景變?yōu)楝F(xiàn)實。
《網(wǎng)絡(luò)傳播》:百度大腦宣布對廣大開發(fā)者、創(chuàng)業(yè)者及傳統(tǒng)企業(yè)開放其核心能力和底層技術(shù)開放,是出于何種考慮?
林元慶:百度大腦開放共享的思路,實際上是希望在時代變革大幕開啟之際,助力廣大合作伙伴全面共享人工智能時代,完成下一幕的轉(zhuǎn)型升級。百度大腦未來將與各行各業(yè)結(jié)合,衍生出不同領(lǐng)域的行業(yè)大腦,比如醫(yī)療大腦、交通大腦、金融大腦等。目前,百度大腦已經(jīng)應(yīng)用到教育、金融和娛樂等多個行業(yè)。
人工智能滲透百度所有產(chǎn)品線
《網(wǎng)絡(luò)傳播》:今年基本上全球各大互聯(lián)網(wǎng)公司都把人工智能作為最核心突破的領(lǐng)域,在這一領(lǐng)域,百度和其他公司的戰(zhàn)略方向有何不同?
林元慶:百度在人工智能領(lǐng)域起步早,布局領(lǐng)域廣,并且已經(jīng)有很深的積累,既實現(xiàn)了對內(nèi)業(yè)務(wù)的支持,也進(jìn)行了大量對外技術(shù)的輸出。目前,百度的人工智能幾乎已經(jīng)滲透到百度所有的產(chǎn)品線當(dāng)中,以此改進(jìn)百度全線產(chǎn)品的用戶體驗并提升用戶黏性。比如說手機(jī)百度的語音搜索、鳳巢的推廣系統(tǒng)以及百度外賣的調(diào)度系統(tǒng)、百度金融結(jié)合人工智能給用戶的畫像等等。接下來百度一方面將進(jìn)一步提升各項人工智能技術(shù),打造平臺化的對外輸出能力;另外一方面還將著力把這些人工智能技術(shù)和能力應(yīng)用到具體行業(yè)和垂類中,提升行業(yè)的效率,促進(jìn)行業(yè)變革。
《網(wǎng)絡(luò)傳播》:雖然業(yè)界普遍認(rèn)可人工智能的巨大前景,但在目前來看,人工智能在短期內(nèi)還很難看到盈利,那么,怎么看人工智能的普及和商業(yè)化?
林元慶:人工智能已經(jīng)為百度的搜索業(yè)務(wù)提供了巨大幫助。人工智能的發(fā)展和普及有四大關(guān)鍵性的支柱——機(jī)器學(xué)習(xí)算法(特別是深度學(xué)習(xí))、大數(shù)據(jù)、大規(guī)模計算,以及可供以上要素不斷訓(xùn)練迭代的大應(yīng)用。目前,人工智能在前三個領(lǐng)域都已經(jīng)有了一定程度的突破,同樣關(guān)鍵的是人工智能技術(shù)的大規(guī)模應(yīng)用,只有在制造業(yè)、醫(yī)療、汽車駕駛、娛樂等各個領(lǐng)域各個場景的不斷應(yīng)用,才能形成“數(shù)據(jù)-技術(shù)-產(chǎn)品-用戶-更多數(shù)據(jù)-更強(qiáng)技術(shù)”這樣的一個正向循環(huán)。在這些不斷擴(kuò)展的應(yīng)用中,商業(yè)化也就是自然伴隨而來的事情了。
互聯(lián)網(wǎng)的下一幕是人工智能
《網(wǎng)絡(luò)傳播》:如何看人工智能在2016年的“爆發(fā)”?
林元慶:1956年夏天,“人工智能”首次被提出,但在之后的半個世紀(jì)都沒有能夠解決人工智能的問題。上世紀(jì)70年代到90年代,美國一直有人工智能的課程,但卻沒有實際的應(yīng)用,在當(dāng)時,任何一個領(lǐng)域都看不到有價值的人工智能應(yīng)用。上世紀(jì)90年代以后,數(shù)據(jù)量越來越大,計算的能力也越來越強(qiáng),機(jī)器學(xué)習(xí)逐漸興起;到2006年,深度學(xué)習(xí)的概念被提出,特別是在2010到2012年間,深度學(xué)習(xí)在語音識別和圖像識別領(lǐng)域取得了突破性進(jìn)展。深度學(xué)習(xí)的成功極大地推動了人工智能的商業(yè)化。實際上,在2013年,《MIT科技評論》就已經(jīng)把深度學(xué)習(xí)列為當(dāng)年的十大技術(shù)突破之首,但今年確實是人工智能大規(guī)模商業(yè)化落地的一年。
《網(wǎng)絡(luò)傳播》:人工智能將會如何影響各行各業(yè)?
林元慶:影響最大的是制造業(yè)。當(dāng)人工智能時代到來,制造業(yè)會徹底被物聯(lián)網(wǎng)改變。未來所有商品都能聯(lián)網(wǎng),將數(shù)據(jù)傳回云端,通過人工智能技術(shù)進(jìn)行分析,為消費(fèi)者帶來實實在在的價值。汽車工業(yè)也將被人工智能徹底改變,盡管安全問題的解決路徑在傳統(tǒng)汽車廠商與創(chuàng)新廠家間有所不同,然而我們基本上還比較自信,有一天會進(jìn)入來自動駕駛時代。此外,娛樂業(yè)及健康產(chǎn)業(yè)同樣也會被人工智能所改變。對于前者,虛擬現(xiàn)實與增強(qiáng)現(xiàn)實很可能會成為主流的內(nèi)容形式,顛覆消費(fèi)者對娛樂內(nèi)容的消費(fèi)方式;對于后者,通過基因分析、精準(zhǔn)的醫(yī)療圖像診斷,患者的疾病將得到更加精準(zhǔn)和個性化的治療。
《網(wǎng)絡(luò)傳播》:為什么說人工智能將為互聯(lián)網(wǎng)注入下一幕的新動能?
林元慶:互聯(lián)網(wǎng)發(fā)展經(jīng)過了兩個階段,即PC互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)兩個階段,這兩個階段的發(fā)展依賴于人口紅利。但現(xiàn)在來說,互聯(lián)網(wǎng)的增長無法依靠人口紅利來驅(qū)動,人工智能將是移動互聯(lián)網(wǎng)的下一幕。過去一年當(dāng)中,人工智能從一個高精尖的科技變成了街談巷議的熱門話題,但人工智能背后的技術(shù)還是非常復(fù)雜的,需要投入去做的事情非常多。