文/王 剛
2017年,百度董事長兼CEO 李彥宏乘坐無人車開上五環(huán),收到無人車歷史上第一張罰單。4個月后,北京自動駕駛新規(guī)出臺。這一幕非常具有戲劇性,但我們也看到百度成為AI 之路上的一個“狠角色”。如果說,從2000年的那個元旦開始,最初的10年,百度依靠著李彥宏的搜索引擎專利技術(shù),在中國互聯(lián)網(wǎng)版圖上打下了一片江山;那么后10年,可謂是百度悄悄屯兵AI,逐漸讓“行業(yè)氣候”變化的10年,并且在語音、視覺、語言等領(lǐng)域提前占據(jù)最好的跑道。到今天,AI 經(jīng)歷過三起三落,成為顯學(xué),乃至催生“第四次工業(yè)革命”,勢能強大,而百度則給了AI 落地足夠多的場景,在產(chǎn)業(yè)智能中檢驗AI 的實用性,可謂是互相促進的典例。這些,都收錄在百度官方曬出的2019年AI“成績單”中。正如李彥宏所說:“數(shù)字經(jīng)濟在經(jīng)歷了PC的發(fā)明與普及、PC 互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)這3個階段后,正在進化到以人工智能為核心驅(qū)動力的智能經(jīng)濟新階段,智能經(jīng)濟將給全球經(jīng)濟帶來新的活力,是拉動全球經(jīng)濟重新向上的核心引擎?!?/p>
有人曾在這個新時代來臨之前,就喊出了“技術(shù)!技術(shù)!技術(shù)!”這樣的口號。技術(shù)會改變所有生意的模式,改變著社會的歷史進程。于是,技術(shù)由內(nèi)向外、技術(shù)由底座到平臺的升維、技術(shù)由表面進入核心地帶,幾乎成為所有商業(yè)領(lǐng)袖一致瞄準(zhǔn)的“靶心”,誰能射中?大環(huán)境不太妙的2019年,AI 這支箭是否可以逆風(fēng)而上?百度,在AI 上似乎給了一個很好的答案,鋪陳到今天風(fēng)起云涌的商業(yè)版圖上一看,既新鮮到讓你驚訝,又硬核到讓你不得不服。百度CTO 王海峰說,2019年,百度探索了AI進入工業(yè)大生產(chǎn)的真實路徑,推動AI 邁入自動化、標(biāo)準(zhǔn)化和模塊化的新階段,并與百度業(yè)務(wù)以及各行各業(yè)的生產(chǎn)實踐深入結(jié)合,加速了產(chǎn)業(yè)智能化的進程。于是,我們試著回首這300多天百度AI 的成績,發(fā)現(xiàn)了很多不偏不倚、滿滿十環(huán)的例子。比如:百度大腦的算法、算力取得突破,成為“軟硬一體AI 大生產(chǎn)平臺”;AI 進入百度核心業(yè)務(wù),百度智能云承載了“云+AI”的野心;推動了AI 倫理建設(shè)等。2019年,中國人工智能專利申請量排名中,百度以5712件位列第一,并包攬了深度學(xué)習(xí)技術(shù)、語音識別、自然語言處理、智能駕駛等多個人工智能核心領(lǐng)域第一。在百度2019年舉辦的AI 開發(fā)者大會上,百度大腦全面升級為5.0,成為軟硬件一體的AI 大生產(chǎn)平臺。在算法突破和計算架構(gòu)升級的基礎(chǔ)上,百度大腦5.0進行算法、計算架構(gòu)與應(yīng)用場景的重構(gòu)。
有哪些最頂尖的技術(shù)冒了出來?語音識別方面,百度提出流式多級的截斷注意力模型 SMLTA,在國際上首次實現(xiàn)流式注意力建模超越整句注意力模型的性能,也是國際上首次實現(xiàn)在線語音識別大規(guī)模使用注意力模型。語音合成方面,針對風(fēng)格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語音合成技術(shù)Meitron,將聲音中的音色、風(fēng)格、情感等要素映射到不同的子空間里,在使用時,不同的要素任意組合,靈活控制合成語音的風(fēng)格?!鞍偃胳`計劃”就是百度地圖推出的全球首個地圖語音定制功能。視覺技術(shù)方面,百度已經(jīng)形成了包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術(shù)矩陣。OCR、物體檢測、視頻理解、目標(biāo)跟蹤等業(yè)界領(lǐng)先的圖像與視頻技術(shù)多次在國內(nèi)外頂級賽事中取得佳績,例如在“CVPR 2019”就取得了10項冠軍,并已在機械制造、金融、醫(yī)療、教育等領(lǐng)域得到了廣泛的應(yīng)用。NLP(自然語言處理)方面,百度打造了知識增強語義理解框架ERNIE,通過建模海量數(shù)據(jù)中的實體、概念等先驗知識,學(xué)習(xí)真實世界的語義關(guān)系。融合知識的語義建模大幅增強模型的語義表示能力,在共計16個中英文任務(wù)上超越BERT、XLNET,取得SOTA 效果。2019年12月,ERNIE 在自然語言處理領(lǐng)域權(quán)威數(shù)據(jù)集GLUE 中榮登榜首。
據(jù)了解,基于百度飛槳研發(fā)的AI 控制系統(tǒng),百度在建的云計算中心將擁有超大型神經(jīng)網(wǎng)絡(luò)、超大規(guī)模高性能計算集群,設(shè)計年均PUE1.15,基礎(chǔ)設(shè)施能耗降低70%,每個可用區(qū)每年節(jié)電超過2億度,相當(dāng)于10萬戶居民一年的用電量。作為百度AI to B 的重要承載者和輸出者,百度智能云基于百度自主研發(fā)的中國首款云端全功能AI 芯片“昆侖”的云服務(wù)器正式上線。這個云服務(wù)器在150瓦功耗下能帶來260萬億次定數(shù)的AI 運算,并且提供一套圖編譯框架XTCL,在支持百度飛槳等主流深度學(xué)習(xí)框架上表現(xiàn)優(yōu)異。在國內(nèi)云廠商中,百度智能云單季度營收突破10億用時最短,穩(wěn)居中國公有云市場前列,并在互聯(lián)網(wǎng)、金融、智能城市、工業(yè)制造等行業(yè)已經(jīng)擁有標(biāo)桿性落地案例。此外,2019年7月,專為遠場語音交互打造的百度鴻鵠芯片流片量產(chǎn)。鴻鵠芯片采用雙核HiFi4架構(gòu),2.8M 大內(nèi)存,臺積電 40nm 工藝,在此硬件規(guī)格上,100mW 左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力,為車載語音交互以及智能家居等場景帶來不少想象力。
AI 技術(shù)之于百度,是邊界擴充的利器,也是其完整生態(tài)里最核心的樞紐。2019年,小度助手5.0的對話能力迎來了重大技術(shù)革新——全雙工免喚醒能力,實現(xiàn)了“一次喚醒,多輪交互”免喚醒詞連續(xù)對話。在7月的百度AI 開發(fā)者大會上,李彥宏親自做了演示。2019年,百度合成虛擬形象技術(shù)結(jié)合多模態(tài)識別與理解、面部、肢體和嘴型生成、GAN、TTS 等技術(shù),實現(xiàn)了業(yè)界首個可以量產(chǎn)視頻的真人形象虛擬主播。此外,浦發(fā)銀行還與百度合作打造了業(yè)內(nèi)首個“金融數(shù)字人”,擁有顏值、情感和專業(yè)的銀行知識。2019年,利用百度3D 視覺技術(shù),機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規(guī)劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物。機器人更接近于人了。在CVPR 2019上,百度Apollo 公開了國內(nèi)唯一的純視覺L4級自動駕駛解決方案——百度Apollo Lite,能夠支持對10路攝像頭、200幀/秒數(shù)據(jù)量的并行處理,單視覺鏈路最高丟幀率能夠控制在5‰以下,實現(xiàn)全方位360°實時環(huán)境感知,前向障礙物的穩(wěn)定檢測視距達到240米。截至目前,百度L4級別自動駕駛城市道路測試?yán)锍桃呀?jīng)突破300萬公里,已在23個城市進行測試,智能汽車專利1237項,位列全國第一。此外,百度自動駕駛路測牌照總數(shù)達到150張,占中國全部獲批自動駕駛路測牌照一半以上。當(dāng)然,百度搜索、百度地圖、百度輸入法、百度智能小程序都是AI 加持的不同場景。
令百度驕傲的幾個數(shù)據(jù)是:自2016年以來,百度至今已經(jīng)開放了228項領(lǐng)先AI 能力,開發(fā)者數(shù)量超過150萬,日均調(diào)用量突破1萬億次,語音、人臉、NLP、OCR 調(diào)用量中國第一。另外,百度的代表作“飛槳”在2019年徹底火了。據(jù)IDC 報告顯示,百度飛槳與谷歌、Facebook 名列前三,領(lǐng)銜中國深度學(xué)習(xí)平臺市場,也是市場份額前五名中唯一的國貨。據(jù)了解,從2012年起,百度就開始研究和應(yīng)用深度學(xué)習(xí),后來經(jīng)過開源,飛槳平臺才在滿足開發(fā)者和產(chǎn)業(yè)界越來越復(fù)雜的需求方面發(fā)揮重要作用。目前,百度AI 落地最領(lǐng)先的Apollo 自動駕駛,也有很多開源項目。截至目前,百度Apollo 平臺已經(jīng)匯聚了全球177家生態(tài)合作伙伴。在全球,有97個國家超過3.6萬名開發(fā)者使用Apollo 開源代碼,開源代碼數(shù)量超過56萬,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。過去一年中,小度技能開放平臺上的技能開發(fā)者數(shù)量已經(jīng)超過3.7萬人,包含了游戲、效率工具、網(wǎng)絡(luò)電臺、直播、兒童教育、智能家居等3500多種技能支持。到今天,小度助手可以控制的IoT 智能家居設(shè)備已經(jīng)超過了7000萬。除此之外,百度宣布將百度智能邊緣計算框架BAETYL 捐贈給社區(qū),BAETYL 成為中國首個開源的邊緣計算框架,還宣布將國人自研的底層區(qū)塊鏈技術(shù)XuperChain 正式開源。
在強調(diào)科技倫理、科技向善的2019年,我們也看到AI 已經(jīng)走到了最大眾化的層面。在“百度AI 尋人”平臺,用戶發(fā)起照片比對接近40萬次,9000多個走失者與家庭重新團聚。百度APP 全面上線“百度AI 垃圾分類”智能小程序,基于百度AI 視覺和語音能力,通過語音搜索或識圖搜索,就可以幫助用戶方便快捷地對垃圾進行分類。此外,AI 手語翻譯、AI 臺風(fēng)路徑查詢、瀕危土家語保護、AI 改造視障者按摩院都是一個個接地氣的技術(shù)產(chǎn)品,最終將完全融入社會整體的脈絡(luò)之中。這依然是一個技術(shù)主導(dǎo)的世界,我們追索,我們暢想,并期冀用科技讓復(fù)雜的世界更簡單。這也是一個技術(shù)轉(zhuǎn)型的大時代,時代叢林里的飛禽走獸、花草植被都在迎接新的太陽。而AI,沒有身體,沒有聲音,沒有相貌,卻無處不在,以AI 技術(shù)為核心驅(qū)動力的第四次工業(yè)革命的大幕正在拉開。