算力,一個原本并不為外界所熟悉的芯片界術(shù)語,一般用于描述芯片處理數(shù)據(jù)或完成算法訓練的能力,近些年卻時常出現(xiàn)在汽車領(lǐng)域的相關(guān)文案里。究其原因,實在是車載芯片之性能直到這會兒才值得被探討而已。
其實,此前用于控制ADAS高級輔助駕駛系統(tǒng)以及多媒體座艙的MCU單片機式微控制器,也具備算力。只是,隨著市場日益看重智能座艙的應用以及自動駕駛技術(shù)的性能,乃至將它們作為購車時的重要參考,廠商這才單獨把算力摘出來,以便消費者進行量化比較。
既然是用來衡量比對,那自然得有基準單位,而目前汽車行業(yè)普遍使用的算力單位則是TOPS,也就是Tera Operations PerSecond,意指處理器每秒可進行一萬億次運算。1TOPS即每秒運算一萬億次,2TOPS便是每秒二萬億次,以此類推……這其實是相當強大的算力,要知道,在TOPS之下至少還有每秒十億次的GOPS,跟每秒一百萬次的MOPS兩檔算力單位托著。
值得一提的是,今日所謂智能汽車的算力,說的是那個包含多顆SoC系統(tǒng)級芯片的車載計算平臺算力,并不包括其他域控制器所用MCU的算力。換句話說,目前智能汽車已憑借高算力平臺邁入大算力時代。
話雖如此,但眼下全車真正消耗大量算力的,卻“只有”智能座艙跟自動駕駛兩大系統(tǒng)。以智能座艙為例。當前主流智能座艙操作系統(tǒng)除完成傳統(tǒng)的多媒體交互功能外,還需具備可支持高清大屏、多屏聯(lián)動等顯示功能的圖形計算能力,以及支持車內(nèi)人工智能助手完成交互、監(jiān)測等功能的AI運算及學習能力。實際上,車載操作系統(tǒng)維持自身流暢運行所需的算力并不亞于旗艦級智能手機。
不僅如此,今后隨著整車電子電氣架構(gòu)的進一步集成化,或者直接通過OTA軟件進行在線升級,智能駕駛系統(tǒng)必將融合更多的功能域控制器。而想要保證新系統(tǒng)繼續(xù)正常工作,并持續(xù)維護信息的安全,勢必要處理更為龐大的數(shù)據(jù)量。顯然,對于使用壽命遠久于其他消費級智能終端的汽車來說,對算力的需求永遠不嫌少,畢竟還得為將來預留相當大的余地。
至于自動駕駛方面,對算力的需求更是驚人。別看眼下L2級高級輔助駕駛系統(tǒng)只需10TOPS左右的算力,一旦進入L3級有限自動駕駛模式,隨著傳感器數(shù)量的激增,以及決策場景的復雜化,系統(tǒng)所需的算力將躍升至30~60TOPS。順便一提,之前主流旗艦手機所用的驍龍888Plus芯片的AI算力“僅有”32TOPS。
另外,根據(jù)自動駕駛系統(tǒng)相關(guān)廠商的預測,若要完成L4級高速自動駕駛,車載計算平臺的算力至少要有300TOPS,而L5級無人駕駛則需有1000TOPS的算力打底才行。同時,海內(nèi)外的多家自動駕駛AI芯片供應商也認為,隨著自動駕駛技術(shù)的進化和落地,系統(tǒng)對于車載算力的需求將呈指數(shù)級增長,并最終獲得遠超消費級智能終端的算力,甚至會引起車載芯片自身的革新。
值得一提的是,由于智能座艙的最終目標是解放駕駛者,并將汽車變成“智能移動空間”,這跟自動駕駛系統(tǒng)的進化方向其實是一致的,而在現(xiàn)實里,智能座艙與自動駕駛系統(tǒng)之間的界線也確實存在著模糊的地方。因此,已有不少相關(guān)從業(yè)人員認為,將來這兩套域控制器有望合二為一,并由一顆SoC芯片控制。
事實也的確如此。英偉達在2022 GTC秋季大會上發(fā)布的新一代集中式車載計算平臺NVIDIA DRIVE Thor,即已憑借具備最高2000 TOPS AI算力以及2000 TFLOPS浮點算力的單顆Thor SoC芯片,將智能座艙和自動駕駛等智能功能整合到單個架構(gòu)中。
然而,在算力方面無限制地內(nèi)卷、膨脹未必有益于智能汽車的進化。首先,算力并不完全等同于汽車智能。與其他人工智能一樣,車載AI系統(tǒng)最終所能呈現(xiàn)的人機交互、事件決策等自主行為的效果,更多取決于AI自身的學習能力,以及算法迭代的結(jié)果。而算力只是實現(xiàn)這一切的基礎(chǔ)。
不僅如此,現(xiàn)有的智能手機SoC芯片已經(jīng)證明,單方面提升算力,將使整個平臺難以兼顧功耗、散熱及安全等其他方面的需求,以至于在用戶體驗層面一敗涂地。
總而言之,智能汽車的進化離不開大算力計算平臺的支撐,但計算平臺的設(shè)計卻不能完全偏向算力,需要綜合復雜的外部環(huán)境和用戶需求等因素,并進行整體優(yōu)化方可完成。
嚴格來講,根據(jù)測算對象的不同,使用對應的算力單位。例如,在測算單片機或CPU處理指令的速度時,就該用MIPS,即Million Instructions PerSecond每秒執(zhí)行的百萬級指令數(shù);而若用Dhrystone整數(shù)運算測試程序進行計算,則單位又會變成DMIPS,即Dhrystone測試模式下的MIPS。
又比如,在測試浮點計算能力時,則要使用FLOPS,即floating-point operations per second每秒執(zhí)行的浮點運算次數(shù)。順便一提,F(xiàn)LOPS跟OPS一樣,也能細分為MFLOPS、GFLOPS、TFLOPS,以及代表每秒一千萬億次計算的PFLOPS。當然,對于面向普通群眾的智能汽車來說,籠統(tǒng)地使用TOPS已足以代表整車的算力。
華為MDC智能駕駛計算平臺:Mobile Data Center移動數(shù)據(jù)中心是華為專門為智能駕駛研發(fā)打造的計算平臺。其中包含標準化的系列硬件產(chǎn)品以及智能駕駛操作系統(tǒng)AOS等軟件產(chǎn)品,并提供配套工具鏈及車路云協(xié)同服務(wù)。
于2021上海車展發(fā)布的MDC810搭載兩顆昇騰610芯片,使平臺的AI算力達到400TOPS,可滿足擁堵跟車、高速巡航、自動泊車等高級別自動駕駛應用場景的需求。
高通驍龍Ride平臺:高通于2020年1月發(fā)布的自動駕駛計算平臺,平臺主要由單顆算力為30TOPS的安全系統(tǒng)SoC芯片、自動駕駛專用加速器和自動駕駛軟件棧構(gòu)成。平臺具有高度可擴展性和完全可定制化的特點。
根據(jù)SoC芯片以及自動駕駛加速器數(shù)量的不同,平臺最高可提供單顆700TOPS的算力,從而可使面向城市環(huán)境的乘用車實現(xiàn)L5級自動駕駛功能。而若采用L2+級自動駕駛方案,平臺最多可支持7個攝像頭、6個毫米波雷達、高精地圖導航以及C-V2X車聯(lián)網(wǎng)技術(shù)。
英偉達DRIVE Thor:發(fā)布于2022年9月20日GTC秋季大會的英偉達新一代集中式車載計算平臺,可將自動駕駛和智能座艙的所有功能整合到單一架構(gòu)中。官方宣稱,這是首個集成推理Transformer引擎的自動駕駛汽車平臺,能使Transformer深度神經(jīng)網(wǎng)絡(luò)的推理性能提升9倍。與此同時,作為平臺核心的英偉達Thor SoC芯片還可憑借具備8位浮點精度的2000 TFLOPS浮點算力,讓開發(fā)人員在進行數(shù)據(jù)傳輸時,不至于損失神經(jīng)網(wǎng)絡(luò)原本的精準度。
順便一提,英偉達Thor并非那顆算力高達1000TOPS的Atlan SoC芯片的繼任者,而是直接取代Atlan,在不遠的將來接班現(xiàn)役Orin 芯片上位。此舉甚至讓那套登臺不過半年,基于Atlan芯片構(gòu)建的NVIDIA DRIVE Hyperion 9自動駕駛平臺也變得前景未明。