文 / 黃耀鵬
就像燃油車(chē)時(shí)代要講動(dòng)力一樣,智能電動(dòng)車(chē)要講算力。軟件定義汽車(chē)的趨勢(shì),已經(jīng)成為共識(shí),軟件能力的基礎(chǔ)就是算力,而算力來(lái)源于算力芯片。
動(dòng)力的計(jì)數(shù)單位是馬力、扭矩這些指標(biāo),而算力則是Tops(每秒進(jìn)行1012次二進(jìn)制計(jì)算)、Flops(每秒浮點(diǎn)計(jì)算次數(shù)),日益被業(yè)內(nèi)人士接受和熟知。
對(duì)于CPU(中央處理器)、DMIPS(106次算邏運(yùn)算指令,常用來(lái)衡量處理器的整數(shù)運(yùn)算能力),就相對(duì)陌生。如果智能座艙比較流暢地運(yùn)行AR、360全景、流媒體、HUD等,至少要超過(guò)20000DMIPS。
其實(shí),廣義上的算力芯片,不只是各種PU——CPU、GPU(圖形處理器)、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、TPU(張量處理器),還包括手機(jī)和車(chē)載比較流行的SOC(系統(tǒng)級(jí)芯片,自動(dòng)駕駛和智能座艙常用SOC方式搭載)和MCU(微控制單元)。
順便說(shuō)一句,SOC既然是系統(tǒng)芯片,往往集成了各種PU(看需求)和動(dòng)態(tài)、靜態(tài)存儲(chǔ),可以視為一個(gè)微型的PC機(jī)。
雖然MCU用途很廣泛,多媒體、音響、導(dǎo)航、懸掛、車(chē)窗、雨刷等無(wú)所不包,但是現(xiàn)在算力的演化趨勢(shì),就是拿走了大部分的控制功能。而MCU用途,正在收窄為核心算力SOC的“協(xié)處理器”。
用通俗的語(yǔ)言描述,就是緊挨著大腦的“小跟班”。一方面可以充當(dāng)安全處理器(冗余決策);另一方面可以分擔(dān)一些中央SOC的功能,減輕后者的計(jì)算壓力,比如管理電池、網(wǎng)關(guān)和預(yù)處理雷達(dá)數(shù)據(jù)。
從主角變成配角,這個(gè)趨勢(shì)雖然沒(méi)有普及化,但前景已經(jīng)比較明確。這讓MCU的生產(chǎn)商頗為落寞。恩智浦、英飛凌、瑞薩、德儀,這些傳統(tǒng)汽車(chē)芯片廠家,本世紀(jì)以來(lái)都在MCU上賺了大錢(qián)。但是市場(chǎng)已經(jīng)開(kāi)始接受了新勢(shì)力的方案,就是將大算力的各種PU作為汽車(chē)“大腦”的做法。
現(xiàn)在的趨勢(shì)是,跨國(guó)廠商早就開(kāi)始研發(fā)相應(yīng)E-E架構(gòu),但馬上拿出來(lái)可能還有困難。趨勢(shì)是沒(méi)辦法回頭的。MCU企業(yè)曾經(jīng)幻想,讓車(chē)企放棄昂貴的各種PU方案,回到相對(duì)傳統(tǒng)的架構(gòu)。
車(chē)載算力這一塊,高通和英偉達(dá)尚未完成驅(qū)逐傳統(tǒng)芯片大廠的過(guò)程。一旦大家都實(shí)現(xiàn)算力充分集中,可能全球車(chē)載算力需求,都會(huì)淪為“雙寡頭”的盤(pán)中餐。
從什么時(shí)候這個(gè)幻想破滅了呢?這要追溯到2019年,特斯拉推出HW3.0芯片,144Tops的算力轟動(dòng)業(yè)界。一時(shí)間,高算力芯片炙手可熱。自那以后,只要用了大算力平臺(tái)(無(wú)論是自研還是買(mǎi)的),產(chǎn)品的軟件體驗(yàn)(座艙和ADAS)馬上能上一個(gè)檔次。
這就讓傳統(tǒng)芯片企業(yè)的風(fēng)頭,都被英偉達(dá)和高通掠走了。始作俑者特斯拉,主動(dòng)終結(jié)Mobileye自動(dòng)駕駛芯片供貨之后,又與英偉達(dá)分手,自此一直采用自研芯片(代工方為三星和臺(tái)積電)。
現(xiàn)在的市場(chǎng)上,只要是2021和2022年上市的、20萬(wàn)元以上的中國(guó)品牌車(chē)型,座艙芯片齊刷刷都是8155(準(zhǔn)確地說(shuō)是高通的SA8155P)。2023年高通在智能座艙芯片的市占率高達(dá)90%。
自動(dòng)駕駛算力芯片,競(jìng)爭(zhēng)對(duì)手就稍微多一點(diǎn),但跑不脫英偉達(dá)、地平線這幾家。德儀、Mobileye、華為海思也拿到一小部分市場(chǎng)。
2023 年上半年的數(shù)據(jù),在中國(guó)乘用車(chē)市場(chǎng)上,具備N(xiāo)CA功能的計(jì)算方案市場(chǎng)份額,英偉達(dá)獨(dú)占52.57%,其余為地平線(30.7%)、德儀(8.62%)、Mobileye(4.05%)、華為海思(4.05%)。
有意思的是,座艙芯片除了8155之外,選擇其實(shí)很多,華為的麒麟710A、恩智浦的i.mx8和6D/Q、聯(lián)發(fā)科的MT2712、德儀的JT6、意法的Accord 7和Accord 5等。但比亞迪似乎劍走偏鋒,敢于使用高通的非車(chē)規(guī)SOC,例如625、665、6350、7325等(手機(jī)芯片)。
眾所周知,非車(chē)規(guī)芯片的功能與車(chē)規(guī)芯片沒(méi)什么不同,只不過(guò)后者的環(huán)境適應(yīng)性要求要苛刻得多。汽車(chē)使用非車(chē)規(guī)芯片,可以縮短開(kāi)發(fā)周期,價(jià)格便宜,但可能引起黑屏、宕機(jī)等故障。
比亞迪的應(yīng)對(duì)方案是額外配置一顆安全芯片(就是剛才提到的“冗余決策芯片”),以保證主芯片出問(wèn)題時(shí),能保住核心程序繼續(xù)運(yùn)行。這種極致削減成本(開(kāi)發(fā)周期也是成本)的做法,也是其核心競(jìng)爭(zhēng)力的一部分。
這樣一來(lái),就很清楚了,算力芯片領(lǐng)域,眼下是高通和英偉達(dá)“神仙打架”的局面。
值得一提的是,高通是唯一一家沒(méi)有被限制向中國(guó)出售芯片(不止是汽車(chē)芯片)的美企。8155能夠占有率這么高,有這方面因素。但即便如此,美國(guó)的政策翻臉如翻書(shū),國(guó)產(chǎn)替代一樣充滿緊迫性。
高通和英偉達(dá),一直在車(chē)載算力芯片上較勁。一方面,比拼算力芯片的巔峰能力;另一方面,都在推出超級(jí)算力芯片,統(tǒng)一雙智運(yùn)算,試圖把對(duì)方的地盤(pán)也搶過(guò)來(lái)。
去年9月,英偉達(dá)發(fā)布了高達(dá)2000Tops算力的Thor,號(hào)稱(chēng)“駕艙一體”。意思是,這不是一塊純粹的自動(dòng)駕駛芯片,而是專(zhuān)為汽車(chē)的中央算力架構(gòu)而生。一塊芯片控制所有車(chē)載功能,滿足所有算力需求。此舉無(wú)疑順應(yīng)了E-E架構(gòu)由分布式向集中式演進(jìn)的趨勢(shì)。
此前發(fā)布的254Tops算力的英偉達(dá)Orin相形見(jiàn)絀。而且,Thor和Orin一樣,都可以疊加多顆使用。當(dāng)然,史上最強(qiáng)“疊疊樂(lè)”,仍是英偉達(dá)產(chǎn)品,即DGX GH200(CPU和GPU的組合)。疊加256顆,即可組成1E(1015)Flops算力。但是5兆瓦的功率(相當(dāng)于一個(gè)小城市的用電功率),決定了它只能在冷卻完善的機(jī)房里運(yùn)行。
在GH200上可以運(yùn)行任何大模型,超算能力可以讓其充當(dāng)強(qiáng)大的云端服務(wù)器和訓(xùn)練大模型。這樣,英偉達(dá)就在AI大模型訓(xùn)練硬件上一騎絕塵,并可以建立從云端到車(chē)端的連接。既然擁有了空前強(qiáng)大的模型工具,甚至可以用AI發(fā)明更強(qiáng)的GPU,這意味著算力正走向“奇點(diǎn)時(shí)刻”:用AI發(fā)明AI,起碼現(xiàn)在就奠定了硬件基礎(chǔ)。
高通更強(qiáng)于算邏運(yùn)算。與英偉達(dá)不斷強(qiáng)化圖形計(jì)算能力不同,高通更擅長(zhǎng)發(fā)展移動(dòng)CPU這樣的路線。不過(guò)兩者殊途同歸,高通2023年1月發(fā)布的SA8775,也走向了駕艙一體路線。高通聲稱(chēng),這款4nm芯片,通過(guò)組合可以實(shí)現(xiàn)與英偉達(dá)Thor能力相當(dāng)?shù)?000Tops算力
這其實(shí)就是暗示單塊8775無(wú)法做到這么高的算力。2022年高通以45億美元收購(gòu)自動(dòng)駕駛芯片公司維寧爾,今年收購(gòu)?fù)ㄐ判酒続utotalks,都是為了補(bǔ)強(qiáng)短板,在算力領(lǐng)域與英偉達(dá)對(duì)抗。
不過(guò),車(chē)載算力的天花板,不但遠(yuǎn)比超算里面的單顆芯片低,其造價(jià)和周期也比后者長(zhǎng)。一句話,同樣算力,車(chē)規(guī)芯片有成本劣勢(shì)。
全新的手機(jī)SOC,技術(shù)儲(chǔ)備支持“拾級(jí)而上”的話,兩年就能做到。而車(chē)規(guī)芯片要完成一系列認(rèn)證,可能研發(fā)時(shí)間要加倍。
這就決定了汽車(chē)芯片的迭代周期沒(méi)有手機(jī)快。不光是因?yàn)檐?chē)規(guī)芯片的周期問(wèn)題,也由于車(chē)載硬件方案,要跟隨整車(chē)研發(fā)周期。因此我們看到2019年發(fā)布的8155、Orin,都還是裝車(chē)主力。盡管它們的下一代芯片最晚在2022年發(fā)布,但采用者依然寥寥。
不過(guò),由于中國(guó)新能源汽車(chē)的競(jìng)爭(zhēng)非常激烈,這個(gè)進(jìn)程正在加速。整體而言,算力芯片上車(chē)周期,比國(guó)外快1-2年。這已經(jīng)是很大的差距了。畢竟后者距離算力完全集中,還有很長(zhǎng)的路要走。
即便不考慮車(chē)規(guī)驗(yàn)證周期,算力芯片本身,也很容易產(chǎn)生“寡頭”。一旦某個(gè)芯片公司取得先發(fā)優(yōu)勢(shì),它們會(huì)憑借出貨量和市場(chǎng)份額,迅速攤平研發(fā)成本。利潤(rùn)回籠前就可以進(jìn)入下一輪研發(fā)。優(yōu)化、開(kāi)發(fā)、積累新的技術(shù),越跑越快,以至于對(duì)手從望其項(xiàng)背到喪失上桌資格。
而且寡頭化還有個(gè)激勵(lì)因素,就是制程的提高,讓流片費(fèi)用變得非常昂貴,可能單芯就達(dá)到數(shù)千萬(wàn)美元,失敗成本非常高。如果安全性、穩(wěn)定性、散熱性達(dá)不到設(shè)計(jì),這錢(qián)就打水漂了,代工廠是不負(fù)責(zé)的。這就促使強(qiáng)者愈強(qiáng)。
現(xiàn)在算力這一塊,高通和英偉達(dá)尚未完成驅(qū)逐傳統(tǒng)芯片大廠的過(guò)程——因?yàn)榭鐕?guó)整車(chē)廠的節(jié)奏沒(méi)跟上,讓后者還有訂單。一旦大家都實(shí)現(xiàn)算力充分集中,可能全球車(chē)載算力需求,都會(huì)淪為“雙寡頭”的盤(pán)中餐。
這里面唯一的變數(shù),是中國(guó)芯片供應(yīng)商。目前寒武紀(jì)、黑芝麻、華為海思等芯片公司日子都不大好過(guò),出貨量太少令其很難追上英偉達(dá)的節(jié)奏。但是美國(guó)的制裁,讓英偉達(dá)只能向中國(guó)客戶提供專(zhuān)供版顯卡,車(chē)載芯片這一塊倒尚未限制,但客戶們都為這一天積極做準(zhǔn)備。這讓中國(guó)芯片供應(yīng)商,仍保有商業(yè)機(jī)會(huì)。
車(chē)企造芯,基本也是投資功率器件、傳感器、MCU、電源管理等。算力芯片門(mén)檻太高,直接孵化有困難。合資和戰(zhàn)投,是不錯(cuò)的入手方式。地平線獲得大眾的投資,財(cái)務(wù)可能一時(shí)無(wú)憂,但長(zhǎng)期看,必須在算力芯片和架構(gòu)方案的正面戰(zhàn)場(chǎng)上贏得市場(chǎng)地位,才能有效解除警報(bào)
在雷蒙多訪華結(jié)束前的一天,華為上架了Mate 60系列。就目前已知的信息,Soc為7nm制程。技術(shù)細(xì)節(jié)還不清楚,有些輿論在猜測(cè)為DUV多次曝光方案,替代了EUV(實(shí)際上可能并非如此)。
7nm全球代工廠就那么幾家,不可能給華為代工。因此華為可能掌握了純國(guó)產(chǎn)的、部署于境內(nèi)的、美國(guó)技術(shù)含量為零的7nm代工線,而且產(chǎn)能巨大。因?yàn)镸ate 60系列首批備貨就超過(guò)500萬(wàn)部(據(jù)說(shuō)加單至1500萬(wàn)-1700萬(wàn)部,未經(jīng)證實(shí))。這條生產(chǎn)線必然存在(已經(jīng)有傳聞是中芯代工),而且美國(guó)既不掌握其上游技術(shù),就連部署在哪里都不知道。雖然很可能華為用非常規(guī)手段繞過(guò)設(shè)備制程這道坎,至少說(shuō)明高制程芯片生產(chǎn),對(duì)中國(guó)人來(lái)說(shuō)并非高不可攀。而且實(shí)現(xiàn)的速度,遠(yuǎn)超所有人預(yù)料。
在2018 年,當(dāng)時(shí)最新上市的Mobileye EyeQ4(28nm制程)自動(dòng)駕駛芯片,算力為2.5Tops。Mobileye認(rèn)為,算力并非瓶頸,憑借算法和5個(gè)并行核心的多任務(wù)模式,就可以處理8顆攝像頭數(shù)據(jù),足以應(yīng)對(duì)L4場(chǎng)景。它們引以為豪的是該芯片功耗只有3W。
5年過(guò)去了,業(yè)內(nèi)對(duì)算力的認(rèn)知、運(yùn)用和由此產(chǎn)生的需求,都在飛躍發(fā)展。2.5Tops算力應(yīng)對(duì)L4的認(rèn)知,就像上世紀(jì)80年代IBM認(rèn)為,只需要5臺(tái)大型機(jī)(其算力遠(yuǎn)不如現(xiàn)在的主流手機(jī)),就足以滿足全球的計(jì)算需求。
《汽車(chē)人》認(rèn)為,就算限制在車(chē)載場(chǎng)景,算力需求也很難看到終點(diǎn),就像我們很難預(yù)料AI的終點(diǎn)一樣(可能所有事物的前方,都有一個(gè)大模型,包括人本身)。
人類(lèi)從歷史中學(xué)到的唯一教訓(xùn),是從來(lái)不會(huì)汲取教訓(xùn)。這句話倒是仍然有效。