汪陳晨 嚴(yán)兆鑫 柴嘉
“未來,自然語(yǔ)言將成為新的通用編程語(yǔ)言,你只要會(huì)說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界?!?/p>
4月16日,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在Create 2024百度AI開發(fā)者大會(huì)上作了“人人都是開發(fā)者”的主題演講。
“過去這一年,我跟很多創(chuàng)業(yè)者、開發(fā)者交流,感覺大家都處在一種‘FOMO狀態(tài),既興奮又害怕錯(cuò)過?!崩顝┖暾f。
在過去一年,AI正在重塑社會(huì)認(rèn)知。
不過,大模型時(shí)代的到來和AI原生應(yīng)用的爆發(fā)給創(chuàng)業(yè)者、開發(fā)者帶來機(jī)遇的同時(shí),也讓眾多普通人陷入迷茫。面對(duì)AI時(shí)代的巨大風(fēng)口,普通人怎么做應(yīng)用?怎么做智能體?怎么保證跟上AI時(shí)代的腳步?
李彥宏給出了確切的答案:“人人都可以成為開發(fā)者?!?/p>
他認(rèn)為,大模型和生成式AI將徹底改變開發(fā)者這個(gè)群體,“AI正在掀起一場(chǎng)創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡(jiǎn)單,人人都是開發(fā)者,人人都是創(chuàng)造者。”
會(huì)上,李彥宏表示,作為一家技術(shù)公司,百度盡可能為大家提供所需的開發(fā)工具,提升社會(huì)創(chuàng)造力,這包括了一個(gè)強(qiáng)大的基礎(chǔ)模型系列也就是文心大模型,和三大AI開發(fā)工具,包括智能體開發(fā)工具AgentBuilde、AI原生應(yīng)用開發(fā)工具AppBuilder,和各種尺寸的模型定制工具M(jìn)odelBuilder。它們組成了一個(gè)工具箱,支持開發(fā)者打包帶走,隨取隨用。
據(jù)了解,百度在4月3日正式發(fā)布智能代碼助手Baidu Comate 2.0,面向個(gè)人開發(fā)者全面免費(fèi)。此前Comate已經(jīng)在百度內(nèi)部上崗一年,李彥宏在大會(huì)上透露,“上崗一年多,Comate已經(jīng)走入了喜馬拉雅、三菱電梯、軟通動(dòng)力等上萬家企業(yè),生成的代碼采納率達(dá)到了46%,百度每天新增的代碼中,已經(jīng)有27%是由Comate生成的。”
李彥宏認(rèn)為,借助AI,人人都能成為一名開發(fā)者,“今天,你不會(huì)寫代碼,也可以做出一個(gè)AI應(yīng)用;不用編程,也可以做出一個(gè)智能體。”
在大會(huì)上,李彥宏還披露了文心一言的最新用戶數(shù)據(jù)?!拔男囊谎匀ツ?月16日發(fā)布,到今天是一年零一個(gè)月的時(shí)間。我們的用戶數(shù)突破了2億,API日均調(diào)用量也突破了2億,服務(wù)客戶數(shù)達(dá)到了8.5萬,利用千帆平臺(tái)開發(fā)的AI原生應(yīng)用數(shù)超過了19萬。”
李彥宏透露,相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調(diào)用1萬次,同樣成本現(xiàn)在一天可以調(diào)用100萬次。
得益于文心大模型的強(qiáng)大,開發(fā)者通過文心4.0降維裁剪出來的更小尺寸模型,要比直接拿開源模型調(diào)出來的模型,同等尺寸下效果明顯更好;同等效果下,成本明顯更低。李彥宏強(qiáng)調(diào),“大家以前用開源覺得開源便宜,其實(shí)在大模型場(chǎng)景下,開源是最貴的。所以開源模型會(huì)越來越落后?!?/p>
李彥宏表示,未來大型的AI原生應(yīng)用基本都是MoE架構(gòu),即大小模型的混用,不依賴一個(gè)模型來解決所有問題。第二是小模型更有性價(jià)比。“小模型推理成本低,響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過SFT精調(diào)后的小模型,它的使用效果可以媲美大模型?!钡谌侵悄荏w大幅降低開發(fā)門檻,隨著智能體能力的提升,會(huì)不斷催生出大量新的應(yīng)用。它讓機(jī)器像人一樣思考和行動(dòng),可以自主完成復(fù)雜任務(wù),實(shí)現(xiàn)自我迭代和進(jìn)化。
隨著百度基本開發(fā)思路的改變,現(xiàn)如今的文心大模型系列,除包括旗艦版的ERNIE3.5、ERNIE4.0外,也包括輕量版的ERNIE Speed、Lite、Tiny等等?!安皇谴竽P陀貌黄?,而是小模型更有性價(jià)比”,這亦在百度針對(duì)受眾需求的考慮范圍內(nèi)。
現(xiàn)階段,在最熱的AI賽道內(nèi),大小模型之爭(zhēng)已經(jīng)初見端倪,大模型也變得“越來越小”。去年12月,谷歌一口氣推出三種規(guī)格的Gemini:Ultra、Pro和Nano,其中最小的Nano可直接在移動(dòng)設(shè)備上運(yùn)行,有18億參數(shù)量和32.5億參數(shù)量?jī)蓚€(gè)版本。隨后,微軟也推出參數(shù)量?jī)H27億的模型Phi-2。
在開發(fā)AI原生應(yīng)用的具體思路方面,李彥宏提到,MoE、小模型和智能體是值得關(guān)注的三個(gè)方向,“這是我們百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)換來的。”
智能體是在基礎(chǔ)模型上,進(jìn)一步進(jìn)行思考增強(qiáng)訓(xùn)練,包括思考過程的有監(jiān)督精調(diào)、行為決策的偏好學(xué)習(xí)、結(jié)果反思的增強(qiáng)學(xué)習(xí),進(jìn)而得到思考模型。智能體的思考模型像人一樣,會(huì)閱讀說明書,學(xué)習(xí)工具的使用方法,進(jìn)而可以調(diào)用工具來完成任務(wù)。
百度首席技術(shù)官王海峰認(rèn)為,智能體是重要的發(fā)展方向,會(huì)帶來更多的應(yīng)用爆發(fā)。從萬億級(jí)訓(xùn)練數(shù)據(jù)中,文心大模型既學(xué)到了自然語(yǔ)言的能力,也學(xué)到了代碼能力,打通從思考到執(zhí)行的過程?;谖男拇竽P偷倪@兩種能力,百度開發(fā)了代碼智能體和智能代碼助手。王海峰表示:“代碼智能體,讓大家都能做之前只有程序員才能做的事,人人都可以成為程序員;智能代碼助手,則幫助專業(yè)的程序員更高效地寫出更好的代碼,可以說是程序員的AI同儕?!?p>
2023年11月9日,浙江嘉興,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在2023年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)互聯(lián)網(wǎng)企業(yè)家論壇上發(fā)言。
李彥宏透露,截至目前,已經(jīng)有3萬多個(gè)智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐?!敖裉?,每一個(gè)商家、每一個(gè)客戶,都能在百度擁有專屬的智能體。整個(gè)過程完全不需要編程,通過類似提示詞的信息輸入,和簡(jiǎn)單的幾步操作調(diào)優(yōu),就能迅速生成一個(gè)智能體,成為7×24小時(shí)在線的金牌業(yè)務(wù)員。”
李彥宏認(rèn)為,“智能體可能是未來離每個(gè)人最近、最主流的大模型使用方式,基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場(chǎng)景?!?/p>
現(xiàn)場(chǎng),李彥宏演示了新加坡旅游局、啟德教育和索菲亞三個(gè)智能體案例,手把手教開發(fā)者用自然語(yǔ)言,5分鐘、零門檻創(chuàng)建一個(gè)智能體,“啟德教育智能體非常受歡迎,上線第一周,就成功分發(fā)了155萬次,與用戶交互了5.8萬次,線索轉(zhuǎn)化量直線增長(zhǎng)、有效線索的轉(zhuǎn)化成本明顯降低,經(jīng)營(yíng)效率大幅提升?!?/p>
此外,百度搜索、地圖、貼吧等百度生態(tài)的平臺(tái)也都具備接入智能體的能力,讓開發(fā)者獲得實(shí)打?qū)嵉牧髁恐С帧?h3>視覺大模型最大的應(yīng)用場(chǎng)景是自動(dòng)駕駛
面向未來,李彥宏認(rèn)為,多模態(tài)大模型,或者說文字、圖片、語(yǔ)音、視頻等多模態(tài)的融合,是基礎(chǔ)模型非常重要的長(zhǎng)期發(fā)展方向,是通往AGI的必經(jīng)之路,“百度在這些領(lǐng)域有著長(zhǎng)期投入,并將及時(shí)更新大模型的最新進(jìn)展?!?/p>
李彥宏還表示,“我有一個(gè)非常不一樣的判斷:視覺大模型最大的應(yīng)用場(chǎng)景是自動(dòng)駕駛。百度在這個(gè)方向上是最好的,是自動(dòng)駕駛的全球領(lǐng)導(dǎo)者,我們不只訓(xùn)練AI如何生成視頻,更訓(xùn)練AI理解真實(shí)世界發(fā)生的事情并預(yù)測(cè)未來。”
李彥宏透露,基于超過1億公里的、中國(guó)復(fù)雜城市道路測(cè)試?yán)锍虜?shù)據(jù),百度訓(xùn)練出來了Apollo視覺感知大模型。它具備檢測(cè)、跟蹤、理解、建圖四大基礎(chǔ)能力。這讓百度擁有了更智能、適應(yīng)性更強(qiáng)、更安全的自動(dòng)駕駛方案。
在大會(huì)現(xiàn)場(chǎng),百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布新一代智能計(jì)算操作系統(tǒng)——萬源,通過對(duì)AI原生時(shí)代的智能計(jì)算平臺(tái)進(jìn)行抽象與封裝設(shè)計(jì),為用戶屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復(fù)雜性,提升AI原生應(yīng)用開發(fā)效率與體驗(yàn)。
沈抖表示,隨著大模型技術(shù)的不斷演進(jìn),通過自然語(yǔ)言進(jìn)行編程正在成為現(xiàn)實(shí)。編程將不再面向過程或者面向?qū)ο?,而是面向需求;編程的過程將成為開發(fā)者表達(dá)愿望的過程,并為操作系統(tǒng)帶來革命性的變化。在操作系統(tǒng)的內(nèi)核中,底層硬件從以CPU算力為主變成以GPU算力為主,并且新增了被大模型壓縮的世界知識(shí)。操作系統(tǒng)管理的對(duì)象發(fā)生了本質(zhì)的變化,從管理進(jìn)程、管理微服務(wù),變成了管理智能。
“傳統(tǒng)的云計(jì)算系統(tǒng)依然重要,但不再是主角,我們需要一個(gè)全新的操作系統(tǒng),對(duì)新的計(jì)算平臺(tái),也就是智能計(jì)算做好抽象和封裝,重新定義人機(jī)交互,為開發(fā)者提供更簡(jiǎn)單、更流暢的開發(fā)體驗(yàn)?!鄙蚨度缡钦f。
“AI正在掀起一場(chǎng)創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡(jiǎn)單,人人都是開發(fā)者、人人都是創(chuàng)造者?!崩顝┖暝谘葜v最后表示,“今天的中國(guó),有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場(chǎng)景,有全球最完備的產(chǎn)業(yè)體系,國(guó)家也在大力鼓勵(lì)和支持‘人工智能+行動(dòng),每一個(gè)人、每一家企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產(chǎn)力?!?/p>