科技大廠盯上程序員,要幫他們解放雙手。
今年以來(lái),AI代碼助手,熱度上升,海內(nèi)外頭部互聯(lián)網(wǎng)公司紛紛下場(chǎng),推動(dòng)大模型應(yīng)用于編碼領(lǐng)域,爭(zhēng)相打磨產(chǎn)品,探索商業(yè)化路徑。
據(jù)不完全統(tǒng)計(jì),市面上的AI代碼助手,已有幾十款。
商湯的“代碼小浣熊”,是這里頭資歷較深的一個(gè)。這款軟件智能研發(fā)助手,于2022年底啟動(dòng)研發(fā),去年4月發(fā)布。
“在實(shí)際應(yīng)用中,代碼小浣熊可幫開(kāi)發(fā)者提升編程效率超50%。”商湯科技Copilot應(yīng)用技術(shù)負(fù)責(zé)人張濤向《21CBR》表示。
2022年底,AI編程工具GitHub Copilot走紅。商湯內(nèi)部開(kāi)始探討,要不要專門(mén)針對(duì)編程場(chǎng)景,落地一款國(guó)產(chǎn)AI應(yīng)用。
當(dāng)時(shí)的國(guó)內(nèi)大廠,普遍持觀望態(tài)度,下場(chǎng)者少。“我們判斷,(AI輔助代碼生成)這個(gè)方向,一定能做出來(lái)實(shí)用產(chǎn)品?!睆垵貞浀馈?/p>
做了十幾年研發(fā)的張濤等人領(lǐng)頭,一個(gè)擁有三四名成員的小分隊(duì),快速組建起來(lái),研究員、程序員加上產(chǎn)品經(jīng)理,角色配比齊整。
“商湯有‘基建’,提供模型訓(xùn)練推理方面的支持,我們得以專注在產(chǎn)品能力和體驗(yàn)上?!睆垵f(shuō)。
去年DlZuxxRxfH8CYhNOmgod5w==3月中旬,團(tuán)隊(duì)接到公司任務(wù),4月官宣第一代日日新大模型的發(fā)布會(huì)上,AI代碼助手會(huì)作為其新功能的一部分登臺(tái)。
留給張濤團(tuán)隊(duì)精雕細(xì)琢的時(shí)間,只剩不到1個(gè)月。
從代碼補(bǔ)全、測(cè)試代碼生成等基礎(chǔ)場(chǎng)景出發(fā),緊趕慢趕,AI代碼助手順利發(fā)布。
效果不錯(cuò),在一個(gè)已開(kāi)發(fā)完成的基模型的基礎(chǔ)上,從需求分析到完成產(chǎn)品開(kāi)發(fā),一般需要100人天(衡量人力資源消耗量的單位,人數(shù)和天數(shù)相乘),去年,小浣熊能節(jié)省30%工作量,至70人天。
程序員出身的張濤,了解從業(yè)者痛點(diǎn),快速推出解決方案。
比如,代碼小浣熊可一鍵生成代碼的提交記錄日志。按常規(guī)做法,開(kāi)發(fā)人員每次寫(xiě)完代碼,提交新版本之前,需要從頭捋一遍變更記錄,再“總結(jié)成人話”。
“在一些開(kāi)發(fā)人員眼里,干這活可能比寫(xiě)代碼的負(fù)擔(dān)還重。我們很早就做了這個(gè)功能,原本耗時(shí)10分鐘的事情,小浣熊一秒鐘就能搞定。”張濤說(shuō)。
中國(guó)程序員數(shù)量超800萬(wàn),排名全球第二。在傳統(tǒng)開(kāi)發(fā)模式下,大約80%的代碼量,需要開(kāi)發(fā)者自行編寫(xiě)。
在游戲、互聯(lián)網(wǎng)等行業(yè),開(kāi)發(fā)場(chǎng)景特性與AI代碼生成高度契合,對(duì)標(biāo)準(zhǔn)化和效率提升有著強(qiáng)烈需求。
“代碼方面的提效,按不同場(chǎng)景有差別,但大體落在30%~40%的區(qū)間?!睆垵f(shuō)。
AI代碼助手還能幫開(kāi)發(fā)者掌握新的編程語(yǔ)言,加速提升技能等。
目前,代碼小浣熊可以為90多種主流編程語(yǔ)言提供代碼編寫(xiě)建議,提供從軟件需求分析、架構(gòu)設(shè)計(jì)到代碼編寫(xiě)、測(cè)試等全鏈條的支持,功能走向全面集成。
其一系列能力,構(gòu)建于商湯“日日新SenseNova”大語(yǔ)言模型之上。自去年4月發(fā)布至今,商湯大模型已推出5個(gè)大版本。
代碼小浣熊的性能和精度,大幅提升。代碼生成的接納率,從早期的10%以下提升到30%以上,能嘗試搞定系統(tǒng)性、復(fù)雜度高的問(wèn)題。
代碼小浣熊幾乎每月迭代一個(gè)新版本。團(tuán)隊(duì)各角色的分工和視角不同,張濤笑稱,基本每個(gè)版本發(fā)布前,都免不了吵一次架。
“吵著吵著,大家意識(shí)到,有些問(wèn)題不能全推給某一方,產(chǎn)品和研究,得一起出力。”
代碼小浣熊的形態(tài)逐漸成熟,年初,新成員“辦公小浣熊”,加入陣列。
這是一款大模型原生數(shù)據(jù)分析產(chǎn)品,用戶輸入自然語(yǔ)言,一鍵轉(zhuǎn)化為分析和可視化結(jié)果,支持復(fù)雜表格、多表格、多文件的理解,可賦能財(cái)務(wù)分析、商業(yè)分析、銷售預(yù)測(cè)等應(yīng)用場(chǎng)景。
張濤提到,其底層技術(shù),為商湯日日新·商量語(yǔ)言大模型-數(shù)據(jù)分析版本,在數(shù)據(jù)分析場(chǎng)景下的數(shù)據(jù)測(cè)試集中環(huán)節(jié),能力超過(guò)GPT-4。
“兩個(gè)產(chǎn)品其實(shí)算繼承關(guān)系。”
他表示,模型寫(xiě)代碼,能達(dá)到至少七成,大概率可以直接運(yùn)行的程度,代碼質(zhì)量較高,同時(shí)模型能發(fā)現(xiàn)代碼的問(wèn)題并自動(dòng)修正,就能在此之上,疊加新場(chǎng)景。
辦公與代碼生成,兩個(gè)場(chǎng)景看似差別大,其實(shí)產(chǎn)品邏輯相同?!岸际菍?gòu)思好的問(wèn)題拋給產(chǎn)品,讓產(chǎn)品來(lái)解決。”張濤說(shuō)。
接近商湯的人士分析稱,在上個(gè)AI周期,商湯的智慧城市、智慧汽車等主營(yíng)業(yè)務(wù)里,算法的貢獻(xiàn)比例非常大,但沒(méi)有關(guān)聯(lián)任何產(chǎn)品,“商湯需要把自身的AI能力,通過(guò)產(chǎn)品的形式展示給公眾,告訴大家AI怎樣發(fā)揮作用,賦能哪些場(chǎng)景”。
處于發(fā)展初期的代碼小浣熊,已邁出商業(yè)步伐。
其C端分為個(gè)人免費(fèi)版和49元的升級(jí)收費(fèi)版,B端的企業(yè)標(biāo)準(zhǔn)版,按899元/人/年收費(fèi),同時(shí)提供企業(yè)私有化部署服務(wù)。
其還有“小浣熊軟件研發(fā)助手一體機(jī)”,免費(fèi)安裝部署,開(kāi)箱即用,費(fèi)用在30萬(wàn)元左右。單臺(tái)支持超150人團(tuán)隊(duì)使用,按三年的使用時(shí)長(zhǎng),人均攤下來(lái)的每日成本在幾塊錢(qián)。
現(xiàn)階段,商湯側(cè)重推廣一體機(jī)和私有化部署方式,先期面向?qū)I應(yīng)用接納度和需求較高的中小型企業(yè)客戶。
按商湯的提法,小浣熊是一個(gè)“家族”,作為AI Native生產(chǎn)力系列工具,覆蓋軟件開(kāi)發(fā)、數(shù)據(jù)分析、編程教育等多個(gè)場(chǎng)景。
家族里的兩位“成員”,已服務(wù)數(shù)十萬(wàn)用戶。這條產(chǎn)品線的成長(zhǎng)壯大,呼應(yīng)商湯的技術(shù)商業(yè)化走向新階段。
21世紀(jì)商業(yè)評(píng)論2024年11期