楊智杰
李笛。圖/受訪者提供
2023年,AI大模型無(wú)疑是國(guó)內(nèi)外科技領(lǐng)域最受關(guān)注的話題之一。ChatGPT大火,人們似乎看到通用人工智能的曙光??萍季揞^、創(chuàng)業(yè)者乃至各個(gè)行業(yè)紛紛推出自研大模型。據(jù)北京市科委等統(tǒng)計(jì),截至2023年10月,國(guó)內(nèi)大模型廠商及高校院所共計(jì)254家,上演“百模大戰(zhàn)”。
大模型熱潮中,小冰公司CEO李笛是一個(gè)特別的存在。小冰公司的前身是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團(tuán)隊(duì),公司曾發(fā)布過(guò)AI聊天機(jī)器人“小冰”。因此,當(dāng)ChatGPT爆火時(shí),小冰很容易被當(dāng)作對(duì)比的對(duì)象。去年,接受《中國(guó)新聞周刊》在內(nèi)的媒體采訪時(shí),李笛都提到,他承認(rèn)大模型的進(jìn)步,但并非大模型的“門(mén)徒”。他認(rèn)為模型不用一味求大,更愿意談技術(shù)如何商業(yè)化應(yīng)用。
當(dāng)時(shí),李笛被看作是個(gè)“異類(lèi)”。用他的話講,大模型最熱的時(shí)候,行業(yè)里不用“信仰”這個(gè)詞就落伍了。到了2024年,經(jīng)歷了卷百億甚至千億參數(shù)的競(jìng)賽后,國(guó)內(nèi)大模型廠商逐漸務(wù)實(shí),落地應(yīng)用成為行業(yè)關(guān)注的焦點(diǎn)。日前,《中國(guó)新聞周刊》專(zhuān)訪小冰公司CEO李笛,他談起過(guò)去一年對(duì)大模型熱的感悟。現(xiàn)在的他語(yǔ)氣輕松,李笛坦言,2023年他曾面臨極大壓力,甚至曾動(dòng)搖不“卷”大模型的想法。
創(chuàng)新和保守天然對(duì)立,科技行業(yè)的人非常害怕被認(rèn)為是保守的。但另一面,李笛從2013年加入小冰團(tuán)隊(duì),見(jiàn)證了人工智能領(lǐng)域發(fā)展的幾次浪潮,很多公司在風(fēng)口中迷失。對(duì)李笛的專(zhuān)訪,不只是在探討大模型,更是探討一個(gè)人面對(duì)巨大誘惑和時(shí)代焦慮時(shí),如何堅(jiān)持做自己。以下是李笛的自述。
我們是國(guó)內(nèi)較早接觸GPT大模型的一批人。2020年,小冰從微軟獨(dú)立出來(lái)前,我是微軟Bing搜索引擎亞洲區(qū)總經(jīng)理,微軟將ChatGPT放在搜索引擎中,推出New Bing,我們都較早地看過(guò)了。當(dāng)我們的興奮勁已經(jīng)過(guò)去時(shí),國(guó)內(nèi)才開(kāi)始興奮。
因此,我們也更早意識(shí)到,大模型有一些問(wèn)題。比如,目前從技術(shù)上判斷,要實(shí)現(xiàn)人工智能能力更大程度的飛躍,需要在GPT-4的基礎(chǔ)上,把參數(shù)規(guī)模再提升三個(gè)數(shù)量級(jí),但人們?cè)诙唐趦?nèi)無(wú)法解決算力的挑戰(zhàn)。此外,一味追求參數(shù)規(guī)模越來(lái)越大,并不會(huì)有新能力涌現(xiàn)。最近,行業(yè)里也有一些公司開(kāi)始推出小模型。去年2月,我還判斷過(guò),如何商業(yè)落地是大模型的核心問(wèn)題。過(guò)了近一年,業(yè)內(nèi)越來(lái)越多開(kāi)始討論大模型該如何應(yīng)用。
去年,我觀察到,國(guó)內(nèi)很多企業(yè)開(kāi)始圍繞大模型進(jìn)行競(jìng)賽,背后主要有三種考量。第一種是,GPT-4推出后,大模型沒(méi)有新能力的涌現(xiàn),像是卡在了紅綠燈路口,但很多人還要沖刺,因?yàn)樗麄兿胭€當(dāng)自己沖到紅綠燈路口時(shí),紅燈變綠,自己取得突破,領(lǐng)先行業(yè)。這一判斷確實(shí)存在一定概率,但大部分情況下,技術(shù)創(chuàng)新迭代并非一飛沖天,而是發(fā)展一波后被卡住,一段時(shí)間后再迎來(lái)一波創(chuàng)新。這才是科技史的常態(tài)。
其次,國(guó)內(nèi)現(xiàn)在有200多家大模型公司,其中很多并非傳統(tǒng)意義的人工智能公司,而是各個(gè)垂直領(lǐng)域的企業(yè),比如能源企業(yè)等。他們相信在掌握大模型技術(shù)后,能有機(jī)會(huì)打破該領(lǐng)域原有的競(jìng)爭(zhēng)格局。這是因?yàn)榇竽P偷幕咎卣魇谴罅Τ銎孥E,準(zhǔn)入門(mén)檻低,可以很快看到一個(gè)結(jié)果,給了不同行業(yè)的人一個(gè)幻想。但深入后人們會(huì)發(fā)現(xiàn),結(jié)果不如想象中那么美好。
最后一種是,他們只是把大模型當(dāng)作一個(gè)概念,來(lái)獲得一個(gè)新的賣(mài)點(diǎn),就像是當(dāng)年的元宇宙。
我們觀察到了這些現(xiàn)象,所以,我不愿意說(shuō)“信仰大模型”,大模型只是我們眾多技術(shù)迭代的一部分。去年年初,你說(shuō)大模型的技術(shù)好,還是比較客觀的,但后來(lái)逐漸演變成,如果你不用“信仰”這個(gè)詞就落伍了。我記得當(dāng)時(shí)參加行業(yè)會(huì)議,在我前后演講的人講到大模型,都會(huì)提到“工業(yè)革命”。當(dāng)一個(gè)行業(yè)只有用這么夸張的表達(dá)才能證明不保守時(shí),就一定是個(gè)非常大的泡沫。我不想神話大模型,它是個(gè)有用的工具,解決了很多過(guò)去的問(wèn)題,但它不是靈丹妙藥。
我現(xiàn)在說(shuō)的時(shí)候放松多了,因?yàn)樾袠I(yè)現(xiàn)在開(kāi)始有了這樣的共識(shí)。在人工智能領(lǐng)域,一直沒(méi)有產(chǎn)生真正成功的面向企業(yè)和消費(fèi)者的產(chǎn)品。2020年前,小冰還在微軟時(shí),不太受外界影響。但2020年,小冰從微軟分拆為獨(dú)立公司運(yùn)營(yíng),作為創(chuàng)業(yè)公司,我們還沒(méi)有能力決定自己的生存時(shí),如果跟行業(yè)主流有很大不同,會(huì)有很多人不認(rèn)同你。去年2月,就有投資人問(wèn)我,你是不是反對(duì)大模型?有投資人甚至跟我說(shuō),小冰也要做超大規(guī)模的、超大參數(shù)的大模型,我也差點(diǎn)沒(méi)扛住。
外界對(duì)我們的誤解是,我們不做大模型。我們很早就在關(guān)注,而且一直深入其中。但我們不拼大參數(shù),更關(guān)注的是中等參數(shù)規(guī)模和小參數(shù)規(guī)模大模型的可用性。很早Google就發(fā)過(guò)論文稱(chēng),650億參數(shù)以下的模型,沒(méi)有產(chǎn)生明顯的思維鏈能力。我們當(dāng)時(shí)不這么認(rèn)為,現(xiàn)在回頭看,我們賭對(duì)了,參數(shù)在幾百億,甚至幾十億的大模型,也有這個(gè)能力。
AI少女小冰。圖/受訪者提供
和其他行業(yè)相比,科技行業(yè)有一個(gè)突出現(xiàn)象:科技行業(yè)的人非常害怕被認(rèn)為是保守的。在公開(kāi)場(chǎng)合,當(dāng)我們對(duì)一個(gè)新技術(shù)、特別是像大模型這么亮眼的新技術(shù)發(fā)表評(píng)論時(shí),哪怕只是客觀評(píng)價(jià)說(shuō)“大模型是好的,但它不是全部,它沒(méi)有把過(guò)去很多東西顛覆掉”,就已經(jīng)算是保守了。
我們?cè)?013年組建小冰團(tuán)隊(duì),十年中,我們送走一波又一波風(fēng)口追逐者。從玩家角度,這一次國(guó)內(nèi)大模型的熱潮,活躍的多是近兩年成立人工智能企業(yè),因?yàn)楹芏喙径荚谶^(guò)去一波波風(fēng)口中迷失了。面對(duì)這種短期的熱潮,我們看似保守,但我們是目前為止存活最長(zhǎng)的人工智能企業(yè)之一。從這一角度來(lái)看,我們被一些聲音質(zhì)疑為“AI舊世代”,也是一種“榮幸”。
在科技行業(yè)想要堅(jiān)持做一件事情,是非常奢侈的。因?yàn)橹袊?guó)的科技公司,本質(zhì)上是由一級(jí)市場(chǎng)、二級(jí)市場(chǎng)“擊鼓傳花”來(lái)完成企業(yè)的基本輸血。很多公司及其投資人會(huì)把上市定義為最主要的目標(biāo)。如果公司不追風(fēng)口,就不能拿到下一筆融資,上一筆融資的投資人就沒(méi)辦法獲得更高的企業(yè)估值,也就沒(méi)有辦法跟LP(有限合伙人)交代。這也是人之常情,但這使得很多創(chuàng)業(yè)公司的戰(zhàn)略不得不走樣了。
前段時(shí)間,有消息稱(chēng),一個(gè)剛畢業(yè)的自然語(yǔ)言處理專(zhuān)業(yè)的博士生,年薪就有300萬(wàn)元,這是不合理的,也會(huì)影響博士生的自我職業(yè)認(rèn)知。創(chuàng)業(yè)公司愿意給出這么高的薪酬,并不是因?yàn)樗麄兘o公司創(chuàng)造了價(jià)值,而是當(dāng)公司去拉投資時(shí),用以回復(fù)投資人關(guān)注的指標(biāo),比如公司有多少博士,或者有多少?gòu)腛pen AI出來(lái)的人。有些博士生在創(chuàng)業(yè)公司待了三個(gè)月,又被另一家公司以更高的薪酬挖走。博士生肯定是開(kāi)心的,但他們?cè)趧?chuàng)業(yè)公司間不斷流轉(zhuǎn)時(shí),除了薪酬提升,沒(méi)有機(jī)會(huì)真正做有意義的研究。
你很難說(shuō)這是投資人的問(wèn)題,因?yàn)橥顿Y人要對(duì)LP負(fù)責(zé)。也很難說(shuō)是LP的問(wèn)題,因?yàn)樗麄兲湾X(qián)就是為了獲得回報(bào)。這似乎是一個(gè)沒(méi)有人錯(cuò)的事情,也是中國(guó)科技領(lǐng)域很難誕生原始創(chuàng)新的原因之一。
我們?nèi)ツ暌苍媾R很大的壓力。投資界在經(jīng)歷2022年巨大的失落情緒后迎來(lái)人工智能的浪潮,投資人看到了春天。去年,在人工智能行業(yè)里,固然有對(duì)大模型抱有熱情的人,他們往往是科研工作者。除此之外,更多科技公司表現(xiàn)出的是一種焦慮。就像應(yīng)試教育下的心態(tài),不能輸在起跑線上,盡管不知道它是什么,但總覺(jué)得錯(cuò)過(guò)一定會(huì)后悔。這種焦慮在行業(yè)內(nèi)傳遞,但創(chuàng)新很難在焦慮中產(chǎn)生。
我個(gè)人也特別希望出現(xiàn)一個(gè)大模型,和小冰的對(duì)話框連接后,所有對(duì)話的問(wèn)題都能解決,這是我做夢(mèng)都會(huì)笑醒的事情。但這很難實(shí)現(xiàn),背后還需要很多服務(wù)。這就像是個(gè)人電腦,不是說(shuō)有一個(gè)CPU就得到了一切,還要有主板,CPU本身也是一個(gè)超級(jí)大規(guī)模的集成電路,需要各種模塊組合。
人工智能領(lǐng)域從來(lái)不缺很酷的東西。當(dāng)年,微軟利用人臉識(shí)別技術(shù)做了個(gè)應(yīng)用叫“How Old”,上傳一張照片,就能識(shí)別年齡,一時(shí)間風(fēng)靡。前一陣,機(jī)器人跳“科目三”也很酷。但真正缺的、值得我們重視的是商業(yè)模式的探索,究竟如何讓人們真正認(rèn)同人工智能的價(jià)值,并為之買(mǎi)單。
我有一個(gè)印象深刻的體會(huì),產(chǎn)品價(jià)值和技術(shù)不一定是息息相關(guān)的。比如有的機(jī)器人會(huì)跳舞,但人們玩膩了,就會(huì)把它忘掉。但你發(fā)現(xiàn),很多女生從小買(mǎi)的布娃娃,毫無(wú)科技含量,但她們對(duì)它傾注了巨大的情感,有人甚至在長(zhǎng)大后會(huì)花1萬(wàn)塊錢(qián)去修復(fù)兒時(shí)的“伙伴”。技術(shù)在其中不一定需要扮演什么角色。
今天,大家用大模型進(jìn)行很多輪對(duì)話。很多人都認(rèn)為,大模型要更智能、更聰明,像愛(ài)因斯坦一樣。但生活中,我們不總是因?yàn)橐粋€(gè)人足夠聰明,才會(huì)和對(duì)方交朋友。有的人可能笨笨的,但很善良,你就不把對(duì)方當(dāng)朋友嗎?人不是這樣的。那為什么我們?cè)谧隹萍籍a(chǎn)品時(shí),就一定認(rèn)為更先進(jìn)的技術(shù)會(huì)更好?不一定,關(guān)鍵是如何把它用在更合適的地方。
2024年,我預(yù)測(cè)人工智能行業(yè)發(fā)展會(huì)退熱,現(xiàn)在的大模型同質(zhì)化嚴(yán)重,市面上用不了這么多大模型。而且,用戶(hù)的付費(fèi)意愿又不是很容易建立。一些去年融到錢(qián)的企業(yè)也可能會(huì)引發(fā)新的內(nèi)卷,其實(shí)這些內(nèi)卷的行為已經(jīng)在發(fā)生了,只是在 2024 年可能會(huì)更明顯一些。