国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字經(jīng)濟時代的“智源密碼”

2024-06-27 21:49:23陳寧
前線 2024年6期
關(guān)鍵詞:研究院人工智能模型

陳寧

高速公路上,無人駕駛駛?cè)氍F(xiàn)實,沒有司機的出租車正搭載乘客,以“頂格”時速駛向機場;

手術(shù)室里,腹腔鏡中纖毫畢現(xiàn),醫(yī)生正用醫(yī)療機械臂為遠在新疆的患者實施腫瘤切除手術(shù);

制造車間內(nèi),“鋼鐵巨象”翩然起舞,120余臺焊接、抓取、組裝和搬運機器人正圍繞16條智能生產(chǎn)線各顯神通;

……

這些,只是數(shù)字化時代的北京城市一隅。在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,“智力”已如水、電、網(wǎng)一樣流向日常生活,一步步實現(xiàn)著人們對新質(zhì)生產(chǎn)力構(gòu)造的活躍社會的渴望。

數(shù)字賦能千行百業(yè),離不開“產(chǎn)業(yè)大腦”的支持。這“大腦”,就是人工智能的底座——大模型。

海淀區(qū)成府路150號。一棟看似普通的紅磚建筑里,集結(jié)了幾乎北京最頂尖的人工智能領(lǐng)域人才。這里,就是北京智源人工智能研究院所在地。也正是這棟樓里,誕生了我國首個大模型——“悟道”,這家研究院由此沖破西方國家的壟斷,推動我國人工智能發(fā)展行至深處。

時不我待,構(gòu)筑人工智能生態(tài)“護城河”

2020年5月,美國著名人工智能公司Open AI發(fā)布一款名為“GPT-3”的語義大模型,一時掀起行業(yè)巨浪——通過海量數(shù)據(jù)學習,人工智能首次出現(xiàn)了類似人類的邏輯推理能力。

中國的科研工作者在為GPT-3沸騰的同時,也產(chǎn)生了極大的心理落差——彼時,我國人工智能領(lǐng)域在各個方面并不占優(yōu)。

《中國新一代人工智能發(fā)展報告2019》顯示,當時,雖然我國人工智能領(lǐng)域論文數(shù)量全球居首,但引文影響力指標卻相對落后;人才擁有量雖僅次于美國,但高水平人才卻不到美國的五分之一。即使是在全國人工智能高地的北京,大模型方向的研究也幾乎是空白。

更嚴峻的是,一旦被裹挾進入西方構(gòu)建的人工智能生態(tài)圈,那么所有與之相關(guān)的產(chǎn)業(yè)鏈躍遷,都有可能被掣肘。如同手機上的應(yīng)用軟件,如果沒有強大的系統(tǒng)支撐,開發(fā)得再多、再好也用不了。“必須聚焦攻關(guān)自主可控的底座大模型,構(gòu)建起自己的人工智能生態(tài)‘護城河?!鼻迦A大學自然語言處理實驗室主任孫茂松說。

孫茂松和同事們四處尋求合作者,卻發(fā)現(xiàn)這項壁壘極高的研究,高校做不了,企業(yè)又不愿意做。雖是春暖花開的5月,他們卻猶如淋了一身冷水。

高校通常以“項目制”牽頭科研,大多以“年”為論證周期。但人工智能領(lǐng)域的科技創(chuàng)新瞬息萬變,必須全力追趕。顯然,這種科研機制與“大模型”的研發(fā)訓練并不適配。

困擾企業(yè)的,則是投入產(chǎn)出比問題。大模型好似“空中樓閣”,需要算法、算力、數(shù)據(jù)的海量資金支持。況且,依據(jù)“摩爾定律”,投入的昂貴設(shè)備每18個月就會貶值一半,成果卻遙遙無期。這讓不少企業(yè)望而卻步。

躊躇之際,孫茂松、劉知遠、黃民烈等幾位科學家不約而同地將目光投向了離清華只有幾百米遠的一所新型研發(fā)機構(gòu)——北京智源人工智能研究院(以下簡稱“智源研究院”)。

這家新型研發(fā)機構(gòu),新在哪里?

成立于2018年11月的智源研究院,肩負著人工智能前沿探索使命,從主體、人才使用到成果轉(zhuǎn)化,解決的是創(chuàng)新研發(fā)中生產(chǎn)要素錯配、失配、低配造成的堵點、痛點、難點。

“作為科技部和北京市政府支持下成立的民辦非營利性研究機構(gòu),智源實行理事會領(lǐng)導下的院長負責制。這就決定了它可以不設(shè)考核和階段性目標,鼓勵科學家自主決策,去破解那些顛覆性技術(shù)和前沿技術(shù)難題。”智源研究院理事長黃鐵軍舉了一個生動的例子,“重大的國家級科研項目,用兩三年時間研究立項并不鮮見。但在智源,只要論證科學嚴謹,兩小時通過由業(yè)內(nèi)頂級專家組成的‘院務(wù)會、即刻撥付數(shù)百萬元研發(fā)資金,都是常態(tài)。”

制度集成、創(chuàng)新賦能,這是“時間不等人”的膽識。科學家們與智源研究院一拍即合。

以技術(shù)為信仰,勇闖大模型研發(fā)“無人區(qū)”

2020年11月,智源研究院以北京市籌集的1000P算力支持為起點,決心背水一戰(zhàn)。

沒有作業(yè)可以抄,沒有經(jīng)驗可以循,有的是以技術(shù)為信仰的一腔熱情和錨定國家重大戰(zhàn)略需求的不懈努力。智源研究院將參與者整合為3個小組,深入中文大模型研發(fā)“無人區(qū)”——一個個高風險、非共識、顛覆性的研究領(lǐng)域。

以文源團隊負責的超大規(guī)模預訓練語言模型為例。他們遇到的第一個困難,就是怎么阻止大模型“詞不達意”和“答非所問”。原來,當時全球通用大模型數(shù)據(jù)訓練集里,中文語料僅占1.3%。團隊搜索得來的50TB原始數(shù)據(jù),主要源自電商、社交、搜索等渠道,存在大量的數(shù)據(jù)偏見。高質(zhì)量中文數(shù)據(jù),一度成為稀缺品。

中文語義深奧又靈活多變,給大模型“投喂”的語料質(zhì)量,對運行效果影響極大。團隊決心秉持細節(jié)上的“技術(shù)潔癖”,構(gòu)建高質(zhì)量數(shù)據(jù)集,讓大模型高效、經(jīng)濟地運行。團隊負責人劉知遠與黃民烈所帶的8名博士生,全被派去做數(shù)據(jù)標注與“清洗”。

他們夜以繼日地比對、推敲著每行編碼,以確保數(shù)據(jù)的完整、全面、合法且唯一。其間,團隊沒有發(fā)表過一篇學術(shù)論文。這樣做,無論是對教師還是對學生,都是極大的冒險。“如果一無所獲,我們在學校的學術(shù)考核將被認定為不合格?!秉S民烈說,“這是拿著大家的職業(yè)生涯去做賭注。幸運的是,我們的方向找對了!”

最終,團隊將原始數(shù)據(jù)壓縮至2.6TB,中文大模型有了第一個高質(zhì)量數(shù)據(jù)集。

從高端芯片到深度學習框架,從算力、算法到數(shù)據(jù)……智源研究院集中優(yōu)勢資源,奮力攻關(guān)。2021年3月,“悟道1.0”問世。3個月后,“悟道2.0”亮相,參數(shù)規(guī)模是GPT-3的10倍。

“悟道”,驟然改變了世界人工智能領(lǐng)域一家獨大的發(fā)展格局。正是從這時起,智源研究院被全球人工智能領(lǐng)域三巨頭之一的微軟公司視為主要競爭對手。與此同時,國家加快布局人工智能產(chǎn)業(yè),并將其寫入“十四五”規(guī)劃。

以人工智能為引擎,高質(zhì)量發(fā)展的底色更加鮮明。智源研究院的不懈探索,仿佛解開了中文大模型的研發(fā)密碼。隨即,猶如百舸爭流,科技企業(yè)紛紛跟進,創(chuàng)新火花競相迸發(fā)。截至2024年3月,國內(nèi)大模型數(shù)量超243個。我國的大模型發(fā)展,已經(jīng)形成了一條壁壘極高的技術(shù)“護城河”,得以涵養(yǎng)整個產(chǎn)業(yè)生態(tài)。

理想與使命合一,形成人才“強磁場”

“群星閃耀”,有人用這樣的詞,形容智源研究院的人才生態(tài)。

眾所周知,人工智能作為前沿科技,離不開人才驅(qū)動。近年來,智源研究院已經(jīng)遴選并支持以“智源研究員”和“智源青年科學家”為主體的94名智源學者,其中近一半為38歲以下的青年學者。他們的學術(shù)背景橫跨高校、科研單位及企業(yè)研究機構(gòu),形成了代表我國人工智能領(lǐng)先科研水平的“北京隊”。

人們不免疑惑:作為一家民辦非營利研究機構(gòu),智源研究院既沒有“帽子”,待遇也無法與頭部企業(yè)對標,緣何吸引這樣一批頂級人才?

“在這里,既是在做自己想做的事,也是在做國家和社會需要的事。當理想與使命合一,就會迸發(fā)最強驅(qū)動力?!敝窃囱芯吭焊痹洪L林詠華用親身經(jīng)歷給出了答案。

近兩年,國內(nèi)人工智能領(lǐng)域已進入“百模大戰(zhàn)”階段。為避免無序競爭,智源研究院將目光轉(zhuǎn)向營造更健康的大模型生態(tài)圈。

2023年,林詠華決心以“科學度量大模型評測基準”為研究方向,申報科技部重點課題。作為人工智能領(lǐng)域的開創(chuàng)者之一,林詠華覺得一切本該水到渠成。當她興沖沖地去領(lǐng)申報材料時,卻被告知不符合初選資格——沒有正高級職稱。

只能盡快申請職稱。但了解政策后,林詠華又遇波折——由于研究的領(lǐng)域太過前沿,自己根本沒有符合的職稱序列可以申報,更找不到合適的專家來評審。

了解情況后,黃鐵軍找到她:“只要有好的想法,智源會創(chuàng)造一切條件幫助科研人員實現(xiàn)?!辈粏柍錾怼⒉豢凑撐?,只看是否取得標桿性成就、有沒有成為標桿的潛力——從誕生之日起,智源研究院的選人、用人機制,就一直向?qū)W術(shù)實力和科研潛力傾斜。

2023年3月,黃鐵軍找到北京市人力資源和社會保障局尋求幫助?!奥毞Q評聘工作的改革方向,必須與國家發(fā)展戰(zhàn)略同心同向?!笔腥松缇执饛?。

僅僅一個月后,《北京市高層次、急需緊缺、特殊特藝人才高級職稱考核認定辦法》出臺。通過“一事一議”“一人一策”“隨時隨刻”評審、“3+1”實名舉薦,很快,林詠華獲得了正高級職稱。她也成為受益于此辦法的第一人。

同年,林詠華承接的國家科技部重點課題正式立項。這個課題,也讓智源研究院完成了從“運動員”到“裁判員”的角色轉(zhuǎn)變。

“這在別處是難以想象的。它給我們的動力,不是優(yōu)渥的待遇能給予的?!绷衷伻A如是說。

林詠華的經(jīng)歷,只是智源研究院眾多科研人員的一個縮影?!爸窃词且怨怖鏋閷虻难芯繖C構(gòu),注定無法提供最具競爭力的薪酬”,智源研究院院長王仲遠說,“但這也是一種篩選同行者的良性機制?!?個月前,他剛從業(yè)界一家頭部公司離職,降薪90%來到這里。

從“實驗室”走向“應(yīng)用場”,賦能千行百業(yè)

作為開源系統(tǒng),“悟道”大模型已被下載2000余萬次。每次下載,都有可能是對某條生產(chǎn)線、某個企業(yè)甚至某個產(chǎn)業(yè)的一次數(shù)字賦能?!斑@也是智源的一個重要使命,讓科技創(chuàng)新成果不斷從‘實驗室走向‘應(yīng)用場?!秉S鐵軍說。

功成不必在我。不僅是開源大模型,在科研過程中生發(fā)成熟項目,智源研究院在助推成果轉(zhuǎn)化時,同樣不遺余力。

算法工程師趙撼宇,一畢業(yè)就來到了智源研究院。他的一項專利技術(shù),在“悟道”與OPPO手機小布語音助手的合作項目中,發(fā)揮了關(guān)鍵作用?!霸诔晒涞氐哪强?,我感到自己的價值得到了認可?!壁w撼宇說。

同許多手機廠商一樣,OPPO小布以往依據(jù)的是互聯(lián)網(wǎng)數(shù)據(jù),有數(shù)以億計的問題難以回答,非常影響用戶體驗。但如果自建語料庫,周期長、人工數(shù)據(jù)標注成本高,企業(yè)難以承受。他們找到智源研究院學術(shù)副院長唐杰尋求幫助,唐杰將“悟道”大模型中趙撼宇負責研發(fā)的“生成式回答系統(tǒng)”推薦給了企業(yè)。

2023年年底,OPPO小布接入“悟道”,一紙專利,使手機語音助手的單條回答建設(shè)成本降低了99%,徹底解決了一個行業(yè)的共通性問題。

“科研工作者雖然有極強的創(chuàng)新能力,但成熟項目的轉(zhuǎn)化落地并不盡如人意?!敝窃纯蒲羞\營部經(jīng)理趙小帆說,“企業(yè)如何選址、怎樣融資和申請政府引導基金、去哪里組建工程技術(shù)團隊等問題,智源都會手把手地幫助他們落地?!?/p>

曾任賽迪集團總裁的孫會峰,在我國加入世貿(mào)組織談判過程中,隨團調(diào)研了大量中國企業(yè)。他發(fā)現(xiàn),大部分企業(yè)70%的時間都花在了了解產(chǎn)業(yè)鏈、合作伙伴、競爭對手和各地產(chǎn)業(yè)政策上,在企業(yè)研發(fā)上投入的精力顯得力不從心。

當接觸到“悟道”大模型時,孫會峰豁然開朗:“借助智源的產(chǎn)業(yè)知識計算引擎,能俯瞰整個生態(tài),為企業(yè)打開‘上帝視角,觀察趨勢。”抱著這樣的想法,他決心自己創(chuàng)業(yè)。

來到智源研究院,孫會峰感覺收獲更多。2021年,借助智源研究院天使輪投資1000萬元,孫會峰成立了北京上奇數(shù)字科技有限公司(以下簡稱“上奇數(shù)科”)。幾個月后,智源研究院又幫他暢通了國家專利局的專利綠色通道,以往1年半時間才能獲得的專利授權(quán),現(xiàn)在4個月就拿到了,這讓上奇數(shù)科得以在激烈的人工智能“卡位賽中”占得先機。

不僅如此。當孫會峰為如何優(yōu)化產(chǎn)業(yè)鏈精度而苦惱時,智源研究院又為他推薦了算法工程師史業(yè)民?!耙淮握{(diào)教,產(chǎn)業(yè)圖譜的精度便從70%上升至98%?!睂O會峰說?,F(xiàn)在,上奇數(shù)科的產(chǎn)業(yè)知識圖譜“上奇產(chǎn)業(yè)通”兩秒就能實時生成包括100余條產(chǎn)業(yè)鏈、5000萬家企業(yè)在內(nèi)的40余類產(chǎn)業(yè)數(shù)據(jù)集。

好風憑借力。

成立僅3年,上奇數(shù)科迅速成長為國家級專精特新企業(yè),估值達10億元。

注重“從0到1”的原始創(chuàng)新,也注重“從1到N”的產(chǎn)業(yè)轉(zhuǎn)化,通過產(chǎn)學研用緊密合作,智源研究院至今已孵化了“月之暗面”“深言科技”等近百家企業(yè),其中10余家已成為“獨角獸”。

有這樣一組數(shù)據(jù),令人振奮:作為數(shù)字經(jīng)濟發(fā)展的重要驅(qū)動引擎,2023年,北京人工智能產(chǎn)業(yè)的核心產(chǎn)值突破2500億元,輻射產(chǎn)值規(guī)模已超萬億元!

又是一個草長鶯飛的季節(jié)。前不久閉幕的中關(guān)村論壇上,智源研究院等16家機構(gòu)發(fā)起并成立了中關(guān)村人工智能聯(lián)盟。一群銘記國家使命的科學工作者,錨定國家重大戰(zhàn)略需求和北京數(shù)字經(jīng)濟標桿城市建設(shè),正在向科學技術(shù)的更深處進軍……

猜你喜歡
研究院人工智能模型
一半模型
北京食品科學研究院
肉類研究(2022年5期)2022-06-16 05:53:24
工程技術(shù)研究院簡介
從心所欲不逾矩——為中國戲曲研究院成立70周年作
戲曲研究(2021年3期)2021-06-05 07:06:46
不是我!是他搗亂!
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
龙门县| 公主岭市| 浦城县| 九江县| 兴海县| 康马县| 方城县| 沙雅县| 寿宁县| 大埔县| 白河县| 双鸭山市| 大英县| 纳雍县| 通道| 阳泉市| 定州市| 台东市| 东乌| 彰化县| 娄烦县| 西和县| 定州市| 黄陵县| 麻江县| 平阳县| 黄龙县| 临武县| 奈曼旗| 吉隆县| 新宁县| 霍林郭勒市| 宣化县| 嘉鱼县| 安新县| 马鞍山市| 贡嘎县| 剑川县| 宜良县| 固始县| 清新县|