張宏羽
“Sora”演示視頻截圖
2023年,人工智能大語(yǔ)言模型“ChatGPT”憑借強(qiáng)大的自然語(yǔ)言處理能力和對(duì)上下文理解的深度“爆火”,給沉寂多年的人工智能行業(yè)撕開了一道口子。彼時(shí),奇績(jī)論壇創(chuàng)始人陸奇就已預(yù)測(cè),未來(lái)大模型無(wú)處不在,是技術(shù)世界中的“全新物種”。
時(shí)下,人工智能浪潮愈發(fā)涌動(dòng),“無(wú)處不在”的預(yù)言初見端倪:2024年2月,人工智能視頻生成類模型“Sora”將技術(shù)推到了一個(gè)全新的視覺維度,其可以根據(jù)用戶輸入的提示詞,生成長(zhǎng)達(dá)一分鐘的高清視頻,堪稱“指上生花”。在官方公布的演示視頻中,一名時(shí)尚女性走在城市街頭,從主要人物到背景人物、從遠(yuǎn)處的建筑到近處的地面,具有極強(qiáng)的真實(shí)感,連臉部細(xì)節(jié)都清晰可見。
當(dāng)然,“Sora”并非完美,發(fā)布者對(duì)此并不避諱,模型在準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性方面可能會(huì)遇到困難,或是無(wú)法理解具體的因果關(guān)系實(shí)例,還可能會(huì)混淆提示的空間細(xì)節(jié),并且在處理隨時(shí)間發(fā)生事件的精確描述方面也可能存在困難……盡管如此,“Sora”的橫空出世仍被不少業(yè)內(nèi)人士視為人工智能模型領(lǐng)域的一大里程碑。在360創(chuàng)始人周鴻祎看來(lái),“Sora”只是小試牛刀,它展現(xiàn)的不僅僅是視頻制作能力,而是大模型對(duì)真實(shí)世界有了“理解”和“模擬”之后,會(huì)帶來(lái)新的成果和突破。
相較于以往的視頻生成類模型,“Sora”甫一誕生,就展現(xiàn)出技術(shù)的新姿態(tài)。中國(guó)信息協(xié)會(huì)常務(wù)理事、國(guó)研新經(jīng)濟(jì)研究院創(chuàng)始院長(zhǎng)朱克力在接受記者采訪時(shí)表示,傳統(tǒng)的生成式人工智能多依賴于預(yù)定義的規(guī)則和算法來(lái)生成內(nèi)容,“Sora”則引入更為先進(jìn)的深度學(xué)習(xí)機(jī)制,特別是對(duì)抗網(wǎng)絡(luò)和自編碼器等技術(shù)。這使得“Sora”在生成內(nèi)容時(shí)能夠更好地模擬人類的創(chuàng)造性和直覺。
對(duì)于“Sora”的顯著優(yōu)勢(shì)和特點(diǎn),物聯(lián)網(wǎng)產(chǎn)業(yè)專家袁帥從四個(gè)方面向記者進(jìn)行了分析。一是多模態(tài)融合。“Sora”能夠同時(shí)處理文本、圖像和音頻等多種模態(tài)的數(shù)據(jù),實(shí)現(xiàn)跨模態(tài)的生成。這種多模態(tài)融合的能力使得其具有全面地理解和表達(dá)信息的能力,從而生成更加豐富的視頻內(nèi)容。
二是高度定制化?!癝ora”能夠根據(jù)用戶的個(gè)性化需求生成定制化的視頻內(nèi)容。用戶可以通過(guò)輸入文本描述自己的需求和意圖,“Sora”將這些想法迅速轉(zhuǎn)化為具體的視頻畫面,盡可能滿足用戶的個(gè)性化需求。
三是高效率與高質(zhì)量。“Sora”采用了高效的生成算法和模型架構(gòu),能夠在短時(shí)間內(nèi)生成高質(zhì)量的視頻內(nèi)容。這使得其在處理大規(guī)模數(shù)據(jù)集或?qū)崟r(shí)生成任務(wù)時(shí)具有顯著的優(yōu)勢(shì)。
四是可擴(kuò)展性與靈活性?!癝ora”的架構(gòu)設(shè)計(jì)使得它易于擴(kuò)展和適應(yīng)不同的應(yīng)用場(chǎng)景。通過(guò)調(diào)整模型參數(shù)和引入新的功能模塊,其可以適應(yīng)不同的任務(wù)需求和數(shù)據(jù)類型,展現(xiàn)出強(qiáng)大的靈活性和可擴(kuò)展性。
以“Sora”為代表的視頻生成類模型,展現(xiàn)出在多領(lǐng)域、多場(chǎng)景下的較大潛力和應(yīng)用價(jià)值。甚至有業(yè)內(nèi)人士預(yù)測(cè),視頻生成類模型是今年人工智能賽道的主力熱點(diǎn)。
朱克力告訴記者,在娛樂領(lǐng)域,視頻生成類模型可用于自動(dòng)生成電影預(yù)告片、游戲宣傳視頻等,大大節(jié)省了制作成本和時(shí)間。在廣告領(lǐng)域,該模型能夠根據(jù)產(chǎn)品特性和目標(biāo)受眾快速生成定制化的廣告視頻。在教育領(lǐng)域,可用于制作生動(dòng)有趣的教學(xué)視頻,幫助學(xué)生更好地理解和掌握知識(shí)。此外,在傳媒、體育等領(lǐng)域,視頻生成類模型也能實(shí)時(shí)生成高質(zhì)量的視頻內(nèi)容,滿足快速傳播的需求。
國(guó)內(nèi)一家人工智能企業(yè)產(chǎn)品經(jīng)理打趣道:“年初五迎財(cái)神,沒想到?jīng)]過(guò)多久迎來(lái)了‘Sora?!薄癝ora”的誕生直接拉升了視頻生成類模型的應(yīng)用效果,具體產(chǎn)品落地商業(yè)化的可行性愈發(fā)顯著,這將吸引更多的市場(chǎng)參與者入場(chǎng)。
記者在某投資者互動(dòng)平臺(tái)檢索發(fā)現(xiàn),截至2月21日,圍繞“Sora”的相關(guān)提問(wèn)已達(dá)83條,涉及傳媒、科技、健康、通信、教育、電商、文創(chuàng)等各類上市公司。除近兩成的上市公司回復(fù)稱“暫不涉及‘Sora或多模態(tài)AI業(yè)務(wù)”外,其余公司的回復(fù)中密集出現(xiàn)“加大技術(shù)創(chuàng)新”“適時(shí)研發(fā)并布局相關(guān)產(chǎn)品和服務(wù)”“密切關(guān)注發(fā)展機(jī)遇”“緊跟市場(chǎng)發(fā)展”等表述。
其中,芒果超媒2月19日回復(fù)投資者提問(wèn)時(shí)表示,此前,公司已經(jīng)組建了AIGC創(chuàng)新應(yīng)用團(tuán)隊(duì),研發(fā)上線“AIGC HUB”等內(nèi)部應(yīng)用平臺(tái),將AIGC技術(shù)廣泛應(yīng)用于媒資運(yùn)營(yíng)、廣告投放、會(huì)員互動(dòng)、視頻剪輯、內(nèi)容生產(chǎn)等業(yè)務(wù)場(chǎng)景。后續(xù),公司將積極探索文生視頻等新興AI技術(shù)在傳媒領(lǐng)域的落地應(yīng)用與業(yè)態(tài)創(chuàng)新。
世紀(jì)天鴻2月20日回復(fù)稱,公司始終保持著對(duì)“ChatGPT”“Sora”等人工智能大模型發(fā)展與應(yīng)用的積極關(guān)注,目前公司已結(jié)合人工智能技術(shù)推出小鴻助教、筆神作文等相關(guān)教育產(chǎn)品。公司將持續(xù)利用在教育領(lǐng)域的內(nèi)容優(yōu)勢(shì)與資源優(yōu)勢(shì),結(jié)合前沿技術(shù)探索人工智能在智慧教育場(chǎng)景的落地與應(yīng)用,實(shí)現(xiàn)教育內(nèi)容的人工智能升級(jí),為中小學(xué)師生提供更好的產(chǎn)品與服務(wù)體驗(yàn)。
浪潮已來(lái),但非盲目跟風(fēng)。對(duì)于行業(yè)上市公司,袁帥認(rèn)為積極擁抱AI技術(shù)、創(chuàng)新業(yè)務(wù)模式和戰(zhàn)略的同時(shí),還需要建立數(shù)據(jù)驅(qū)動(dòng)的決策體系,收集和分析用戶數(shù)據(jù)、市場(chǎng)數(shù)據(jù)等,了解用戶需求和市場(chǎng)趨勢(shì),從而制定更加精準(zhǔn)和有效的業(yè)務(wù)策略。此外,應(yīng)培養(yǎng)和引進(jìn)相關(guān)人才,建立專業(yè)團(tuán)隊(duì),推動(dòng)人工智能技術(shù)在業(yè)務(wù)中的深入應(yīng)用和創(chuàng)新發(fā)展。隨著技術(shù)的快速發(fā)展和應(yīng)用場(chǎng)景的拓展,相關(guān)政策和法規(guī)也正不斷完善。上市公司需要密切關(guān)注政策和法規(guī)變化,確保業(yè)務(wù)合規(guī)與可持續(xù)發(fā)展。
“Sora”縱然令人感到震撼,也帶給我們更多的思考。
數(shù)據(jù)隱私、版權(quán)問(wèn)題及生成內(nèi)容的真實(shí)性和可信度等問(wèn)題,早在生成式模型誕生之初,就有所討論。對(duì)此,朱克力表示,其一,模型在訓(xùn)練和使用過(guò)程中可能會(huì)涉及大量用戶數(shù)據(jù),必須確保這些數(shù)據(jù)的安全和隱私不受侵犯。其二,生成的視頻內(nèi)容可能涉及版權(quán)問(wèn)題,需要明確使用權(quán)限和來(lái)源合法性。其三,由于模型生成的內(nèi)容可能具有高度真實(shí)感,應(yīng)采取措施防止其被用于傳播虛假信息或誤導(dǎo)公眾。這需要堅(jiān)持“科技向善”,在技術(shù)設(shè)計(jì)、法律法規(guī)和道德準(zhǔn)則等多個(gè)層面進(jìn)行綜合考慮和規(guī)范。
近年來(lái),每每人工智能領(lǐng)域出現(xiàn)技術(shù)新突破,緊隨而至的往往是那些尖銳的問(wèn)題——一批人要失業(yè)了嗎、一眾企業(yè)要被淘汰了嗎?人、機(jī)并非簡(jiǎn)單的“零和博弈”。戰(zhàn)略定位專家詹軍豪認(rèn)為,“Sora”的誕生可能會(huì)對(duì)某些行業(yè)的從業(yè)者產(chǎn)生一定的沖擊,但并不會(huì)直接導(dǎo)致他們失業(yè)?!癝ora”并不能完全取代人類制作人員的角色,因?yàn)槿祟愔谱魅藛T在創(chuàng)意、情感表達(dá)等方面具有獨(dú)特的優(yōu)勢(shì)。此外,“Sora”的推出將催生新的職業(yè)和就業(yè)機(jī)會(huì)。隨著人工智能技術(shù)的不斷發(fā)展,需要更多的專業(yè)人才來(lái)從事相關(guān)的研究、開發(fā)和應(yīng)用工作??傮w來(lái)看,可能會(huì)對(duì)一些傳統(tǒng)職業(yè)的從業(yè)者產(chǎn)生影響,但也將為人類創(chuàng)造更多的就業(yè)機(jī)會(huì)和發(fā)展空間。
對(duì)于可能受到直接影響的廣告?zhèn)髅?、影視制作行業(yè)來(lái)說(shuō),盤古智庫(kù)高級(jí)研究員江瀚指出,大模型何嘗不能帶來(lái)更多的商業(yè)機(jī)會(huì)和創(chuàng)新空間呢?與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過(guò)不斷學(xué)習(xí)和創(chuàng)新,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)各個(gè)領(lǐng)域的深度融合,這才是人工智能時(shí)代真正的生存之道。
值得注意的是,人工智能時(shí)代,算力將成為關(guān)鍵生產(chǎn)要素。熱潮之下,我們不能忽略背后的“算力缺口”。不少海外企業(yè)和高管人士已經(jīng)將目光聚焦于AI算力上?!癈hatGPT之父”奧爾特曼執(zhí)著于巨額的芯片投資。更有一家名為“Groq”的初創(chuàng)公司試圖以自研芯片在運(yùn)算速度上挑戰(zhàn)全球GPU巨頭。
在國(guó)內(nèi),數(shù)字經(jīng)濟(jì)強(qiáng)省浙江,正發(fā)力沖向“算力強(qiáng)省”。其中,作為數(shù)字經(jīng)濟(jì)重鎮(zhèn)的杭州,深刻洞察到數(shù)字經(jīng)濟(jì)加速發(fā)展時(shí)搶抓人工智能機(jī)遇的戰(zhàn)略意義,在降低算力成本上謀篇布局,亮出了以算力高質(zhì)量發(fā)展支撐數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的雄心。在杭州市新春第一會(huì)——“深化改革、強(qiáng)基固本”主題年推進(jìn)大會(huì)上,浙江省委副書記、杭州市委書記劉捷兩次提到“Sora”大模型。按照杭州新春第一會(huì)的部署,從加快新型算力中心建設(shè),提供信創(chuàng)云和人工智能算力服務(wù),成為打造人工智能高地的關(guān)鍵基礎(chǔ)設(shè)施;到構(gòu)建通用算力、超算算力和邊緣算力協(xié)同發(fā)展的新型算力體系……一條綜合算力成本最低的改革路線躍然紙上。