據(jù)媒體報(bào)道,美國(guó)人工智能公司OpenAI 最新發(fā)布的生成式人工智能模型Sora, 近日在業(yè)內(nèi)外引發(fā)極高關(guān)注度, 其可以按照文字指令生成長(zhǎng)達(dá)1 分鐘視頻的強(qiáng)大能力,令I(lǐng)T 界、藝術(shù)界和普通愛(ài)好者興奮不已, 同時(shí)也讓包括好萊塢在內(nèi)的娛樂(lè)產(chǎn)業(yè)感到擔(dān)心,電影《我,機(jī)器人》中AI 和機(jī)器人取代人類(lèi)工種的預(yù)言和相關(guān)風(fēng)險(xiǎn)再次成為熱門(mén)話題。
“自從上周OpenAI 發(fā)布文本生成視頻模型Sora以來(lái),人們對(duì)于這種AI 功能的預(yù)測(cè)越來(lái)越‘惶恐’,畢竟與之前的同類(lèi)工具相比,OpenAI 似乎帶來(lái)巨大的飛躍”。 有媒體評(píng)論稱,單純從目前的視頻輸出樣本來(lái)看,Sora 是迄今為止最令人印象深刻的視頻生成模型,其“現(xiàn)實(shí)主義效果”將有望在高端娛樂(lè)中發(fā)揮作用,只是因?yàn)槟承┓矫娴南拗?,目前還無(wú)法勝任好萊塢電影這樣的制作規(guī)模。 人工智能公司Metaphysics 的首席執(zhí)行官湯姆·格拉漢姆認(rèn)為:“如今創(chuàng)意工作者要求對(duì)表演、場(chǎng)景進(jìn)行全面把控,Sora 這樣的模型要想生成好萊塢電影,還有很長(zhǎng)的路要走”。
事實(shí)上, 在Sora 橫空出世之前, 業(yè)內(nèi)已經(jīng)存在Runway 和Pika 等功能相似的AI 視頻生成、視頻編輯模型。 這些模型可以基于文本提示、2D 圖片生成短視頻,由靜態(tài)圖像衍生出動(dòng)畫(huà),修復(fù)、替換或插入新的視覺(jué)元素,以及將鏡頭擴(kuò)展到原始幀之外,填充上下文相關(guān)內(nèi)容的“畫(huà)外畫(huà)”,這些都豐富了人們所需的視頻內(nèi)容。
《財(cái)富》報(bào)道稱,目前已有好萊塢公司將Runway技術(shù)應(yīng)用在項(xiàng)目之中,并獲得奧斯卡獎(jiǎng)。 相比之下,Sora 又取得一些明顯的升級(jí)和突破, 譬如視頻的質(zhì)量和逼真度更高,更像真實(shí)世界,視頻長(zhǎng)度也達(dá)到1分鐘, 能夠呈現(xiàn)文本需要的相關(guān)信息。 要知道,Sora的競(jìng)爭(zhēng)對(duì)手Runway 去年8 月推出的第二代模型,每次還只能生成最高18 秒的視頻。 此外,Sora 還實(shí)現(xiàn)了“時(shí)空一致性”,也就是即便對(duì)視頻進(jìn)行擴(kuò)展,它也能夠賦予模型“前瞻性”,確保視頻主題在畫(huà)幅外也能保持不變。 Sora 之前發(fā)布的“時(shí)尚女性走在繁華街頭”的視頻示例,就很像是一部廣告短片或電影片段, 人物和場(chǎng)景基本上挑不出明顯問(wèn)題, 身體的運(yùn)動(dòng)、頭發(fā)的細(xì)節(jié)、霓虹燈反光顯得尤其逼真,這在幾年前是不可想象的。
業(yè)內(nèi)人士認(rèn)為, 擁有強(qiáng)大功能的Sora 已然具備了通過(guò)AI 創(chuàng)建電影的可能性,這些輸出的視頻可以作為“鏡頭”縫合成一部電影,但關(guān)鍵還要保持角色和場(chǎng)景的連續(xù)性。 不過(guò)這種使用文本提示和條件參數(shù)生成的視頻, 只有保持角色在下一場(chǎng)戲中連續(xù)一致,才能創(chuàng)造更長(zhǎng)時(shí)間的“人工智能故事”。
目前看來(lái),Sora 在好萊塢的大規(guī)模應(yīng)用還面臨不少阻礙,除了連續(xù)性不足,這款模型還會(huì)“誤解”現(xiàn)實(shí)世界里的造型和行為,在圖像和視頻輸出中出現(xiàn)肉眼可見(jiàn)的“物理性失敗”。近日網(wǎng)絡(luò)上也在熱傳一個(gè)Sora 模型的“失敗案例”,鏡頭中的椅子仿佛有了生命般走動(dòng), 完全超出真實(shí)世界的物理可能,畫(huà)面中還有人甚至“憑空消失”,此類(lèi)“失誤”除了讓人啞然失笑,也說(shuō)明Sora 想要?jiǎng)?chuàng)作出電影還有很多問(wèn)題要解決。
由于Sora 的視頻輸出是基于渲染, 而非物理性建模,因此暫時(shí)無(wú)法提供足夠可控性,目前好萊塢的電影創(chuàng)作者也無(wú)法掌握并控制。短期來(lái)看,如果想要在創(chuàng)作中引入這種AI 模型, 反而會(huì)遭遇更多問(wèn)題,這還需要OpenAI 的開(kāi)發(fā)人員添加更多的軟件控制參數(shù),根據(jù)這些暴露出來(lái)的缺陷進(jìn)行改進(jìn),呈現(xiàn)出的視頻才能與人類(lèi)拍攝的鏡頭相媲美。
此外,版權(quán)等法律方面問(wèn)題也是好萊塢目前無(wú)法直接使用Sora 的一大原因,將AI 生成的素材輸出到銀幕有可能引發(fā)版權(quán)糾紛,哪怕AI 只是用相關(guān)素材進(jìn)行訓(xùn)練,也有潛在的侵權(quán)風(fēng)險(xiǎn)。