輸入文字指令就可以生成視頻人工智能Sora 讓好萊塢緊張了

2024-05-17 05:00:39《環(huán)球時(shí)報(bào)》

上海工運(yùn) 2024年2期

據(jù)媒體報(bào)道，美國(guó)人工智能公司OpenAI 最新發(fā)布的生成式人工智能模型Sora，近日在業(yè)內(nèi)外引發(fā)極高關(guān)注度，其可以按照文字指令生成長(zhǎng)達(dá)1 分鐘視頻的強(qiáng)大能力，令I(lǐng)T 界、藝術(shù)界和普通愛(ài)好者興奮不已，同時(shí)也讓包括好萊塢在內(nèi)的娛樂(lè)產(chǎn)業(yè)感到擔(dān)心，電影《我，機(jī)器人》中AI 和機(jī)器人取代人類(lèi)工種的預(yù)言和相關(guān)風(fēng)險(xiǎn)再次成為熱門(mén)話題。

視頻質(zhì)量和逼真度更高

“自從上周OpenAI 發(fā)布文本生成視頻模型Sora以來(lái)，人們對(duì)于這種AI 功能的預(yù)測(cè)越來(lái)越‘惶恐’，畢竟與之前的同類(lèi)工具相比，OpenAI 似乎帶來(lái)巨大的飛躍”。有媒體評(píng)論稱，單純從目前的視頻輸出樣本來(lái)看，Sora 是迄今為止最令人印象深刻的視頻生成模型，其“現(xiàn)實(shí)主義效果”將有望在高端娛樂(lè)中發(fā)揮作用，只是因?yàn)槟承┓矫娴南拗?，目前還無(wú)法勝任好萊塢電影這樣的制作規(guī)模。人工智能公司Metaphysics 的首席執(zhí)行官湯姆·格拉漢姆認(rèn)為：“如今創(chuàng)意工作者要求對(duì)表演、場(chǎng)景進(jìn)行全面把控，Sora 這樣的模型要想生成好萊塢電影，還有很長(zhǎng)的路要走”。

事實(shí)上，在Sora 橫空出世之前，業(yè)內(nèi)已經(jīng)存在Runway 和Pika 等功能相似的AI 視頻生成、視頻編輯模型。這些模型可以基于文本提示、2D 圖片生成短視頻，由靜態(tài)圖像衍生出動(dòng)畫(huà)，修復(fù)、替換或插入新的視覺(jué)元素，以及將鏡頭擴(kuò)展到原始幀之外，填充上下文相關(guān)內(nèi)容的“畫(huà)外畫(huà)”，這些都豐富了人們所需的視頻內(nèi)容。

《財(cái)富》報(bào)道稱，目前已有好萊塢公司將Runway技術(shù)應(yīng)用在項(xiàng)目之中，并獲得奧斯卡獎(jiǎng)。相比之下，Sora 又取得一些明顯的升級(jí)和突破，譬如視頻的質(zhì)量和逼真度更高，更像真實(shí)世界，視頻長(zhǎng)度也達(dá)到1分鐘，能夠呈現(xiàn)文本需要的相關(guān)信息。要知道，Sora的競(jìng)爭(zhēng)對(duì)手Runway 去年8 月推出的第二代模型，每次還只能生成最高18 秒的視頻。此外，Sora 還實(shí)現(xiàn)了“時(shí)空一致性”，也就是即便對(duì)視頻進(jìn)行擴(kuò)展，它也能夠賦予模型“前瞻性”，確保視頻主題在畫(huà)幅外也能保持不變。 Sora 之前發(fā)布的“時(shí)尚女性走在繁華街頭”的視頻示例，就很像是一部廣告短片或電影片段，人物和場(chǎng)景基本上挑不出明顯問(wèn)題，身體的運(yùn)動(dòng)、頭發(fā)的細(xì)節(jié)、霓虹燈反光顯得尤其逼真，這在幾年前是不可想象的。

畫(huà)面缺陷仍無(wú)法避免

業(yè)內(nèi)人士認(rèn)為，擁有強(qiáng)大功能的Sora 已然具備了通過(guò)AI 創(chuàng)建電影的可能性，這些輸出的視頻可以作為“鏡頭”縫合成一部電影，但關(guān)鍵還要保持角色和場(chǎng)景的連續(xù)性。不過(guò)這種使用文本提示和條件參數(shù)生成的視頻，只有保持角色在下一場(chǎng)戲中連續(xù)一致，才能創(chuàng)造更長(zhǎng)時(shí)間的“人工智能故事”。

目前看來(lái)，Sora 在好萊塢的大規(guī)模應(yīng)用還面臨不少阻礙，除了連續(xù)性不足，這款模型還會(huì)“誤解”現(xiàn)實(shí)世界里的造型和行為，在圖像和視頻輸出中出現(xiàn)肉眼可見(jiàn)的“物理性失敗”。近日網(wǎng)絡(luò)上也在熱傳一個(gè)Sora 模型的“失敗案例”，鏡頭中的椅子仿佛有了生命般走動(dòng)，完全超出真實(shí)世界的物理可能，畫(huà)面中還有人甚至“憑空消失”，此類(lèi)“失誤”除了讓人啞然失笑，也說(shuō)明Sora 想要?jiǎng)?chuàng)作出電影還有很多問(wèn)題要解決。

由于Sora 的視頻輸出是基于渲染，而非物理性建模，因此暫時(shí)無(wú)法提供足夠可控性，目前好萊塢的電影創(chuàng)作者也無(wú)法掌握并控制。短期來(lái)看，如果想要在創(chuàng)作中引入這種AI 模型，反而會(huì)遭遇更多問(wèn)題，這還需要OpenAI 的開(kāi)發(fā)人員添加更多的軟件控制參數(shù)，根據(jù)這些暴露出來(lái)的缺陷進(jìn)行改進(jìn)，呈現(xiàn)出的視頻才能與人類(lèi)拍攝的鏡頭相媲美。

此外，版權(quán)等法律方面問(wèn)題也是好萊塢目前無(wú)法直接使用Sora 的一大原因，將AI 生成的素材輸出到銀幕有可能引發(fā)版權(quán)糾紛，哪怕AI 只是用相關(guān)素材進(jìn)行訓(xùn)練，也有潛在的侵權(quán)風(fēng)險(xiǎn)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

輸入文字指令就可以生成視頻 人工智能Sora 讓好萊塢緊張了

視頻質(zhì)量和逼真度更高

畫(huà)面缺陷仍無(wú)法避免

輸入文字指令就可以生成視頻人工智能Sora 讓好萊塢緊張了