文_王東雷
2024年2月16日,美國人工智能研究公司OpenAI 正式對外發(fā)布了人工智能文生視頻大模型Sora。通過文本指令,Sora 可以創(chuàng)建一條時長為60 秒的視頻,深度模擬真實世界,包括角色、場景、行為和關系。其誕生給視頻創(chuàng)作者帶來無限想象,人們普遍認為,無中生有的視頻生產(chǎn)將成為可能,尤其是在游戲和動漫領域。以傳媒界為例,媒體融合向深度發(fā)展,從業(yè)者開始回顧人工智能的演變歷程,梳理其中的迭代邏輯,以便為接下來的行業(yè)應用設計方案。本文試圖從媒體從業(yè)者的角度,在行業(yè)媒體開展融合轉型的背景下,探討人工智能在新聞傳播垂直領域的應用場景。
Sora 的發(fā)布是人工智能從文生圖到文生視頻的一次跨越。之前谷歌公司發(fā)布的Imagen、OpenAI 發(fā)布的DALL-E 和David Holz 創(chuàng)始的Midjourney 都屬于文生圖應用工具。這類產(chǎn)品能讓使用者輸入文字,就能生成一幅對應的圖片。而Sora則更進一步,人工智能通過大語言模型和算法,把原來的靜態(tài)圖片演化成了動態(tài)視頻。
Midjourney 的創(chuàng)始人David Holz 曾在接受采訪時對AIGC(生成式人工智能)的發(fā)展作了這樣的表述:“AIGC取得了兩個突破,一個是理解語言,另一個是創(chuàng)建圖像的能力,結合后可以通過理解語言來創(chuàng)建圖像。這些工具將比人類更擅長制作圖像,而且速度會非常快,在未來一兩年內(nèi)將能夠實時制作內(nèi)容:每秒30幀,高分辨率,會很貴,但這是可能實現(xiàn)的。”[1]顯然,Sora的到來是人工智能不斷迭代的產(chǎn)物。
隨著技術的演變和迭代,人工智能在社會中的應用角色也在不斷變化。剛開始人工智能作為一種輔助工具,代替人去搜索資料、尋找工具,由人類自主完成工作。ChatGPT的出現(xiàn),意味著人工智能可以對任務目標提供多個建議和信息,甚至可以執(zhí)行流程設計和初稿方案,來輔助人類完成任務。而隨著Sora等模型的出現(xiàn),人類的主體地位逐漸被人工智能替代,在設立目標、任務分解、流程設計、提供資源、進度控制、確定成果等環(huán)節(jié)中,人類與人工智能雖然共同參與其中,但是人類在協(xié)同關系中或許只是個“旁觀者”或者“監(jiān)督者”,工作是由人工智能完成的。到了這個階段,人工智能儼然已經(jīng)成為了生產(chǎn)關系中的一方。
從Sora生成的視頻demo中,我們可以看到“雨后的東京街頭”:一位時尚女性走在充滿霓虹燈和城市廣告牌的東京街道上,身穿黑色皮夾克、紅色長裙和黑色靴子,手拎黑色錢包,濕漉漉的地面映現(xiàn)出建筑物和女士行走的倒影……視頻的場景、人物和行為細節(jié),還處于人類的認知可接受的范圍,而另一段視頻則完全違背了人類的認知,“在海邊沙灘上騎自行車的企鵝”。從字面我們就知道這是一個反常識的場景描述,企鵝不可能出現(xiàn)在沙灘上,也不可能騎自行車,但是Sora按其對物理世界的理解,也竟然可以把這些不可能同時產(chǎn)生的場景和行為聯(lián)系在一起,“無中生有”地生產(chǎn)出一條“石破天驚”的視頻來。從再現(xiàn)到創(chuàng)作,從“有中生有”到“無中生有”,Sora的誕生意味著視頻創(chuàng)作的基本法則發(fā)生了改變。正如OpenAI在一份名為“作為世界模擬器的視頻生成模型”的技術報告中描述的,Sora建立在一個對語言有深刻理解的模型上,這使它能夠創(chuàng)造出符合現(xiàn)實物理的動態(tài)圖像。
生成式人工智能在傳媒行業(yè)找到的垂直應用場景,目前主要體現(xiàn)在知識引擎、內(nèi)容創(chuàng)作、搜索推薦、風控審核等幾個方面。具體到新聞業(yè),在策、采、編、審、發(fā)、評過程中使用通用大模型的內(nèi)容創(chuàng)作和智能審核能力,是目前采用得比較多的應用場景。
隨著互聯(lián)網(wǎng)環(huán)境的改變,尤其是人工智能大語言模型產(chǎn)生之后,以前通過新聞挖掘、記者采寫、平臺編發(fā)的生產(chǎn)流程也發(fā)生著變化。大語言模型通過全網(wǎng)搜索,可以生成新的新聞內(nèi)容,譬如新聞綜合報道、無記者采寫的新聞(即AI自動生成的新聞報道)、新聞辟謠等。這是大語言模型為新聞業(yè)提供的新質生產(chǎn)力,能幫助新聞從業(yè)人員提升生產(chǎn)效率,從而讓記者編輯更加專注于新聞報道的深度、質量以及準確性,以此來提升新聞媒體的公信力、引導力和傳播力。
今年以來,中央廣播電視總臺、湖南廣電集團、上海廣播電視臺等廣電傳媒機構紛紛加大在AIGC領域的投入,引入先進的人工智能技術,提升內(nèi)容生產(chǎn)的智能化水平。國內(nèi)首部以AIGC技術制作的系列動畫片《千秋詩頌》在央視頻等平臺上線播出,再現(xiàn)了中國古詩詞中的人物造型、歷史場景和生活狀態(tài),是中華傳統(tǒng)美學與生成式人工智能技術的一次深度結合。在2024 年全國兩會報道中,上海廣播電視臺推出的Scube(智媒魔方),集成了多模態(tài)素材識別、橫屏轉豎屏、自動生成稿件、全語種智能翻譯、視頻自動剪輯等多項人工智能技術,為現(xiàn)場報道團隊提供新聞素材整理、內(nèi)容自動生產(chǎn)、新媒體多端并發(fā)等新聞制播服務,很大程度上節(jié)約了內(nèi)容生產(chǎn)的人力成本,提升了工作效率,使報道團隊有更多時間和精力去發(fā)現(xiàn)新聞線索,豐富采訪內(nèi)容。
不同應用場景對AI能力的容錯度各不相同,騰訊云智慧傳媒最近的一份研究報告表明,新聞傳播應用場景對AI的容錯度幾乎與半導體設計制造、火箭設計制造一樣,是一個容錯率極低且試錯成本天價的行業(yè)。新聞傳播一旦發(fā)生真實性和價值性偏差,其造成的后果不堪設想。
盡管Sora在發(fā)布時定義為“打造通用的物理世界模擬器”,但是人們在應用中發(fā)現(xiàn)Sora 對世界物理規(guī)則的理解并不完美,它還不能準確模擬許多物體相互作用的物理過程,比如玻璃破碎、氣體爆炸等。另外,在長視頻生成中容易出現(xiàn)不連貫或者物體憑空出現(xiàn)的現(xiàn)象。這些都提醒我們在新聞傳播的過程中,要時刻把握好運用人工智能大模型輔助新聞內(nèi)容生產(chǎn)中可能產(chǎn)生的風險。新聞從業(yè)人員在使用通用大模型時,首先必須堅持“以人為本”“人機協(xié)同”原則,既要確保內(nèi)容的質量,又要確保生成的內(nèi)容符合社會主義核心價值觀和法律道德的約束。其次,建立完備的審核機制是運用通用大語言模型輔助新聞生產(chǎn)的必要保障,包括內(nèi)容、導向、價值、法律等多個維度和向度。最后是建立一套能夠溯源的追責機制。這套機制不僅僅是指對從業(yè)者的行政追責,更是指在技術層面對人工智能大語言模型的追責。2023 年7 月13日,國家網(wǎng)信辦、發(fā)展改革委、教育部等七部門聯(lián)合公布了《生成式人工智能服務管理暫行辦法》,內(nèi)容包括技術發(fā)展與治理、服務規(guī)范、監(jiān)督檢查和法律責任等,其中第二章《技術發(fā)展和治理》,就是在數(shù)據(jù)、算法、算力等技術層面對生成式人工智能的約束。
相對于綜合性媒體(比如各省級衛(wèi)視、城市綜合頻道等),教育媒體是個相對垂直的傳媒機構。上海教育電視臺以“立足教育、服務社會”為辦臺宗旨,以關注“社會中的教育問題、教育中的社會問題”為特色,成為上海乃至全國行業(yè)電視媒體中的翹楚。AIGC的興起和應用,給處于媒體融合轉型進程中的上海教育電視臺帶來了機遇和挑戰(zhàn)。
打造優(yōu)質的符合行業(yè)媒體受眾特點的融媒體新聞內(nèi)容,是上海教育電視臺新聞報道融合轉型的首要任務。行業(yè)媒體有其較強的專業(yè)屬性,其受眾也有相對固定的人群,尤其以教師學生群體為主。通過大語言模型,不僅可以精準地鎖定“社會中的教育問題”和“教育中的社會問題”這兩個關鍵詞,集納各類新聞資訊中符合上海教育電視臺新聞報道策略的內(nèi)容,精心打造符合行業(yè)媒體特定受眾人群的新聞產(chǎn)品,更能夠在新聞內(nèi)容的采集、整合、轉化、重組,新聞價值的挖掘、評估,新聞產(chǎn)品的推送和平臺甄選上,獲得更具行業(yè)特性和專業(yè)特點的參考依據(jù),幫助行業(yè)媒體在產(chǎn)品迭代和價值堅守上更符合行業(yè)傳媒的訴求。
場景和人物的同質化是教育電視媒體的“語言”困境,“語料”的困乏往往讓一條新聞性較強的新聞報道難以通過鏡頭語言完整表述。文生圖Midjourney、文生視頻Sora在未來的應用,可以有效解決在教育新聞報道中的“語言”困境和“語料”困乏問題。比如,某個學校的固定場景,在電視臺有大量的視頻媒資的情況下,通過大語言模型的學習,完全可以自動生成模擬新聞發(fā)生場景的視頻片段用于新聞內(nèi)容生成而不失新聞真實性原則。
上海教育電視臺開播于1994 年,以服務上海教育衛(wèi)生領域為己任,教育節(jié)目和健康欄目是其主要內(nèi)容和主打品牌,擁有海量的節(jié)目媒資。人工智能大語言模型的運用,通過內(nèi)容梳理、畫質翻新、體裁重組等方法,讓這些曾經(jīng)獲得高收視率和美譽度的節(jié)目欄目“起死回生”,適合目前的高清電視大屏播出和新媒體平臺的推送。在2024年2月開播三十周年之際,教育臺新聞中心打造的《三十而“勵”,向陽而生》短視頻產(chǎn)品,就是通過AI 智能云媒資,進行節(jié)目搜索并進行二創(chuàng)的成功案例,其中一條以電視連續(xù)劇《繁花》主演胡歌少年時期在上海教育電視臺《陽光少年》欄目主持節(jié)目的視頻片段獲得了一千多萬的點擊量。
黨的二十大報告指出,要“加快建設網(wǎng)絡強國、數(shù)字中國”“構建新一代信息技術、人工智能等一批新的增長引擎”,進一步強調(diào)了人工智能在提升政府治理水平、提供優(yōu)質公共服務方面的重要作用。
2023年,筆者走訪四川衛(wèi)視、四川觀察新媒體、深圳衛(wèi)視、無錫市教育電視臺等傳播機構,調(diào)研了現(xiàn)階段媒體融合情況。無一例外,這些機構在媒體融合轉型的過程中,把提供公共服務作為一項重要的抓手來構建整個融媒體產(chǎn)品系統(tǒng)。
大語言模型在這方面具有獨到的信息采集、整合能力。2024年,上海教育電視臺與騰訊云共同成立教育數(shù)字媒體聯(lián)合實驗室,研發(fā)基于大語言模型的“上海教育公共政策咨詢服務平臺”,通過大模型學習上海市區(qū)兩級和各類各級學校歷年公布的就學升學政策,為市民提供高考、中考以及義務教育階段升學就學政策咨詢服務,為上海教育改革助力。
人工智能大語言模型在傳媒行業(yè)的垂直應用場景非常豐富,本文只能掛一漏萬,其核心是安全、合規(guī)地解決傳媒行業(yè)在供給側內(nèi)容短缺和流通過程中傳播力延伸的問題。在教育傳媒行業(yè),大語言模型更能幫助傳媒機構提升內(nèi)容品質,更好地服務于特定受眾群體,并且?guī)椭襟w服務于行業(yè)主管部門,提供決策咨詢和公共服務。
當然,在運用生成式人工智能的過程中,由于技術的快速進步可能會暫時脫離人類社會的價值倫理、社會規(guī)范和行為準則,因此,我們必須學會人與機器的深度結合和相互學習,認清人與人工智能的關系,了解科技變革的規(guī)律,制定相應的策略,通過對人工智能的廣泛運用,以促進社會、經(jīng)濟、文化的進步。