蘇金喆
AIGC是指基于生成對抗網絡、大型預訓練模型等人工智能的技術方法,通過對已有數據的學習和識別,以適當的泛化能力生成相關內容的技術,在媒體領域中具有廣泛的應用前景?,F以AIGC的理論和特性為基礎,深入研究其在媒體行業(yè)的各種應用場景,分析其優(yōu)點與不足,并對未來的研究領域進行預測。
隨著信息技術的發(fā)展,人工智能(AI)已經成為當今社會熱門的話題之一。作為人工智能技術的重要組成部分,AIGC既是內容的生產方式,也是用于內容自動化生成的一類技術集合。其具有高效、靈活和可擴展性等優(yōu)點,適用于各種不同領域的應用場景。在傳媒行業(yè),AIGC技術已被廣泛用于圖像、視頻處理,語音識別、合成以及自然語言處理等不同方面。
AIGC的原理和特點
AIGC的原理
AIGC技術的核心思想是利用人工智能算法生成具有一定創(chuàng)意和質量的內容。通過訓練模型和大量數據的學習,AIGC可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵詞、描述或樣本,AIGC可以生成與之相匹配的文章、圖像、音頻等。AIGC采用了深度學習等先進的人工智能技術,能夠自動學習和優(yōu)化算法參數,提高計算效率和精度。同時,AIGC還支持多種不同的算法和模型,可以靈活地應用于不同的場景。
AIGC的特點
第一,高效性。AIGC采用了并行計算和分布式存儲等技術,能夠高效處理數據,提高計算效率和速度。當前,AI大模型成為行業(yè)用戶重點關注的對象,甚至金融、媒體、廣告營銷等用戶紛紛試水AI大模型。分布式融合存儲開始堪當大任,在各類AI應用的數據基礎設施中發(fā)揮了重要作用。
第二,靈活性。AIGC支持多種不同的算法和模型,可以靈活地應用于不同的應用場景。滿足不同的需求。
第三,可擴展性。AIGC采用了模塊化和標準化設計等技術,方便進行功能擴展和升級,能夠適應不同領域的應用需求。Stability AI公司研發(fā)的圖像生成平臺采用AIGC技術,結合深度學習和強化學習等技術,可根據用戶的要求以及反饋,生成高質量、逼真且獨特的圖像。
AIGC在媒體領域的應用場景
計算機內容的進步經歷了三大時期。第一時期為PGC(專家生成的內容),第二時期為UGC(由消費者生成的內容),而現在正處于第三時期——AIGC。早期的網絡信息以高質量且專業(yè)的PGC為主導,保證了優(yōu)質的信息輸出和良好的用戶體驗。UGC則是由普通大眾自主創(chuàng)建的內容,他們可以在各種在線平臺發(fā)布自己的創(chuàng)意視頻或文章,如當下熱門的嗶哩嗶哩、微信公眾號等。這類網站上的用戶通常具有較強的創(chuàng)造力,因此其產品的吸引力和黏著度都非常高。
在數字化時代,隨著數字技術的迅猛發(fā)展和社交媒體的普及,新媒體已經成為許多企業(yè)和個人推廣、傳播和互動的首選渠道。AIGC技術出現前,內容創(chuàng)作者必須花費大量的時間和精力來編輯和發(fā)布內容。要想在信息涌流的競爭激烈環(huán)境中脫穎而出,就需要不斷創(chuàng)作和運營內容。AIGC技術的不斷進步讓這一傳統模式正在經歷一場翻天覆地的革命,AIGC正在以前所未有的方式賦能新媒體運營,為新媒體運營注入了新的活力。
AIGC在媒體報道中的應用
1.AICG在媒體報道新聞采編播中的應用
利用訪談記錄轉化為文本的方式,提高了工作的效率并提升了工作體驗。過去的工作方式主要依靠人工操作,即便使用計算機和相關設備也仍然需要投入大量的精力。如今通過應用語言識別技術,聲音可以直接被翻譯為文字,編輯只需要修改拼寫錯誤或部分措辭,從而減少了重復和機械的工作量,確保了新聞報道的時效性。在2022年的冬季奧運會上,科大訊飛的智能錄音筆憑借其多語言的語音轉化功能,使記者能在幾分鐘之內完成文章撰寫。
利用AIGC生成文章以提高信息傳遞速度和效率是當前趨勢之一。應用人工智能可以提高傳媒行業(yè)的工作效率、準確性和智能化水平。例如,美媒《洛杉磯時報》開發(fā)的人工智能機器人在一次事件發(fā)生后,僅用了不到五分鐘便發(fā)布了相關報道;而中國的“地殼活動監(jiān)測系統”在四川阿壩州松潘縣發(fā)生的強烈余震中,僅花了七秒便完成了稿件撰寫,并將其迅速發(fā)布到各大平臺。
智能化視頻剪輯技術的運用有助于提高視頻制作的工作效率。自定義字幕創(chuàng)建、視頻合集、視頻切片及高倍率分辨率等剪輯技巧,可有效減少人工勞動力和時間的投入。在2020年全國兩會,《人民日報》使用“智能云剪輯師”迅速完成視頻制作任務,同時具備自動配對字幕、人像持續(xù)監(jiān)控、畫質穩(wěn)定防止抖動、從橫向轉換至縱向等多種功能,滿足不同平臺發(fā)布的需求。2022年冬季奧運會上,中央電視臺采用“AI智能內容生產剪輯系統”高效產出和發(fā)布奧運會相關項目的視頻匯總,進一步挖掘了體育傳媒內容的潛在價值。利用AIGC技術,可以對圖像和視頻數據進行特征提取和處理,從而實現更加準確的目標檢測和跟蹤。同時,AIGC還可以對圖像和視頻數據進行降噪和修復等處理,提高圖像和視頻的質量。
2.AICG在媒體傳播環(huán)節(jié)中的應用
第一,AIGC虛擬人助力媒體傳播。AIGC的運用體現在由虛擬人進行新聞報道。通過創(chuàng)新性的技術實現實時語音和人物動畫的融合,用戶僅需提供發(fā)布的文字資料,計算機就能自動生成相應的人物動畫新聞片段,同時保證聲音、面部表情和口型的自然統一。目前,虛擬人在媒體行業(yè)的使用呈現出三個顯著的特點。
虛擬人的應用范圍在不斷擴大。新華社、東方衛(wèi)視等媒體已開始積極將虛擬人技術從新聞推廣拓展到晚會、現場報道、天氣預報等更多場景。同時,AIGC技術為媒體提供了國際化的傳播平臺和渠道,有助于提升我國媒體的國際影響力和話語權。
隨著應用場景的持續(xù)更新,除了傳統的主播報道方式外,虛擬人也逐漸開始支持多種語言和手勢報告。在2022年冬季奧運會期間,百度、騰訊等公司相繼推出了手勢報告的數字化模型,為大量聽力障礙者提供了手勢解說服務,在更多場景提供服務,有助于創(chuàng)造更好的無障礙信息傳播環(huán)境。
隨著技術的進步和創(chuàng)新,虛擬人的形式日益豐富多樣。首先是視覺上的轉變,由傳統的2D圖像逐漸轉變?yōu)?D模型;其次在功能性的拓展方面,已經不再局限于簡單的嘴部運動,而是涵蓋了臉部的情緒表達、四肢及指尖的活動、場景元素等。例如,騰訊推出的“聆語”通過騰訊多模態(tài)端到端生成模型,進行聯合建模及預測生成高準確率的動作、表情、唇動等序列,實現自然專業(yè)、易懂度高的手語效果,這使得“聆語”在杭州亞洲殘疾人奧運會中擔任AI手語翻譯官時取得了良好的效果。
第二,AIGC語音應用助力媒體傳播。語音識別和合成是媒體領域中的另一個重要應用,AIGC被廣泛應用于語音識別和合成等方面。利用AIGC技術,可以對語音數據進行高效的特征提取和處理,從而實現更加準確的語音識別。同時,AIGC還可以對語音數據進行合成和處理等操作,實現更加自然的人機交互。常見的人機對話工具很多,能夠滿足不同用戶的需求。虛擬人和數字人是AIGC不斷發(fā)展的產物,如時間小妮、部分衛(wèi)視的卡通人物。將其應用于媒體傳播領域,發(fā)展前景廣闊。
自然語言處理是媒體領域中的另一個重要應用。AIGC被廣泛應用于文本分類、情感分析、機器翻譯等方面。利用AIGC技術,可以對文本數據進行高效的特征提取和處理,從而實現更加準確的文本分類和情感分析。人工智能技術廣泛應用于新聞領域,如智能寫作、新聞分類等。這些應用可以幫助提高新聞生產的效率和準確性,同時也可以提供個性化推薦和智能搜索等服務,提升用戶體驗。同時,AIGC還可以對文本數據進行翻譯和處理等操作,使機器翻譯更加準確。
優(yōu)勢與局限性分析
AIGC在媒體領域的應用優(yōu)勢
第一,數據化。數據化是AIGC的一大優(yōu)勢,它能迅速對海量的媒體信息進行處理,從而提升了數據處理的效率。盡管當前數據規(guī)模正在急劇擴張,但用于解析的數據比例仍然相對較少。統計資料顯示,目前收集到的數據中只有不到2%得到了有效使用,而大部分數據仍未得到深入研究或運用。因此,為了滿足不同用戶的需求,分布式融合存儲需要能夠實時、智能地處理數據。
第二,擴展兼容。AIGC可以針對不同的媒體處理需求進行模型的訓練和學習,具有較強的適應性。AI模型逐漸由單模態(tài)向多模態(tài)方向發(fā)展,多模態(tài)指圖像、聲音、文字等多類型內容融合學習。地方融媒體中心多使用北京云、新華社、墨影、凡科互動等應用程序,新聞文字、微信圖片海報、短視頻等借助AI力量成功優(yōu)化媒體內容。
第三,廣泛應用。AIGC的深度學習模型可以不斷進行訓練和學習,從而不斷優(yōu)化模型的性能并提高處理的效果。數字人的誕生以及AI只能從最初的讀寫到之后的個性化創(chuàng)作,是AIGC廣泛應用的效果。例如,北京電視臺推出的數字人北京小妮獲得了極大的成功。近年來,北京小妮對接到12345“接訴即辦”,同時其具有政策解讀的功能,形成了“新聞+政務+服務”的AI全模式。拓世AI能夠從用戶發(fā)送的數據中分析用戶的興趣和行為,從而為用戶推薦個性化寫作方案,這不僅提高了內容質量,也提高了用戶的留存率和參與度。社交媒體平臺和新聞網站經常使用這種技術來編輯大眾喜愛的帖子和文章。
第四,信息檢測性。AIGC可以幫助新媒體運營者檢測虛假信息和不實新聞。通過分析內容的來源和歷史記錄,AI能夠識別潛在的虛假信息,從而增強內容的可信度和可靠性。
第五,降本提效。利用AI技術,降低了人工和時間成本,如機器寫稿或者校對,通過AI自動生成修改內容,降低了稿件出現低級錯誤的頻率,如錯別字、地名單位名稱不匹配、圖片使用不合理等,提升了工作效率。
總而言之,AIGC將成為引領發(fā)展的引擎,為媒體工作者提供更多便利,更好地滿足用戶的需求。數字時代下,AIGC將為媒體工作者提供更多寫作靈感,助推互聯網持續(xù)蓬勃發(fā)展。
AIGC在媒體領域的局限性
第一,AIGC的內容生成能力受限。AIGC需要利用大量的數據進行模型的訓練和學習,而在媒體行業(yè)中,難以獲取大量的基礎數據,因此限制了其應用范圍。AIGC的衍生語言模型目前還不能完全理解語言含義和上下文關系,尤其是處理多義詞等方面。與人類相比,AIGC缺乏更生動的語言和有趣的靈感,只能按照程序加載的規(guī)則生成人類對話,顯得單調乏味,難以引發(fā)讀者的情感共鳴。
第二,AIGC的容錯率較低。AI“一本正經地胡說八道”這種現象被稱為AI幻覺。AI幻覺指的是AI會生成貌似合理連貫,但同輸入問題意圖不一致、同世界知識不一致、與現實或已知數據不符合或無法驗證的內容。AIGC不具備編寫程序的能力,只能執(zhí)行已知的程序圖表,當處理數據不符合算法時,往往出現語句錯誤或錯誤輸出。若完全依靠AIGC,可能會出現文本的胡編亂造、事實的錯誤捏造、無用代碼的生成,甚至編造出相關參考文獻等現象,容易造成不良的后果。
第三,缺乏分析能力。AIGC軟件的話術應用十分明顯,精準的話術表達會讓AIGC精準度大幅度提高。雖然AIGC能在短時間內處理大量數據,但無法滿足所有用戶的需求。
AIGC對媒體從業(yè)者提出更高的要求
首先,媒體從業(yè)者具備的實地采訪和求證能力,任何技術都無法替代。雖然AIGC為新聞收集、分析和處理提供了便利,但過度依賴技術可能導致虛假新聞的出現。
其次,媒體從業(yè)者需要敏銳把握技術創(chuàng)新和應用趨勢,緊跟技術變革的步伐。只有掌握前沿技術,才能在數字化時代保持競爭力。
再次,媒體從業(yè)者還需要提升對AIGC素材和產品的分析和把關能力。采用AIGC提供的素材時應當仔細斟酌,同時要學習干預和反饋AIGC的輸出技能。
最后,媒體從業(yè)者應不斷創(chuàng)新內容風格,提高作品質量。這需要媒體從業(yè)者充分發(fā)揮自己的創(chuàng)造力。
AIGC技術為媒體發(fā)展帶來了巨大的機遇。媒體從業(yè)者需要緊跟技術發(fā)展步伐,不斷提升自身的技術應用能力,以滿足不斷變化的市場需求,同時,也需要密切關注技術倫理和法規(guī)問題,確保技術的合理應用。
(作者單位:北京市大興區(qū)融媒體中心)