摘要:為了加強美育,實現(xiàn)人工智能與藝術的跨學科融合,應讓中小學生在課堂中親身體驗AI藝術創(chuàng)作,從而更好地激發(fā)其創(chuàng)新思維,提高審美能力。那么,能否提供一款適合中小學生的人工智能工具,使他們能夠輕松上手并參與到藝術創(chuàng)作之中?本文以“為老黑白視頻上色”項目為例,探討了AI技術在藝術創(chuàng)作中的應用,并進一步分析了AI技術在藝術創(chuàng)作中的優(yōu)勢與挑戰(zhàn),探討了其在教育領域的應用前景。
關鍵詞:XEduHub;人工智能教育;人工智能+藝術
中圖分類號:G434 文獻標識碼:A 論文編號:1674-2117(2024)21-0095-03
藝術和技術的關系密不可分,它們相互影響、相互促進。隨著人工智能技術的飛速發(fā)展,其在藝術領域的應用也日益廣泛,尤其是在視頻處理和圖像增強方面。當藝術遇上AI,天馬行空的想象力與嚴謹科學的技術流相互碰撞,可以激發(fā)出無限創(chuàng)意的火花。AI技術不僅能夠模仿和再現(xiàn)傳統(tǒng)藝術形式,還能夠創(chuàng)造出全新的藝術表達方式,為藝術創(chuàng)作提供了更多的可能性。那么,能否設計一些適合中小學生的藝術創(chuàng)作項目,激發(fā)學生對AI的學習興趣?
項目分析:AI在藝術創(chuàng)作中的應用
AI在藝術創(chuàng)作中的應用廣泛,它通過模仿人類藝術家的創(chuàng)作過程,為藝術領域帶來了創(chuàng)新和變革。其常見的應用領域如圖1所示。
①文學創(chuàng)作。AI不僅能模仿特定作者的風格創(chuàng)作文學作品,還能獨立生成全新的內(nèi)容,包括詩歌、小說、散文等多種文學形式。
②視覺藝術創(chuàng)作。視覺藝術創(chuàng)作可分為靜態(tài)視覺藝術創(chuàng)作和動態(tài)視覺藝術創(chuàng)作。靜態(tài)視覺藝術創(chuàng)作以常見的圖像生成為代表,同時廣泛地應用于圖像處理、風格遷移、平面設計等領域;動態(tài)視覺藝術創(chuàng)作以視頻生成、編輯和處理為代表,在視頻剪輯、動畫制作、特效合成等視頻創(chuàng)作與處理環(huán)節(jié)均有應用,常用于影視制作領域。
③聽覺藝術創(chuàng)作。AI在聽覺藝術創(chuàng)作中的應用可以大致分為音樂創(chuàng)作和聲音處理兩個部分。AI在音樂創(chuàng)作中的應用主要包括旋律生成、和聲編排、樂器模仿等;在聲音處理中的應用主要包括音效生成、聲音自動編輯與優(yōu)化等。
除上述三個常見應用領域之外,AI技術還可以運用于藝術分析與理解領域,通過識別藝術作品的風格和情感表達,幫助人們進行藝術品的分類和鑒定,為藝術批評提供新的視角。
項目實現(xiàn):“為黑白視頻上色”
前段時間,筆者無意中看到一條新聞:一個藝術家利用人工智能為一些古老的視頻做修復、上色,使其煥發(fā)新活力。經(jīng)過分析,這個案例的操作難度不大,基本上屬于AI模型的應用。要完成這個案例,需結(jié)合視頻數(shù)字化的原理,很適合用于中小學教學。
1.“黑白視頻上色”的原理分析
(1)視頻播放的基本原理
視頻是通過連續(xù)播放一系列靜態(tài)圖像(幀)來形成連續(xù)的動態(tài)視覺效果。在視頻播放時,每一秒內(nèi)顯示的幀數(shù)稱為幀率,通常以每秒幀數(shù)(FPS)來衡量。視頻播放器按照預定的幀率順序讀取視頻文件中的每一幀,并以極快的速度連續(xù)顯示在屏幕上。由于人眼的視覺暫留效應,即圖像在視網(wǎng)膜上保留的短暫時間,當幀以足夠快的速度連續(xù)播放時,人眼無法察覺到每幀之間的間隔,因此產(chǎn)生了連續(xù)運動的錯覺。
(2)圖像著色技術原理
圖像著色是灰度圖像偽彩色化的過程。圖像著色模型是將灰度圖像轉(zhuǎn)換為彩色圖像的模型,它基于大量灰度和彩色一一對應的圖像數(shù)據(jù)集進行訓練,從而實現(xiàn)根據(jù)圖像的內(nèi)容來推斷合理的顏色分布,實現(xiàn)從灰度到彩色的映射。
(3)視頻上色的實現(xiàn)方式
根據(jù)上文可知,視頻文件本質(zhì)上是由一系列按時間順序排列的靜態(tài)圖像(幀)組成的。只要將視頻中的每一幀圖像取出,分別進行著色處理,上色完成后再拼成視頻,便可以達到“為黑白視頻上色”的效果。
2.視頻拆解為圖像的功能實現(xiàn)
為了對視頻中的每一幀圖像進行著色處理,首先要從視頻中提取這些幀。實現(xiàn)此功能的步驟包括:
①視頻讀取。利用視頻處理庫(如OpenCV)中的函數(shù),按照視頻的編碼格式和幀率讀取視頻文件,代碼如圖2所示。
②幀提取。通過循環(huán)遍歷視頻的每一幀,將其作為單獨的圖像提取出來,為后續(xù)的圖像處理做準備,代碼如圖3所示。
3.黑白圖像上色的功能實現(xiàn)
XEduHub是一個深度學習工具庫,為用戶提供了簡潔的推理工具Workflow。目前,XEduHub內(nèi)置了多種內(nèi)容生成的任務,其中包括圖像著色模塊,任務名稱為gen_color。該任務通過調(diào)用基于卷積神經(jīng)網(wǎng)絡訓練的模型進行推理,自動地為黑白圖像添加顏色,實現(xiàn)了快速生成逼真的著色效果。
①單張圖像上色。從XEduHub工具庫中選擇適用于圖像著色的預訓練模型(gen_color),加載選定的圖像著色模型,對提取的黑白圖像幀應用模型推理,模型將基于學習到的顏色分布為圖像預測并填充顏色,代碼如上頁圖4所示。
②批量處理。在實現(xiàn)單張黑白圖像上色的基礎上,使用循環(huán)函數(shù)對由視頻拆解而來的多張黑白圖像上色,代碼如圖5所示。
4.圖像拼接為視頻的功能實現(xiàn)
當所有圖像幀完成著色后,需要將這些彩色幀重新組合成視頻。使用OpenCV庫中的VideoWriter類創(chuàng)建視頻編寫器對象,并設置輸出視頻的參數(shù),如分辨率、幀率和編碼格式。隨后,將著色后的圖像幀按順序?qū)懭胍曨l流中,完成視頻上色的整體流程,代碼如圖6所示。
總結(jié)
本項目通過使用深度學習工具庫XEduHub中的gen_color圖像著色模型,實現(xiàn)了“為黑白視頻上色”的功能。這一過程涉及三個關鍵步驟:視頻拆解為圖像、黑白圖像上色、圖像拼接為視頻。通過這一系列操作,不僅為老電影、老視頻賦予了新的生命,也為歷史影像資料的數(shù)字化修復和藝術再現(xiàn)提供了新的方法,同時展示了AI在藝術創(chuàng)作中的潛力,激發(fā)了學生對技術的興趣,還培養(yǎng)了他們的創(chuàng)新思維和審美能力。
參考文獻:
[1]湯欣雯.中國傳統(tǒng)文化主題的AI藝術創(chuàng)作與效果研究——以人工智能綜藝節(jié)目《機智過人》為例[J].視聽,2022(11):40-43
[2]龍巖.當AI遇上藝術:藝術創(chuàng)作的變革之路[J].玩具世界,2024(03):23-25.
[3]徐中輝,呂維帥.基于卷積神經(jīng)網(wǎng)絡的圖像著色[J].電子技術應用,2018,44(10):19-22.
[4]張美玉,劉躍輝,侯向輝,等.基于卷積網(wǎng)絡的灰度圖像自動上色方法[J].計算機工程與應用,2022,58(07):229-236.