張寶
【摘 要】人工智能技術(shù)在教育領(lǐng)域中得到了廣泛應用,語音識別、語音合成、圖像識別等人工智能技術(shù),早已融合到多媒體素材制作、微課視頻制作等各類軟件應用中。本文基于筆者的實踐研究具體介紹了人工智能技術(shù)在獲取課件素材、微課制作等方面的應用,如快速獲取圖片中的文本、生成個性化語音、為微課配音和自動識別生成字幕、AI提詞拍攝,以及由文本和聲音直接生成數(shù)字人播報視頻等,凸顯人工智能技術(shù)在教育資源制作中的明顯作用。
【關(guān)鍵詞】人工智能;中小學教育資源;微課制作
【中圖分類號】G434? 【文獻標識碼】A
【論文編號】1671-7384(2023)05-087-04
目前,人工智能(AI)已應用到各行各業(yè),在人們工作和生活中得到了廣泛的應用,人們正在享受AI帶來的便利。在教育領(lǐng)域,人工智能也得到了廣泛應用,語音識別、語音合成、圖像識別等人工智能技術(shù),早已融合到多媒體素材制作、微課視頻制作等各類軟件應用中。中小學教師使用帶有AI技術(shù)的工具軟件,可以快速獲取圖片中的文本、生成個性化語音、為微課配音和自動識別生成字幕、AI提詞拍攝,以及由文本和聲音直接生成數(shù)字人播報視頻,甚至識別人物臉部和肢體動作生成動畫微課。人工智能技術(shù)在中小學微課制作和素材獲取方面的作用日益明顯。
人工智能技術(shù)的應用
人工智能技術(shù)在教育領(lǐng)域中的應用,主要包括語音識別、圖像識別、自然語言處理、大數(shù)據(jù)、機器人、AR/VR等,有很多技術(shù)已融合到各類應用軟件中,不被人們查覺地使用,提高了各方面的工作效率。如圖像識別技術(shù)在現(xiàn)實生活和社交網(wǎng)絡(luò)應用中起到重要的作用,在人臉識別、網(wǎng)絡(luò)內(nèi)容審核、拍照搜題等方面得到了應用。語音技術(shù)主要包括語音識別和語音合成等,語音識別技術(shù)就是讓智能設(shè)備聽懂人類的語音,可以實現(xiàn)語音到文字、文字到語義的轉(zhuǎn)換,用語音方式輸出用戶想要的信息。語音識別己用于許多領(lǐng)域,包括語音識別聽寫、語音智能服務(wù)、語音翻譯、命令控制、語音驗證碼等。語義識別還能將文本轉(zhuǎn)化為圖片,如國內(nèi)AI藝術(shù)和創(chuàng)意輔助平臺“文心·一格”,可根據(jù)文本內(nèi)容生成多種風格的繪畫。人工智能技術(shù)可以幫助中小學學科教師快速獲取文字、圖片、聲音、視頻等多媒體素材,還可以為微課視頻生成字幕、智能配音、虛擬角色,快速生成動畫微課。
利用AI技術(shù)獲取課件素材
1.圖像識別之獲取文字
在教學資源獲取過程中,經(jīng)常有教師想要獲取紙質(zhì)圖書、雜志、試卷中的文字,或者網(wǎng)頁上只讓閱讀不讓下載的文檔內(nèi)容或圖片中的文字,甚至想將手寫的文檔轉(zhuǎn)成電子文檔。現(xiàn)在,教師可以使用多種軟件工具來獲取圖片中的文字,如利用電腦端的聊天軟件和移動端的微信小程序、輸入法工具、聊天軟件及手機拍照等能方便、快速、高效地獲取文字。
在手機端獲取文字的方法有很多,如直接拍照或打開已拍好圖片,然后進行文字識別,獲取圖片中的文字。①利用微信小程序,如傳圖識字、多媒體AI平臺、微軟AI識圖等,通過拍照或照片來進行文字識別。②在輸入法工具中,如迅飛輸入法、搜狗輸入法等,提供了“拍照輸入”等AI識字功能。③現(xiàn)在的智能手機一般都具有“智慧識別”功能,可直接手機拍照識別文字,并能翻譯。④利用微信、QQ或TIM聊天工具,在聊天對話框中,選中插入的圖片,對圖片中的文字進行識別提取。
在電腦端獲取圖片中文本的方法也有很多,操作比較簡單的可用QQ或TIM。啟動QQ或TIM后,利用截圖功能(默認截屏鍵是Ctrl+Alt+A),選中圖片、屏幕或網(wǎng)頁中的文本區(qū)域,在出現(xiàn)的截屏工具欄上選擇“屏幕識圖”按鈕,就能快速識別文字,并可對識別的文字進行編輯、翻譯、轉(zhuǎn)為在線文檔、復制和下載等操作,利用復制或下載功能,就可快速獲取文字。
2.語音識別之獲取文字和語音
語音識別技術(shù)可以幫助教師快速錄入文字或得到音視頻的文字稿,還可以將文字轉(zhuǎn)換為所需音頻文件,并能設(shè)置生成不同人物角色的聲音,還可以將中文文本或語音直接翻譯成英文等。
(1)語音識別之獲取文字
通過語音識別獲取文字有兩種常用方式。一種是根據(jù)朗讀、交流的語音直接獲取文字,在移動端通過訊飛輸入法、訊飛語記等應用工具進行朗讀,AI技術(shù)將語音轉(zhuǎn)為文字。訊飛輸入法的翻譯功能,不僅可以直接將中文語音轉(zhuǎn)成英文文本,還可以將英文語音轉(zhuǎn)成中文文本。另一種方式則是將會議錄音或培訓錄像等視頻資源中的語音識別出來,得到會議或培訓的文字稿,使用的工具有剪映、智影、飛書妙記等。如在電腦端可以通過智影的字幕功能,得到視頻的字幕文件,通過對下載的字幕文件進行編輯,獲取文字稿;還可以利用剪映的電腦版,通過語音識別得到視頻的文字稿,獲取視頻中語音的文字。
(2)語音合成技術(shù)應用之文本轉(zhuǎn)語音
語音是最直接的信息交流方式?,F(xiàn)在文本轉(zhuǎn)語音的工具很多,輸出應用方式也不同。如Microsoft Edge瀏覽器的“大聲朗讀”功能,可直接朗讀任意網(wǎng)頁或TXT文件中的文本。還有可將文字直接生成不同角色語音的語音軟件,如微軟語音合成助手、智影的“文本配音”工具等免費語音合成軟件。如圖1所示,為微軟語音合成助手的工作界面,輸入文本后,設(shè)置語言、語音、速度、音調(diào)等內(nèi)容,選擇合適的聲音參數(shù),試聽后可以保存為MP3格式音頻文件。萬彩動畫大師、萬彩錄屏大師等視頻編輯軟件,可以將輸入的文本轉(zhuǎn)為視頻的字幕、配音,或直接保存為音頻文件,如在萬彩動畫大師編輯界面,點擊“語音”命令,出現(xiàn)“文本轉(zhuǎn)語音”對話框,根據(jù)輸入的文本或字幕,選擇角色,設(shè)置語速和音量等,就可生成不同男音、女音、兒童音、卡通人物、明星等聲音,為視頻中的角色配音,并能保存為MP3格式的聲音文件。
人工智能在微課制作中的應用
1.智能識別視頻語音,生成微課字幕
視頻中的字幕能強化信息的表達,加強信息的準確性、明晰性,減少聽覺的誤差。由于很多字詞同音,語言表達時易混音,通過字幕文字和視音頻畫面結(jié)合來觀看,會更加清楚視頻表達內(nèi)容,還能幫助聽力較弱的觀眾理解視頻內(nèi)容,可見字幕的重要作用。
視頻語音生成字幕的工具軟件有很多,在電腦端有剪映電腦版、智影、聽見字幕等,移動端有剪映App、度咔剪輯、快影等。這里以剪映電腦版為例,在剪映中導入視頻,然后選擇“文本”|“智能字幕”命令(圖2),選擇“識別字幕”的“開始識別”,軟件就開始識別字幕,識別字幕的時間由視頻的長短決定。生成字幕后,在軌道區(qū)出現(xiàn)字幕軌道,右側(cè)屬性面板可以編輯字幕的文本,設(shè)置字幕的大小、位置、顏色、朗讀等,還可以設(shè)置字幕的動畫方式。生成的字幕可以通過“導出”命令導出.SRT或.TXT格式的文本。
2.文字識別生成微課配音
微課視頻配音使學習者不僅能在視覺上獲取信息,還可通過旁白或?qū)υ挼嚷曇裘襟w獲取知識。制作微課視頻,對于一些普通話不標準或想生成英語語音資源的教師,有一定難度。但教師可以利用AI技術(shù),將文字轉(zhuǎn)化為語音,為微課生成不同角色風格的配音,用語音為微課賦予更多的活力。
將文字生成配音的視頻編輯軟件有很多,在電腦端有剪映電腦版、萬彩動畫大師、萬彩錄屏大師等,移動端有剪映、快影等App應用。這里以剪映電腦版為例,啟動剪映軟件,輸入字幕文本,或通過視頻識別得到字幕文本,選中字幕文本,在右側(cè)屬性面板朗讀標簽中設(shè)置字幕文本的語音,可在軟件提供的38種各類角色語音、歌曲或舞曲中來選擇,如圖3所示,選擇確認角色聲音后,點擊“開始朗讀”按鈕,即可為視頻生成文本朗讀配音。
3.生成課件虛擬角色
現(xiàn)在視頻課程提倡教師出鏡,但教師一成不變地出現(xiàn)在微課視頻講解中,時間長了,學生也會出現(xiàn)審美疲勞,還有一些教師因各種原因不想真人出鏡,這時可以嘗試各種虛擬卡通形象,利用虛擬教師角色在微課或直播視頻中講解。
(1)虛擬角色工具——Snap Camera
Snap Camera是國外一款攝像頭圖像增強軟件,能夠為視頻添加各種有趣的特效和虛擬角色。教師在錄制微課或遠程直播時,打開Snap Camera,選擇一個虛擬卡通形象,如圖4所示,教師本人形象以卡通形象展示出現(xiàn)。然后打開PowerPoint的“錄制”功能或騰訊會議、OBS等視頻會議和錄制軟件,教師的視頻源選擇Snap Camera的虛擬攝像頭,這樣教師虛擬形象就會出現(xiàn)在錄制的微課或視頻會議中,以虛擬形象進行授課培訓。
(2)AR助播——說得相機
說得相機是一款手機視頻智能拍攝App,提供AR助播功能,包括真人與AR角色的合拍、AR角色的單拍、多個AR角色合拍等制作方式。制作微課視頻時,首先輸入腳本文字內(nèi)容,然后添加AR角色,并為每個角色選擇對應腳本文字,設(shè)置完成后點擊“去拍攝”按鈕。在拍攝界面,可以設(shè)置虛擬背景、角色的角度和聲音的語速、語調(diào)等。拍攝時,可根據(jù)文本為角色自動生成語音及相應的表情動作,并為教師智能提詞。說得相機的AI助播功能非常適合制作情景對話類、知識分享類視頻微課。
(3)虛擬數(shù)字人視頻播報——智影
學校若要制作一個正式的宣傳和展示視頻,教師要錄制一個線上活動介紹或微課講解,現(xiàn)在不用教師本人出鏡,只要提供文本或語音驅(qū)動,就可以生成用數(shù)字虛擬人物來進行播報的視頻。常用的有智影、科大訊飛、奇妙元等工具的虛擬主播功能,這里以智影為例。智影是一款云端智能視頻創(chuàng)作工具,集視頻剪輯、渲染導出和發(fā)布于一體的免費在線視頻剪輯平臺,具有強大的AI智能工具,其中的數(shù)字人播報,目前免費提供12個2D數(shù)字人、1個3D數(shù)字人形象,可以通過文本或音頻驅(qū)動數(shù)字人進行新聞報道。
操作步驟:打開網(wǎng)頁瀏覽器,登錄智影網(wǎng)站(zenvideo.qq.com),選擇“數(shù)字人播報”工具,出現(xiàn)“文本驅(qū)動”和“音頻驅(qū)動”對話框,這里選擇“文本驅(qū)動”。然后在出現(xiàn)的“數(shù)字人設(shè)置”中選擇主播角色,如圖5所示,可為角色設(shè)置服裝、姿態(tài)與位置,還可以在平臺圖庫中選擇背景圖片,能設(shè)置綠幕背景或上傳教師本地電腦中的圖片。設(shè)置完成后,進入語音設(shè)置界面,可以選擇角色的語音、語速、插入停頓等,還可以設(shè)置數(shù)字人動作,設(shè)置完成后點擊“生成預覽”,就能查看數(shù)字人播報視頻效果,可下載視頻。
(4)真人變卡通——剪映的“抖音玩法”
對于一成不變的教師真人出鏡視頻,可以將已錄制好的真人微課變成卡通虛擬人物,剪映App提供了“魔法變身”功能。
操作步驟:啟動剪映App,在軌道中選中視頻,在工具欄選擇“抖音玩法”|“魔法變身”,確認后,軟件為視頻中人物進行卡通化處理,處理完成后,得到人物卡通化視頻,如圖6所示。
4.制作動畫微課
在各類微課形式中,動畫微課更受學生的喜愛,但制作動畫微課比較費時費力,很多教師都望而卻步?,F(xiàn)在制作動畫視頻也已經(jīng)應用AI技術(shù),如Cartoon Animator、Adobe Character Animator等動畫制作軟件,只需要選擇人物角色或制作人物角色,通過軟件的AI面部識別和肢體運動識別,將教師的語音、表情和動作同步給動畫角色,就能為動畫角色配音和生成角色動作,快速生成動畫微課,如圖7所示。對于Cartoon Animator軟件,不僅能真人識別,還能對已有視頻中的人物進行面部、肢體識別,將語音、表情和動作同步給軟件中的動畫角色,快速將真人培訓課程轉(zhuǎn)為動畫微課。
5.移動端錄制微課的AI智能同步提詞
當有些教師需要錄制視頻時,在鏡頭面前經(jīng)常會詞不達意,導致錄制視頻過程中出現(xiàn)卡頓、忘詞等現(xiàn)象。為避免遺漏知識點或者不知道怎么說的尷尬,可以準備些提詞內(nèi)容。由于在移動端錄制微課方便快捷,移動端錄播越來越受歡迎,在移動端拍攝微課時的提詞更方便,只用一部手機或平板就可實現(xiàn)。移動端的一些提詞軟件還具有AI智能提詞功能,可以根據(jù)讀詞的語速自動滾動,讓臺詞跟著人走,提詞過程中想快就快、想慢就慢、想停就停,如度咔剪輯、說得相機、快提詞等App。
例如,說得相機App提供“提詞拍”“懸浮提詞”“提詞板”等提詞模式均支持AI智能提詞,只需先創(chuàng)建臺詞,輸入臺詞的標題和文本內(nèi)容,完成后保存臺詞,再選擇提詞模式,錄制的時候能根據(jù)語音智能滾動字幕提詞。輕抖App的“語音提詞”功能,可以根據(jù)提供的文本,設(shè)置語速和男聲、女聲,自動生成語音,教師需要提詞時,只要帶上藍牙耳機便能邊聽邊錄制。
隨著技術(shù)的發(fā)展,很多教育軟件中融合了AI技術(shù),中小學教師在制作教學資源時,需要熟悉掌握各工具軟件中的AI功能,充分發(fā)揮人工智能技術(shù)的優(yōu)勢,高質(zhì)、高效地制作教學資源,為個性化教學提供優(yōu)質(zhì)教學資源。
作者單位:北京市西城區(qū)教育研修學院
編? ?輯:徐靖程