国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

VR作品素材的人工智能解決方案

2023-06-02 23:52傅駿鄭丁元曾欣雨傅馨竹顧詩(shī)藝楊艷萍
計(jì)算機(jī)應(yīng)用文摘 2023年10期
關(guān)鍵詞:虛擬現(xiàn)實(shí)

傅駿 鄭丁元 曾欣雨 傅馨竹 顧詩(shī)藝 楊艷萍

關(guān)鍵詞:人工智能生成;虛擬現(xiàn)實(shí);科研育人

在推行“123N”科研育人模式的過(guò)程中,圍繞“立德樹(shù)人”的育人主線,通過(guò)雙途徑提升,實(shí)現(xiàn)三階段培養(yǎng),緊扣“N”個(gè)痛點(diǎn),以服務(wù)社會(huì)和實(shí)現(xiàn)文化傳承,項(xiàng)目團(tuán)隊(duì)始終堅(jiān)持科技倫理和工程倫理,充分尊重知識(shí)版權(quán),正確合理利用商業(yè)軟件和開(kāi)源軟件。

在承擔(dān)教育部VR專(zhuān)項(xiàng)教研課題與完成省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)課題《你好,青銅器》《VR助力人工智能教學(xué)》等VR作品期間,利用開(kāi)源人工智能平臺(tái)開(kāi)發(fā)了系列軟件,既滿足了制作VR作品的素材方面的精準(zhǔn)需求,同時(shí)獲得多個(gè)軟件著作權(quán),有力地提升了師生的工程實(shí)踐能力,培育了一批創(chuàng)新創(chuàng)業(yè)項(xiàng)目。

1開(kāi)源人工智能平臺(tái)

搭建平臺(tái)需要選用合適的開(kāi)發(fā)語(yǔ)言,完成素材的導(dǎo)人,對(duì)結(jié)果提取所需信息并保存。

1.1開(kāi)發(fā)語(yǔ)言

開(kāi)發(fā)人工智能程序時(shí),建議采用“Python+VSCode"的開(kāi)發(fā)環(huán)境[1]。

1.1.1Python

近年來(lái),在主流編程語(yǔ)言應(yīng)用排行榜中,Python長(zhǎng)期占據(jù)前幾位甚至連續(xù)很長(zhǎng)時(shí)間為第一名。原因在于其代碼簡(jiǎn)潔、語(yǔ)法優(yōu)美、簡(jiǎn)單易學(xué),并且開(kāi)源、擴(kuò)展性好。有愛(ài)好者稱(chēng)贊“Python為人工智能的首選語(yǔ)言”,它廣泛應(yīng)用在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

1.1.2Visual Studio Code

Python自帶集成開(kāi)發(fā)和學(xué)習(xí)環(huán)境IDLE,但建議采用pycharm或Visual Studio Code開(kāi)發(fā)。VSCode是一由微軟開(kāi)發(fā)且跨平臺(tái)的免費(fèi)源代碼編輯器,輕量、簡(jiǎn)單易用。安裝VSCode后擴(kuò)展安裝Python運(yùn)行庫(kù)即可。

1.1.3開(kāi)發(fā)原則

在開(kāi)發(fā)時(shí),遵循軟件工程倫理。只使用來(lái)自合法渠道的精確數(shù)據(jù),且只使用正當(dāng)授權(quán)的手段。遵守最合適的產(chǎn)業(yè)標(biāo)準(zhǔn),而不僅僅是技術(shù)標(biāo)準(zhǔn)。

代碼文檔化,變量名做到“見(jiàn)名知義”,添加必要的注釋。追求“清晰第一,效率第二”的原則,不允許賣(mài)弄技巧的堆積[2]。

1.2資源的導(dǎo)入

對(duì)文字和圖片的處理,均需要采用通用字符形式。base64是一種可以在HTTP協(xié)議下面?zhèn)鬏斶@種較長(zhǎng)數(shù)據(jù)的編碼格式,并且它是以8字節(jié)來(lái)保存數(shù)據(jù)的,能夠表示ASCII碼。

1.2.1文本的讀入

用open即可導(dǎo)人txt命令。考慮到導(dǎo)人的txt文本可能存在多種格式的字符,使用以下命令導(dǎo)人txt文本,對(duì)不可識(shí)別的符號(hào)予以忽略:

1.2.2圖片的base64格式

一個(gè)圖片文件對(duì)象內(nèi)包含許多的圖像信息,需要將表示它的數(shù)組結(jié)構(gòu)轉(zhuǎn)為計(jì)算機(jī)文件數(shù)據(jù)傳輸協(xié)議之中的通用格式。Python中將圖片pic轉(zhuǎn)為base64和ASCII的命令為:

pica=open( 'pic-, -rb') .read

picb64=base64.b64encode( pica.read()))

picstr=str( picb64)

1.2.3正則表達(dá)式

正則表達(dá)式使用單個(gè)字符串來(lái)描述、匹配某個(gè)句法規(guī)則的字符串,通常被用來(lái)檢索、替換符合某個(gè)模式(規(guī)則)的文本。

在正則表達(dá)式中,將字符串zifu中的“AI”替換成“人工智能”和“虛擬現(xiàn)實(shí)”替換成“VR”的命令是:

1.3開(kāi)源API調(diào)用

開(kāi)源AI平臺(tái)主要提供的有應(yīng)用功能、平臺(tái)功能和文心AIGC,提供SDK和API的一種或兩種方式供用戶使用。用戶在控制臺(tái)通過(guò)“創(chuàng)建應(yīng)用”,獲得API_KEY(AK)和SECRET_KEY(SK)。

SDK使用流程相對(duì)簡(jiǎn)潔,使用AK及SK即可實(shí)現(xiàn)功能。應(yīng)用API時(shí),要先通過(guò)AK及SK獲得訪問(wèn)令牌[3]。

1.3.1獲得訪問(wèn)令牌

獲得訪問(wèn)令牌token的方法是:

1.3.2API訪問(wèn)

平臺(tái)提供基于response庫(kù)的POST或GET兩種方式。比如,對(duì)圖片1mage實(shí)現(xiàn)ocr識(shí)別的API方式是:

1.3.3結(jié)果的提取和保存

API以字典和列表的形式來(lái)展示結(jié)果。列表的提取是用元素的下表標(biāo)示,從0開(kāi)始。字典是用“鍵一值”來(lái)訪問(wèn),如result[ 'name']。

不同功能的結(jié)果類(lèi)型不一定相同??梢杂胻ype來(lái)查看數(shù)據(jù)類(lèi)型。對(duì)字符型可以用eval轉(zhuǎn)化為數(shù)值型,對(duì)數(shù)值型則用str轉(zhuǎn)化為字符型。

有時(shí)為了便于區(qū)分,可以在保存的文本或圖片名稱(chēng)中加上時(shí)間戳,采用的命令是time.ctime(),結(jié)果是“星期月日時(shí)分秒年”格式,如“Sun Feb 5 15:05:IO2023”表示當(dāng)前是2023年2月5日星期天下午15:05:10。

2人工智能技術(shù)獲得VR作品素材

開(kāi)發(fā)虛擬現(xiàn)實(shí)VR作品用到的素材有圖片、文字、語(yǔ)音、視頻等。它們可以利用人工智能生成AIGC技術(shù),也可以利用素材進(jìn)行基于人工智能的編輯。

2.1素材的人工智能生成AIGC技術(shù)

作品內(nèi)容的生成在經(jīng)歷專(zhuān)業(yè)生成PGC、用戶生成UGC之后,發(fā)展到人工智能生成AIGC。AIGC也走過(guò)了助手和協(xié)作階段,進(jìn)入到了原創(chuàng)階段。

2.1.1文心AI作畫(huà)

VR作品中的壁畫(huà)、掛圖等圖片可以利用文心AIGC技術(shù)生成。其流程是:

(1)導(dǎo)人文心一格API。

通過(guò)pip install wenxin-api命令安裝文心API。調(diào)用命令是:

import wenxin_api

from

wenxin—api. tasks. text—to—image

importTextToImage

(2)API調(diào)用生成圖片。

文心作畫(huà)的關(guān)鍵代碼是:

以上參數(shù)中,“text”是對(duì)圖片的描述文字,要遵循prompt規(guī)則?!皊tyle”是圖片格式,如蒸汽波藝術(shù)、像素風(fēng)格、賽博朋克?!皉esolution”是生成的圖片尺寸,有1024x1024,1024x1536,1536x1024這3種。“number”是生成的圖片數(shù)量,取值范圍是1—6。

(3)結(jié)果提取。

運(yùn)行結(jié)果rst以字典形式展示,其中鍵“imgUrls”是生成的圖片的網(wǎng)址,通過(guò)picurl=rst[ 'imgUrls]獲得全部網(wǎng)址并保存在列表picurl中,picurl中元素個(gè)數(shù)即為獲得的圖片數(shù)量。

打開(kāi)picurl中第1個(gè)網(wǎng)址查看圖片的命令是:

import webbrowser

webbrowser.open( picurl[0])

將第1個(gè)網(wǎng)頁(yè)中的圖片以參數(shù)“text”中的prompt及時(shí)間戳作為名稱(chēng),保存在當(dāng)前路徑下的命令是:

2.1.2文本獲得語(yǔ)音

人工智能中文本合成技術(shù)的實(shí)現(xiàn)通過(guò)文本生成語(yǔ)音MP3格式的功能。文本合成調(diào)用的網(wǎng)址是HTTP:∥TSN.BAIDU.COM/TEXT2AUDIO.

代碼主要的參數(shù)中,“TEX”待轉(zhuǎn)換為語(yǔ)音的文本?!癓AN”是指語(yǔ)言類(lèi)別。“SPD”是語(yǔ)速,取值范圍為0~15?!癙IT”是音調(diào),取值范圍為0~15?!癡OL”是音量,取值范圍為0~15,默認(rèn)值為5?!癙ER”選擇發(fā)音角色?!癆UE”為聲音輸出格式,3為MP3格式,4為PCM格式,6為WAV格式等。

經(jīng)過(guò)測(cè)試,合成2000字符的中文為MP3,時(shí)間一般在2~3s。聲音清晰,可直接使用。

2.2素材的人工智能編輯技術(shù)

對(duì)于獲得的文本、聲音、圖片等資源進(jìn)行基于人工智能技術(shù)的編輯,滿足VR作品對(duì)素材的需求。

2.2.1文本翻譯

向外國(guó)人“講好中國(guó)故事”也是弘揚(yáng)中華傳統(tǒng)文化的方式之一,對(duì)“立德樹(shù)人”、樹(shù)立文化自信大有益處。

文本翻譯功能獲得翻譯后的文本。文本翻譯調(diào)用的網(wǎng)址是HTTPS:∥AIP. BAIDUBCE. COM/RPC/2.O/MT/TEXTTRANS。代碼中主要的參數(shù)是語(yǔ)言類(lèi)別,“FROM_LANG”是輸入文本的類(lèi)別,可以設(shè)置為“AUTO”?!癟O_LANG”是翻譯后的語(yǔ)言類(lèi)別,如中文為“ZH”。

翻譯后的結(jié)果以列表和字典形式展示。翻譯后的結(jié)果在鍵“TRANS_RESULT”下的“DST”中。

經(jīng)過(guò)測(cè)試,翻譯2000字符的中文為英語(yǔ),時(shí)間一般在IS以?xún)?nèi)。

2.2.2圖片合規(guī)性審查

該功能過(guò)濾圖像中的色情、廣告、惡心、違禁等違規(guī)內(nèi)容,也能從美觀、清晰等維度對(duì)圖像進(jìn)行篩選。

圖片合規(guī)性審查的網(wǎng)址是HTTPS:∥AIP.BAIDUBCE. COM/REST/2. O/SOLUTION/VI/IMG—CENSOR/V2/USER—DEFINED。代碼的參數(shù)中,“IMAGE”為BASE64格式的圖片。“IMGTYPE”是圖片類(lèi)型,0是靜態(tài)圖片,1是動(dòng)態(tài)圖片。

審查后的結(jié)果以列表和字典形式展示。其中,“CONCLUSIONTYPE”是審核結(jié)論,1表示合規(guī),2表示不合規(guī)。在鍵“CONCLUSION”下的“MSG”鍵中顯示不合規(guī)的具體項(xiàng)目,如“存在爆炸火災(zāi)不合規(guī)”“疑似存在藝術(shù)品不合規(guī)”等。

2.2.3圖像的智能化編輯

(1)風(fēng)格轉(zhuǎn)換。

圖像風(fēng)格轉(zhuǎn)換提供多種藝術(shù)風(fēng)格特效轉(zhuǎn)化服務(wù),還可自定義風(fēng)格圖像進(jìn)行風(fēng)格遷移。

實(shí)現(xiàn)風(fēng)格轉(zhuǎn)換調(diào)用的網(wǎng)址是HTTPS:∥AIP.BAIDUBCE. COM/REST/2. O/IMAGE-PROCESS/V1/STYLE_TRANS。代碼中主要的參數(shù)“OPTION”是希望的圖像風(fēng)格。其中,“CARTOON”是卡通畫(huà)風(fēng)格,“PENCIL”是鉛筆風(fēng)格,“GOTHIC”是哥特油畫(huà)風(fēng)格。

圖1是將JPG格式原圖轉(zhuǎn)化為PENCIL鉛筆風(fēng)格效果對(duì)比圖。該圖原件是基于文心AI作畫(huà)的AIGC技術(shù)生成的。

(2)黑白圖像上色。

本功能實(shí)現(xiàn)智能識(shí)別黑白圖像內(nèi)容并填充色彩,使黑白圖像變得鮮活。

實(shí)現(xiàn)黑白圖像上色的網(wǎng)址是https:∥aip.baidubce. com/rest/2. 0/image-process/vl/colourize。

主要的參數(shù)是image,是base64格式的圖片。指定圖片名稱(chēng)后,將實(shí)現(xiàn)保存上色后的圖片。

3結(jié)束語(yǔ)

在開(kāi)發(fā)VR作品的過(guò)程中,應(yīng)用人工智能技術(shù)開(kāi)源平臺(tái)技術(shù),基于AIGC生成技術(shù)創(chuàng)作素材以及基于人工智能技術(shù)對(duì)素材進(jìn)行編輯,可以確保精準(zhǔn)獲得自己需要的素材,同時(shí)不侵犯其他軟件的版權(quán)。

人工智能技術(shù)方興未艾,在創(chuàng)新創(chuàng)業(yè)課題中基于開(kāi)源人工智能技術(shù)創(chuàng)作開(kāi)發(fā)作品所需的素材,提升了項(xiàng)目團(tuán)隊(duì)的科研能力和工程實(shí)踐能力,將“立德樹(shù)人”、科研育人落在了實(shí)處。

猜你喜歡
虛擬現(xiàn)實(shí)
虛擬現(xiàn)實(shí)技術(shù)在中學(xué)校園中的應(yīng)用
論虛擬現(xiàn)實(shí)藝術(shù)的“沉浸”
REALITY BITES
虛擬現(xiàn)實(shí)產(chǎn)業(yè)進(jìn)入高速發(fā)展期
風(fēng)口上的虛擬現(xiàn)實(shí)
虛擬現(xiàn)實(shí)技術(shù)向科幻小說(shuō)借靈感
虛擬現(xiàn)實(shí):另一個(gè)真實(shí)世界
諾基亞推出虛擬現(xiàn)實(shí)攝像機(jī)OZO
虛擬現(xiàn)實(shí)炫酷來(lái)襲走出實(shí)驗(yàn)室坎坷漫長(zhǎng)
虛擬現(xiàn)實(shí)技術(shù)不能根本改變新聞