王德貴 丁大為
上一期我們介紹了Base64編碼的基本知識和應(yīng)用在文本編碼中的實例,下面繼續(xù)學(xué)習(xí)Base64編碼在圖片和聲音中的應(yīng)用,以及信息審核中的原理解析。
1.圖片編碼
由于圖片的大小不一,Base64編碼文件可能特別大,可以將圖片等比例縮放,這要下載一個圖片轉(zhuǎn)換插件“TaifunImage”(圖1)。
這里調(diào)用了一個過程“resizeimage”,在AppInventor中,也叫函數(shù)(圖2)。
用這個函數(shù)將任意大小的圖片,轉(zhuǎn)換成寬度為300,高度按原圖成比例的新圖片,便于轉(zhuǎn)碼。
圖片來源可以是照片,也可以是圖像文件。經(jīng)過縮放處理后,點擊“查看”按鈕,即可看到圖3的效果。這里顯示的編碼大約是全部編碼的1/25。
2.聲音編碼
把3秒的音頻文件,轉(zhuǎn)換為Base64編碼(圖4)。
點擊錄音后調(diào)用錄音機實時錄音3秒,錄音格式默認(rèn)為“3gp”,也可選擇其他音頻文件進(jìn)行轉(zhuǎn)換,這里不再說明,有興趣的朋友可自行研究。這里將音頻文件的Base64編碼顯示成文本,文件越大,編碼也就越長,傳輸也就會越慢(圖5)。
1.文本審核
(1)基本測試:Base64編碼,是處理發(fā)送和接收信息的基本編碼,隨時都在使用的。比如在文本審核時,過濾一些敏感詞語。組件設(shè)計如圖6,組件屬性隨意設(shè)置,能測試即可。
(2)敏感詞匯代碼:輸入敏感詞匯,然后提交,就會在下方顯示其Base64編碼。延時1秒(1000毫秒)是因為文件管理器是異步保存文件,保存后才進(jìn)行編碼(圖7)。
(3)待審文本代碼:輸入待審文本,然后提交,就會在下方顯示其Base64編碼。延時后保存文件,然后進(jìn)行編碼(圖8)。
(4)文本審核代碼:敏感詞匯和待審文本提交后,才能進(jìn)行文本審核,用紅色背景提示包含敏感詞匯。
比如“敏感詞匯”輸入“流氓”,“待審文本”輸入“誰是流氓”,提交后顯示如圖9左圖,再點擊“文本審核”,即顯示圖9右圖。
通過實例,我們看到Base64編碼可作為比較文本內(nèi)容的一個方法。
2.圖片審核
如果是文字圖片,先識別文字后,直接審核文字無需轉(zhuǎn)碼。普通圖片則需要轉(zhuǎn)碼后與敏感圖片的編碼進(jìn)行比較,這個比較不是單純地比較重復(fù)代碼,而是需要提前進(jìn)行機器學(xué)習(xí)(AI神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)),獲取敏感圖片的特征編碼,再用于審核待審圖片的編碼。想要開發(fā)自己的審核程序可以參考相關(guān)AI神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的開放平臺的說明(百度、騰訊、阿里等),本文不做探討。
3.音頻審核:一般是將音頻文件進(jìn)行語音識別后,通過文本比較進(jìn)行審核。
4.視頻審核:視頻如果是人工審核,則需要大量人力和時間,一般采用的方法是在視頻中抽取一定數(shù)量的幀,變成圖片后再進(jìn)行審核。
實際應(yīng)用中,對信息的審核是根據(jù)內(nèi)容和算法的不同,而采取了不同的審核方法,主要是利用AI(人工智能)進(jìn)行自動審核,除了自己開發(fā)應(yīng)用程序外,現(xiàn)在很多網(wǎng)站也提供了相應(yīng)的服務(wù),有興趣的朋友可以上網(wǎng)查詢一下相關(guān)資料。