葉雪潔 楊陽朝 李陽陽 周陽
摘要:多媒體技術(shù)的快速發(fā)展為電郵系統(tǒng)帶來了全新的機遇和挑戰(zhàn),突出表現(xiàn)在網(wǎng)情分析難度增大、違規(guī)數(shù)據(jù)變種增多、反垃圾效果不明顯、高級防御能力偏弱、人機審核難度加大等方面。通過全網(wǎng)監(jiān)測網(wǎng)情態(tài)勢、實時捕獲環(huán)境特征、建設(shè)內(nèi)容風(fēng)控體系、強化高級威脅防護、提高內(nèi)容審核巡查等方式,電郵行業(yè)可以達到掌握關(guān)鍵信息動態(tài)、提高內(nèi)容識別效果、及時發(fā)現(xiàn)隱藏風(fēng)險、減少垃圾郵件干擾、降低人工審核成本等目標。未來,電郵行業(yè)應(yīng)立足“技術(shù)+應(yīng)用”發(fā)展道路,有效提高用戶體驗,推動人工智能與電郵行業(yè)融合創(chuàng)新,實現(xiàn)典型示范應(yīng)用和“殺手锏”產(chǎn)品,基本形成技術(shù)標準、服務(wù)體系和產(chǎn)業(yè)生態(tài)鏈,推動智能化應(yīng)用,提升產(chǎn)業(yè)發(fā)展水平。
關(guān)鍵詞:多媒體技術(shù);電郵行業(yè);內(nèi)容識別;智能化應(yīng)用
doi:10.3969/J.ISSN.1672-7274.2024.04.011
中圖分類號:TN 929.5,TP 391.44? ? ? ? ? 文獻標志碼:A? ? ? ? ? ? 文章編碼:1672-7274(2024)04-00-03
Research on the Development of Email Systems in the Context of Big Data
YE Xuejie, YANG Yangchao, LI Yangyang, ZHOU Yang
(China Electric Network Space Research Institute Co., Ltd., Beijing 100085, China)
Abstract: The rapid development of multimedia technology has brought new opportunities and challenges to email systems, particularly in the increased difficulty of network situation analysis, the increase in variants of illegal data, unclear anti spam effects, weak advanced defense capabilities, and increased difficulty in human-machine auditing. By monitoring the overall network situation, capturing environmental characteristics in real time, establishing a content risk control system, strengthening advanced threat protection, and improving content audit patrols, the email industry can achieve the goals of mastering key information dynamics, improving content recognition effectiveness, timely discovering hidden risks, reducing spam interference, and reducing manual audit costs. In the future, the email industry should focus on the development path of "technology+application", effectively improve user experience, promote the integration and innovation of artificial intelligence and the email industry, achieve typical demonstration applications and "killer" products, basically form technical standards, service systems and industrial ecological chains, promote intelligent applications, and enhance the level of industrial development.
Keywords: multimedia technology; the email industry; content recognition; intelligent applications
1? ?電郵行業(yè)發(fā)展背景
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等先進技術(shù)驅(qū)動,我國的新型人工智能產(chǎn)業(yè)將呈現(xiàn)出深度學(xué)習(xí)、人機協(xié)同、自主管理、群智開放、跨域融合等新發(fā)展特征,其高度交叉的技術(shù)屬性和產(chǎn)業(yè)特征將促使我國新型網(wǎng)信技術(shù)和傳統(tǒng)產(chǎn)業(yè)的深度融合發(fā)展,這對于推動我國生產(chǎn)力跨越式提升,搶占我國未來經(jīng)濟先機具有極其重要的戰(zhàn)略意義[1]。目前,多媒體技術(shù)是信息領(lǐng)域發(fā)展最活躍的技術(shù)之一。通過使用圖片、音頻、視頻等多種方式進行工作,多媒體覆蓋之廣、發(fā)展之快超乎想象,其裂變式發(fā)展引發(fā)了全球信息格局的重大調(diào)整和傳播生態(tài)的急劇變化[2][3]。電子郵件雖達不到即時通信軟件或社交媒體的飛速增長,但電子郵件系統(tǒng)是目前應(yīng)用最為普遍、最為關(guān)鍵的應(yīng)用系統(tǒng)之一,在網(wǎng)絡(luò)中是以明文形式傳輸和存儲的,因而電子郵件所具備的公信力和開放性仍是即時社交軟件所不可取代的,且將繼續(xù)存在。當前,電子郵件具有以下幾個特點。
(1)用戶規(guī)模保持低速穩(wěn)定增長。我國對電子郵件市場監(jiān)管將越來越規(guī)范,在全終端服務(wù)的趨勢加強,電子行業(yè)也將越來越活躍,市場優(yōu)勝劣汰越來越明顯。整體來看,電子郵件作為早期發(fā)展起來的通信方式,目前已擁有了數(shù)量龐大的用戶群體。我國電郵市場已趨于成熟,從2015年開始增長率維持在5%~7%,未來我國使用電郵用戶規(guī)模將保持低速穩(wěn)定增長。
(2)通信方式具備跨平臺特點。電子郵件作為去中心化的通信工具,相較于即時通信軟件,可實現(xiàn)跨平臺使用。郵件內(nèi)容可通過不同類型進行組織管理,實現(xiàn)分類文件、設(shè)置標簽、使用搜索等能力,并可與其他應(yīng)用程序集成,具備同步日歷、任務(wù)列表等功能,工作方便快速、便捷處理。
(3)郵件辦公成為重要使用方式。郵件系統(tǒng)主要有以下三個常見類型,即海外商業(yè)郵件服務(wù)系統(tǒng)、國內(nèi)商業(yè)郵件服務(wù)系統(tǒng)和開源郵件系統(tǒng)。在全球范圍內(nèi),郵件系統(tǒng)有相當普遍的使用,但相對于國內(nèi)市場來說,郵件系統(tǒng)大多在政府部門、院校、大中型央企、金融證券等領(lǐng)域應(yīng)用,郵件系統(tǒng)應(yīng)該具備更強的安全性和穩(wěn)定性。
2? ?電郵行業(yè)面臨的困難
目前,信息傳播來源廣泛、手段隱蔽多樣,信息技術(shù)快速發(fā)展對電子郵件行業(yè)帶來了很大的沖擊。我國目前已經(jīng)實施的《中華人民共和國網(wǎng)絡(luò)安全法》《互聯(lián)網(wǎng)信息服務(wù)管理辦法》《網(wǎng)絡(luò)安全法實施條例》等國家網(wǎng)絡(luò)安全法制規(guī)范,雖然已經(jīng)初步實現(xiàn)了對網(wǎng)絡(luò)新聞、音視頻資料、搜索引擎服務(wù)等帶有社會宣傳屬性和動員功能的公共信息服務(wù)行業(yè)全面監(jiān)管工作,但對電郵領(lǐng)域違法違規(guī)行為的有效管理手段相對企業(yè)而言還相對薄弱,且目前被動型、舉報式的監(jiān)管執(zhí)法手段已經(jīng)無法滿足新形勢下企業(yè)的行政執(zhí)法監(jiān)督工作需要,因此急需形成智能化、新型化、多樣化的工具與機制,以有效解決企業(yè)當前被動獲取違法違規(guī)行為線索的問題,而電郵領(lǐng)域則依然面臨著突出的安全監(jiān)管工作問題[4]。
Cofense Intelligence《2023年電子郵件安全報告》調(diào)查數(shù)據(jù)顯示,電子郵件仍面臨巨大的安全挑戰(zhàn)威脅。網(wǎng)絡(luò)釣魚作為最大的網(wǎng)絡(luò)攻擊載體,借此惡意電子郵件增加了478%;商業(yè)電郵欺詐(BEC)已連續(xù)第8年列入最嚴重網(wǎng)絡(luò)犯罪形式之一;在網(wǎng)絡(luò)釣魚活動中,使用Web3平臺托管惡意內(nèi)容,Web3技術(shù)增加了341%;利用Telegram機器人竊取信息的惡意活動明顯增加,同比增長超過800%;結(jié)合惡意軟件特性、成本和復(fù)雜性等特點,QakBot、Emotet依然是最值得關(guān)注的惡意軟件家族。當前,電郵行業(yè)面臨的困難主要有以下幾個方面。
(1)多源異構(gòu)數(shù)據(jù)增多,網(wǎng)情分析難度加大。短視頻等新業(yè)態(tài)帶來顛覆性問題,數(shù)據(jù)結(jié)構(gòu)已發(fā)生巨大變化,文字、圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)呈指數(shù)級增長,網(wǎng)情監(jiān)測在數(shù)據(jù)體量、生產(chǎn)速度和復(fù)雜程度等方面都發(fā)生了巨大變化[5]。
(2)深度偽造方法多樣,違規(guī)數(shù)據(jù)變種增多。目前,可用于深度偽造生成的開源軟件增多,出現(xiàn)更多的文本敏感詞、特殊符號混淆、圖片嵌入等違規(guī)內(nèi)容形式,極大降低了偽造門檻,如何識別深度偽造面臨新的技術(shù)挑戰(zhàn)[6]。
(3)風(fēng)控異常檢測缺失,反垃圾效果不明顯。單純依賴內(nèi)容維度檢測,缺失賬號維度、行為維度異常檢測,存在著內(nèi)容風(fēng)控維度單一、反垃圾效果不佳等問題;目前內(nèi)容風(fēng)控比較滯后,無法預(yù)知行為異常,垃圾內(nèi)容通過頻繁更換不同賬號發(fā)送。
(4)針對性攻擊更激烈,高級防御能力偏弱?;ヂ?lián)網(wǎng)上釣魚攻擊威脅的生命周期在不斷縮短,電子郵件攻擊越來越具有針對性,而勒索軟件攻擊則增長了數(shù)十倍,垃圾郵件的種類及其發(fā)送工具也越來越復(fù)雜、多樣。
(5)違規(guī)內(nèi)容對抗性強,人機審核難度加大。隨著個性化算法推薦技術(shù)的廣泛應(yīng)用,信息內(nèi)容分發(fā)效率得到顯著提高,與此同時伴隨著虛假信息傳播、信息繭房等問題,僅依靠人工和機器審核,無法判斷消息來源真假,去偽存真的內(nèi)容審核愈發(fā)重要[7]。
3? ?電郵行業(yè)技術(shù)趨勢
圍繞我國電郵行業(yè)目前面臨的重大技術(shù)難點,根據(jù)當前科學(xué)發(fā)展趨勢與國際市場趨勢研判,為全面落實黨的二十大會議精神,深入貫徹我國創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,全面釋放大數(shù)據(jù)分析潛能,將著重圍繞在大數(shù)據(jù)分析人工智能、高級機器學(xué)習(xí)、人機智能等新興技術(shù)領(lǐng)域進行攻關(guān),以算法為關(guān)鍵核心、以數(shù)據(jù)和硬件為基礎(chǔ),重點圍繞知識計算、認知推理、人機交互等關(guān)鍵領(lǐng)域共性技術(shù)重點布局攻關(guān)。
(1)全網(wǎng)監(jiān)測網(wǎng)情態(tài)勢,掌握關(guān)鍵信息動態(tài)。在數(shù)據(jù)融合方面,通過利用跨模態(tài)認知計算、語義理解認知等智能化技術(shù),基于文本、圖片、音視頻等數(shù)據(jù),通過機器視覺相關(guān)算法及模型來增強語義層面的融合與挖掘分析,從而融合處理多模態(tài)的復(fù)雜信息和數(shù)據(jù)和建立知識圖譜。在態(tài)勢預(yù)警方面,基于全球多語言、跨模態(tài)、全媒體信息智能搜索技術(shù)以及基于文本語義分析組件平臺的有害信息監(jiān)測發(fā)現(xiàn)、基于隱馬爾科夫模型等預(yù)警技術(shù),實現(xiàn)敏感和有害信息的快速預(yù)警,提供態(tài)勢感知、信息預(yù)警、深度研判、決策參考等全鏈條大數(shù)據(jù)支撐。
(2)實時捕獲環(huán)境特征,提高內(nèi)容識別效果。在敏感信息特征提取方面,通過機器學(xué)習(xí)方法來抽取敏感信息特征、構(gòu)建敏感信息識別語義模型,進而提出敏感信息檢測方法,從而實現(xiàn)智能鑒黃、違禁檢測、涉政檢測等功能,并建立自適應(yīng)移動互聯(lián)網(wǎng)特征的機器學(xué)習(xí)算法庫[8]。在模型參數(shù)的自動更新方面,通過采用在線學(xué)習(xí)算法可以及時捕獲最新的環(huán)境特征,從而對模型特征和參數(shù)進行適時更新調(diào)整,從而可減少模型的檢測性能下降問題。此外,為了更好地提高內(nèi)容理解和識別效果,一方面可以通過聯(lián)合聚類技術(shù),來收集偏旁部首的筆畫屬性特征,從而發(fā)掘詞語使用規(guī)律,進而構(gòu)建高階語義的智能詞庫,從而解決數(shù)據(jù)變種快的現(xiàn)象;另外,也可以通過語義池挖掘方法找到關(guān)鍵目標主題的語義池,并通過訓(xùn)練不同詞向量模型,以便于確定上下文語義關(guān)系圖和減少多義詞問題。
(3)建設(shè)內(nèi)容風(fēng)控體系,及時發(fā)現(xiàn)隱藏風(fēng)險。運用深度學(xué)習(xí)技術(shù),通過風(fēng)險名單、IP畫像、人機分析、設(shè)備建模、行為模型、業(yè)務(wù)模型等算法模型庫,通過研究多業(yè)務(wù)場景的全過程智能數(shù)據(jù)分析,新建關(guān)聯(lián)多維度行為的動態(tài)業(yè)務(wù)模型來滿足用戶需求,并經(jīng)過應(yīng)用者授權(quán)來檢測圖像、視頻中的色情、涉政等違法違規(guī)現(xiàn)象,通過定期對網(wǎng)站進行監(jiān)測并及時發(fā)現(xiàn)內(nèi)容安全風(fēng)險,探索網(wǎng)絡(luò)空間數(shù)據(jù)行為分析方法,從而發(fā)掘數(shù)據(jù)背后的行為規(guī)律,掌握信息行為背后的意圖,對行為進行精準預(yù)測,對網(wǎng)絡(luò)空間態(tài)勢進行評估,并以此為網(wǎng)絡(luò)空間安全的監(jiān)管政策提供強大技術(shù)支持。
(4)強化高級威脅防御,減少垃圾郵件干擾。為避免DDOS、字典入侵攻擊、內(nèi)部濫發(fā)和盜號等狀況的發(fā)生,以及保護郵件用戶系統(tǒng)不被納入黑名單系統(tǒng)、保證郵件用戶安全穩(wěn)定和通信順暢,我們需要采用截獲病毒、勒索、釣魚郵件等方法精準地識別垃圾郵件,以降低帶寬耗費和對垃圾信號的影響。在用戶行為分析和深層次內(nèi)容解析等先進技術(shù)手段的基礎(chǔ)上,可采用沙盒動態(tài)行為分析技術(shù),高效發(fā)現(xiàn)未知威脅,并采用靜態(tài)檢測、動態(tài)檢測、病毒檢測、釣魚檢測等技術(shù)引擎提升企業(yè)各種威脅檢測的能力,并可按照需求靈活地選擇檢測策略,通過實時而精準的分析技術(shù)來進行不間斷地威脅檢測和反垃圾防護措施。
(5)提高內(nèi)容審核巡查,降低人工審核成本。通過建立涵蓋“內(nèi)容+人員+運營”的鏈條式管理機制、提供細分型的定制化服務(wù),來提高對產(chǎn)出內(nèi)容信息的審查能力以及對具備文本、圖像、語音、視頻、網(wǎng)頁等多媒體內(nèi)容信息的風(fēng)險智能辨識與評估能力,同時創(chuàng)新發(fā)展并完善AI算法,打通人機審核的聯(lián)動機制,提升機審模型有效性,使人與AI有機融合在一起,實現(xiàn)更加有效和精準的內(nèi)容信息審查工作,以便于迅速識別淫穢色情、暴力恐嚇、政治敏感等信息,從而有效減少人工審核成本。
4? ?建議與展望
(1)電郵從內(nèi)容安全角度為切入點,具有一定發(fā)展空間。隨著新的媒介形式不斷發(fā)展,郵件的內(nèi)容安全問題也是越發(fā)突出,我們需要完成從關(guān)鍵詞分析到構(gòu)建知識圖譜的演進,完成從文本分析到跨媒體分析、從單語種分析到跨語種分析、從內(nèi)容分析到“時間+空間+地域+內(nèi)容+群體+行為”的多維分析轉(zhuǎn)變。未來電子郵件的技術(shù)發(fā)展將主要朝安全性、物聯(lián)網(wǎng)、融合三個方向發(fā)展。
(2)電郵用戶群體聚焦在黨政機關(guān)事業(yè)單位和國有企業(yè)。當前無紙化電子辦公盛行,而政務(wù)郵件系統(tǒng)又是我國國內(nèi)政務(wù)部門間傳遞信息的重要基礎(chǔ)設(shè)施,并已成為外來攻擊者的攻擊重點。另外,由于政務(wù)工作人員性質(zhì)特殊且責(zé)任重大,信息傳輸?shù)陌踩詥栴}顯然更為重要,應(yīng)切實增強對黨政機關(guān)事業(yè)單位和國有企業(yè)間網(wǎng)絡(luò)電子郵件系統(tǒng)的安全監(jiān)管與保護力度[9]。
(3)加快推進電郵大數(shù)據(jù)核心技術(shù)能和產(chǎn)業(yè)智能化升級。隨著網(wǎng)絡(luò)黑客和各種勢力對我國網(wǎng)絡(luò)攻擊和滲透力度逐漸加大,我國面臨著日益嚴峻的網(wǎng)絡(luò)空間安全問題。電郵大數(shù)據(jù)的關(guān)注點不應(yīng)該只局限于表層應(yīng)用的開發(fā),更多應(yīng)關(guān)注于核心技術(shù)開發(fā)。在保證信息安全的同時,我們應(yīng)立足“技術(shù)+應(yīng)用”發(fā)展道路,有效提高用戶體驗,推動人工智能與電郵行業(yè)融合創(chuàng)新,實現(xiàn)典型示范應(yīng)用和“殺手锏”產(chǎn)品,基本形成技術(shù)標準、服務(wù)體系和產(chǎn)業(yè)生態(tài)鏈,推動規(guī)模化應(yīng)用,提升產(chǎn)業(yè)智能化發(fā)展水平。
參考文獻
[1] 吳朝暉.人工智能的過去、現(xiàn)狀和未來[J].未來傳播,2019(3):4.
[2] 曹紅.計算機多媒體技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展趨勢[J].產(chǎn)業(yè)與科技論壇,2022(10):47-48.
[3] 于惠雯,趙藝潔.多媒體計算機技術(shù)開發(fā)研究[J].信息記錄材料,2021(2):118-119.
[4] 龔文全,孫明?。畠?nèi)容安全治理問題現(xiàn)狀及發(fā)展建議[J].中國信息安全,2020(2):65-67.
[5] 孫麗杰,李春華.大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)輿情管理方法研究[J].思想政治教育研究,2017(1):124-129.
[6] 朱浩齊.構(gòu)建全鏈路內(nèi)容風(fēng)控體系解決內(nèi)容安全難題[J].中國信息安全,2020(2):73-74.
[7] 龔文全,孫明俊.內(nèi)容安全治理問題現(xiàn)狀及發(fā)展建議[J].中國信息安全,2020(2):65-67.
[8] 劉聰,周子韜,張才俊,等.結(jié)合觸發(fā)事件及詞性分析的敏感信息識別方法[J].計算機工程與應(yīng)用,2020(20):132-137.
[9] 朱次平,周燕.政府公務(wù)郵箱系統(tǒng)建設(shè)實踐——以貴陽市公務(wù)郵箱系統(tǒng)建設(shè)為例[J].信息系統(tǒng)工程,2020(5):18-19.