陳美華,劉 暢,陳祥雨
(東南大學(xué)外國(guó)語(yǔ)學(xué)院,江蘇南京 211189)
虛擬助手(Virtual Assistant,VA)指能夠通過(guò)用戶(hù)的語(yǔ)音或文本指令提供服務(wù)、實(shí)現(xiàn)人機(jī)互動(dòng)的智能軟件[1],常見(jiàn)于各類(lèi)移動(dòng)設(shè)備,如Apple Siri、Google 助手等。VA 內(nèi)置語(yǔ)音控制為了準(zhǔn)確捕獲用戶(hù)需求并做出即時(shí)響應(yīng),需長(zhǎng)期保持監(jiān)聽(tīng)狀態(tài)[2-4],廣泛收集、存儲(chǔ)、分享并使用用戶(hù)的語(yǔ)音信息[5-6]。用戶(hù)語(yǔ)音攜帶具有生物原始特征的聲紋,一旦流失會(huì)損害其信息自決權(quán)、控制權(quán)等個(gè)人數(shù)據(jù)主權(quán),VA對(duì)用戶(hù)構(gòu)成的語(yǔ)言信息安全挑戰(zhàn)值得學(xué)界的關(guān)注。VA 起源于國(guó)外,且國(guó)外對(duì)其隱私問(wèn)題的研究較早,而國(guó)內(nèi)有關(guān)VA 安全與隱私的專(zhuān)門(mén)研究還十分鮮有。為更好了解與分析國(guó)際VA 語(yǔ)言隱私安全領(lǐng)域的研究現(xiàn)狀與發(fā)展態(tài)勢(shì),為國(guó)內(nèi)研究提供借鑒,本文對(duì)2014-2021 上半年間國(guó)外智能設(shè)備VA 與用戶(hù)語(yǔ)言生物信息安全問(wèn)題研究的年度分布、關(guān)鍵文獻(xiàn)、研究主題等進(jìn)行梳理,總結(jié)其發(fā)展歷程和已有成就,以期為拓寬國(guó)內(nèi)相關(guān)研究的廣度和深度尋求經(jīng)驗(yàn)路徑。
因綜述對(duì)象涉及范疇較廣泛,且以定性研究成果為主,故采用敘述性綜述方法[7],以便根據(jù)研究所需的價(jià)值標(biāo)準(zhǔn)條理分類(lèi)所收集的文獻(xiàn)資料,并作出靈活深入的分析。
為減少敘述性綜述取樣對(duì)象規(guī)范性差、研究結(jié)果不夠客觀(guān)等缺點(diǎn)[7],從期刊來(lái)源、文獻(xiàn)類(lèi)型、文獻(xiàn)內(nèi)容、文獻(xiàn)篇幅及發(fā)表時(shí)間5 個(gè)維度制定了納入標(biāo)準(zhǔn)(見(jiàn)表1),以盡量保證文獻(xiàn)搜索及篩選合理有效。
Table 1 Criteria for literature selection表1 文獻(xiàn)納入標(biāo)準(zhǔn)
在仔細(xì)閱讀和掌握國(guó)外VA 與隱私安全問(wèn)題研究綜述的前提下,確定檢索條件包括:TS=(privacy OR security)AND TS=(digital assistant OR virtual assistant OR virtual personal assistant OR siri OR google assistant OR alexa),語(yǔ)種限制為English,文獻(xiàn)類(lèi)型限制為Articles 和Proceedings Papers。依據(jù)選取標(biāo)準(zhǔn)對(duì)研究方法和主題進(jìn)行人工核查,去除明顯不符合本研究需要的記錄,同時(shí)手動(dòng)搜索已有文獻(xiàn)中的相關(guān)參考文獻(xiàn)以確保樣本完整性。通過(guò)檢索和篩選,最終獲得與VA 和用戶(hù)語(yǔ)言信息安全相關(guān)的國(guó)外文獻(xiàn)53篇,作為研究的主體樣本,并將每條文獻(xiàn)的題目(title)、作者(author)、摘要(abstract)關(guān)鍵詞(keywords)等信息錄入NoteExpress 軟件進(jìn)行后續(xù)分析。
在精讀和泛讀樣本的基礎(chǔ)上,對(duì)文獻(xiàn)數(shù)據(jù)進(jìn)行編碼分析。在一級(jí)編碼階段,根據(jù)發(fā)表時(shí)間、文獻(xiàn)名稱(chēng)、關(guān)注群體、研究主題、研究方法進(jìn)行獨(dú)立編碼,并重復(fù)校驗(yàn)直至達(dá)成內(nèi)部共識(shí)。二級(jí)編碼主要對(duì)一級(jí)編碼進(jìn)行檢驗(yàn)、特征分析與合并。整個(gè)編碼是一個(gè)回環(huán)的過(guò)程,對(duì)編碼內(nèi)容進(jìn)行了討論、反思和調(diào)整,以確保研究信度。
研究文獻(xiàn)的年度分布能夠直觀(guān)反映該領(lǐng)域研究熱度隨時(shí)間變化情況。國(guó)際VA 與用戶(hù)語(yǔ)言生物信息安全問(wèn)題研究興起于2014 年,至2017 年,經(jīng)篩選后的期刊或會(huì)議論文只有11 篇(見(jiàn)圖1),且以揭露問(wèn)題為主,表明此時(shí)國(guó)際上對(duì)VA 語(yǔ)言隱私的關(guān)注度并不高。自2011 年第一款VA產(chǎn)品Apple Siri 上市后,公眾需要時(shí)間來(lái)接受新生事物并逐漸認(rèn)識(shí)到其對(duì)自身語(yǔ)言信息安全的影響。2019 年,相關(guān)研究數(shù)量有明顯提升。當(dāng)年VA 泄露用戶(hù)隱私的事件一度被曝光,為回應(yīng)公眾關(guān)切,學(xué)界對(duì)產(chǎn)品的語(yǔ)言隱私問(wèn)題研究達(dá)到階段性高峰。2020-2021 年6 月,研究勢(shì)頭雖有回落但保持穩(wěn)定發(fā)展,學(xué)者關(guān)注重點(diǎn)也由分析問(wèn)題轉(zhuǎn)移至對(duì)策及優(yōu)化研究。近年來(lái),VA 與用戶(hù)語(yǔ)言生物信息安全問(wèn)題研究力求回應(yīng)現(xiàn)實(shí)問(wèn)題,并已在國(guó)外取得長(zhǎng)足發(fā)展。
Fig.1 Foreign research situation on VA and language bioinformation security from 2014 to June 2021圖1 2014-2021上半年年國(guó)外VA與用戶(hù)語(yǔ)言信息安全研究狀況
共引分析能夠清晰直觀(guān)地展示學(xué)科研究的親緣關(guān)系與演化規(guī)律[8]。分析國(guó)際VA 與用戶(hù)語(yǔ)言信息安全問(wèn)題研究的高共引文獻(xiàn)有利于了解該領(lǐng)域的發(fā)展基礎(chǔ)與變化軌跡。本研究提取的共引頻次前10的文獻(xiàn)如表2所示。
本節(jié)從關(guān)注受眾、研究主題、研究方法3 個(gè)維度對(duì)所選取的文獻(xiàn)進(jìn)行分析,以期全面展示近年來(lái)國(guó)外VA 與用戶(hù)語(yǔ)言生物信息安全問(wèn)題研究的發(fā)展?fàn)顩r。
2.3.1 關(guān)注受眾
按照研究所關(guān)注的利益群體,該領(lǐng)域研究的受眾主要為產(chǎn)品的終端用戶(hù)、開(kāi)發(fā)人員或二者兼有。用戶(hù)指VA 產(chǎn)品的使用者,他們通常缺乏相關(guān)的技術(shù)知識(shí),是開(kāi)發(fā)或供應(yīng)商的客戶(hù);軟件開(kāi)發(fā)人員為消費(fèi)市場(chǎng)提供產(chǎn)品或服務(wù)。如圖2 所示,在所得的53 篇論文中,面向用戶(hù)的論文數(shù)量多達(dá)29 篇,占比54.72%,而只針對(duì)軟件開(kāi)發(fā)群體的研究數(shù)量為9 篇。此外,發(fā)現(xiàn)部分研究(28.3%)同時(shí)針對(duì)終端用戶(hù)和開(kāi)發(fā)人員群體。
2.3.2 研究主題
VA 通過(guò)語(yǔ)音交互完成服務(wù),利用大數(shù)據(jù)和云計(jì)算系統(tǒng)等接收、解釋與執(zhí)行一系列預(yù)定的語(yǔ)音指令,其安全運(yùn)作涉及語(yǔ)音識(shí)別、云端服務(wù)器、綁定程序、數(shù)據(jù)傳送和客戶(hù)終端等諸多環(huán)節(jié)[9-10]。分析發(fā)現(xiàn)國(guó)外在VA 與用戶(hù)語(yǔ)言信息安全挑戰(zhàn)領(lǐng)域的研究主題主要分為4 類(lèi),即用戶(hù)隱私行為與意愿研究、針對(duì)語(yǔ)言信息安全問(wèn)題的解釋性研究、對(duì)策及優(yōu)化研究和綜述研究。在針對(duì)語(yǔ)言信息安全問(wèn)題的研究中,部分作者分析問(wèn)題并提供優(yōu)化建議,因此我們將其同時(shí)歸為針對(duì)語(yǔ)言信息安全問(wèn)題的解釋性研究與優(yōu)化研究。各主題的數(shù)量與比例如圖3所示。
Table 2 Highly co-cited literature(Top 10)of foreign research on intelligent device VA and personal language bioinformation security表2 國(guó)外智能設(shè)備VA與個(gè)人語(yǔ)言信息安全問(wèn)題研究的高共引文獻(xiàn)(Top10)
Fig.2 Subject audience of foreign research on VA and language bioinformation security from 2014 to June 2021圖2 2014-2021年國(guó)外VA與用戶(hù)語(yǔ)言信息安全問(wèn)題研究關(guān)注受眾
Fig.3 Research topics,contents and quantities statistics of foreign research on VA and language bioinformation security from 2014 to June 2021圖3 2014-2021上半年國(guó)外VA與用戶(hù)語(yǔ)言信息安全問(wèn)題研究主題內(nèi)容及數(shù)量統(tǒng)計(jì)
(1)用戶(hù)隱私行為與意愿研究。與VA 語(yǔ)言隱私問(wèn)題相關(guān)的用戶(hù)行為與意愿研究的發(fā)文量相對(duì)較少,共10 篇,占比18.9%。此類(lèi)研究主要關(guān)注用戶(hù)對(duì)VA 語(yǔ)言生物信息安全保護(hù)的看法及其隱私關(guān)切對(duì)產(chǎn)品接受度或使用行為的影響,深入探究影響用戶(hù)選擇的產(chǎn)品特性及其他因素。
首先,用戶(hù)十分關(guān)注VA 的語(yǔ)言與身份隱私保護(hù)性能,并將其視為決定接受該類(lèi)產(chǎn)品的關(guān)鍵因素[11-13]。Burbach等[12]發(fā)現(xiàn)自然語(yǔ)言處理性能、價(jià)格和隱私保護(hù)為影響用戶(hù)對(duì)VA 接受度主要產(chǎn)品特性,且更多受訪(fǎng)群體將對(duì)用戶(hù)的隱私安全保護(hù)性能列為首要考慮;Fruchter 和Liccardi[14]通過(guò)分析用戶(hù)評(píng)論得出VA 使用者的隱私與安全關(guān)切,結(jié)果顯示語(yǔ)音數(shù)據(jù)收集范圍、竊聽(tīng)等隱匿的設(shè)備行為為消費(fèi)者主要關(guān)注的問(wèn)題;Lau 等[15]則具體研究了不同群體對(duì)VA使用中可能存在的隱私風(fēng)險(xiǎn)的接受度,發(fā)現(xiàn)用戶(hù)與非用戶(hù)之間存在著不同程度的安全顧慮。非用戶(hù)對(duì)安全隱患更加謹(jǐn)慎,反感開(kāi)發(fā)商或其他軟件監(jiān)聽(tīng)私人談話(huà)的惡意行為,而VA 用戶(hù)的隱私關(guān)切則較為溫和,認(rèn)為開(kāi)發(fā)商在提取及保護(hù)用戶(hù)數(shù)據(jù)方面值得信任??紤]到不同主體對(duì)VA 的語(yǔ)言隱私安全特性存在不同認(rèn)知,為了解其形成原因,Chalhoub 等[13]深入探究了用戶(hù)的產(chǎn)品體驗(yàn)對(duì)其隱私關(guān)切的影響,結(jié)果顯示不良用戶(hù)體驗(yàn),如發(fā)現(xiàn)私密語(yǔ)音被監(jiān)聽(tīng)、廣告彈窗等會(huì)喚起用戶(hù)的隱私與安全需求,促使用戶(hù)對(duì)產(chǎn)品性能中無(wú)益于自身隱私安全的部分采取補(bǔ)償行為,如刪除語(yǔ)音記錄、停止某項(xiàng)服務(wù)或功能、中斷物聯(lián)網(wǎng)連接、限制設(shè)備的數(shù)據(jù)分享等。
除關(guān)注用戶(hù)對(duì)VA 安全特性的宏觀(guān)感知外,少量研究也聚焦用戶(hù)對(duì)產(chǎn)品特定功能的具體看法及使用行為。Moorthy 等[16]采用大規(guī)模在線(xiàn)調(diào)查對(duì)用戶(hù)在公共空間使用VA 披露語(yǔ)言信息的意愿展開(kāi)了研究,結(jié)果表明受訪(fǎng)對(duì)象對(duì)傳輸私人信息的態(tài)度更為保守,尤其當(dāng)信息傳遞以明顯的輸入方式(如語(yǔ)音指令)進(jìn)行時(shí);Tabassum 等[17]的調(diào)查則關(guān)注用戶(hù)對(duì)新一代無(wú)須喚醒型VA 的期望及對(duì)共享數(shù)據(jù)的看法,結(jié)果同樣表明,當(dāng)談話(huà)內(nèi)容敏感度較低時(shí)用戶(hù)更有可能同意分享自己的對(duì)話(huà);Ha 等[18]以通信隱私管理理論為框架,通過(guò)實(shí)驗(yàn)得出VA 所需用戶(hù)信息的敏感程度及產(chǎn)品類(lèi)型(擬人型與客觀(guān)型)會(huì)顯著影響用戶(hù)的語(yǔ)言隱私顧慮,當(dāng)服務(wù)涉及高度敏感的個(gè)人信息時(shí),與用戶(hù)構(gòu)成合作關(guān)系的VA 會(huì)引起用戶(hù)更大的隱私關(guān)切,降低其披露語(yǔ)言信息的意愿,而在處理低敏感信息時(shí),用戶(hù)則認(rèn)為充當(dāng)合作型服務(wù)角色的VA 更具安全性。此外,Javed 等[19]的研究關(guān)注用戶(hù)對(duì)Alexa 錄音及存儲(chǔ)功能的體驗(yàn)及理解程度,結(jié)果顯示,91%的受訪(fǎng)者有過(guò)在不知情的情況下被VA 錄音的經(jīng)歷,其中有53.09%的用戶(hù)稱(chēng)被錄音的片段中不包含喚醒指令。此外,雖然大多數(shù)用戶(hù)(64.6%)能夠意識(shí)到自己的語(yǔ)音將被存儲(chǔ),但并不了解可能接觸自己錄音數(shù)據(jù)的實(shí)體,更無(wú)法做到及時(shí)刪除,而重視自身隱私保護(hù)的受訪(fǎng)者對(duì)Alexa 的錄音存儲(chǔ)行為有著更清晰的認(rèn)識(shí)。除常見(jiàn)的Alexa、Siri 等VA 產(chǎn)品外,McReynolds 等[20]還調(diào)查了用戶(hù)對(duì)智能互聯(lián)玩具Hello Barbie 和CogniToys Dino 隱私保護(hù)的看法,結(jié)果表明家長(zhǎng)對(duì)玩具索取錄音權(quán)限持混合態(tài)度,但普遍重視其安全性能,而兒童的隱私意識(shí)則十分有限,并且會(huì)以與玩具互動(dòng)的方式使用Siri、Alexa 等產(chǎn)品,這種使用方法也導(dǎo)致大量的兒童語(yǔ)音數(shù)據(jù)暴露給VA。
綜上所述,國(guó)外VA 語(yǔ)言隱私安全問(wèn)題研究已從不同角度揭示了用戶(hù)群體對(duì)涉及其語(yǔ)言信息安全的VA 產(chǎn)品特性的看法、使用意愿與具體行為。值得注意的是,雖然研究普遍表明公眾對(duì)VA 保護(hù)自身語(yǔ)音安全方面存在顧慮,但較少有研究能夠針對(duì)顧慮提出解決措施,并且隱私問(wèn)題不足以勸阻用戶(hù)在現(xiàn)實(shí)生活中繼續(xù)購(gòu)買(mǎi)或使用[21],這也促使研究者更加關(guān)注VA 在日常運(yùn)行中對(duì)用戶(hù)語(yǔ)言信息安全造成的實(shí)際損害及相應(yīng)的保護(hù)策略。
(2)針對(duì)語(yǔ)言信息安全問(wèn)題的解釋性及優(yōu)化研究。在近7年的論文中,對(duì)VA 產(chǎn)品設(shè)計(jì)與運(yùn)行中存在的語(yǔ)言信息安全問(wèn)題進(jìn)行介紹、驗(yàn)證與解釋的文章共有24 篇,且集中發(fā)表于2017-2020 年。根據(jù)數(shù)據(jù)生命周期以及研究所揭露的安全問(wèn)題類(lèi)型,與VA 語(yǔ)言信息安全問(wèn)題相關(guān)的解釋性研究又可以分為語(yǔ)音監(jiān)聽(tīng)、語(yǔ)言生物識(shí)別及身份認(rèn)證隱患、外部攻擊、數(shù)據(jù)最大化使用與保密存儲(chǔ)4個(gè)分支。
語(yǔ)音監(jiān)聽(tīng)是此類(lèi)主題中學(xué)者較為關(guān)注的安全問(wèn)題。經(jīng)研究證實(shí),VA 的語(yǔ)音識(shí)別與處理系統(tǒng)在等待喚醒詞的同時(shí),需要長(zhǎng)期待機(jī)并對(duì)用戶(hù)語(yǔ)音及周?chē)胍暨M(jìn)行監(jiān)聽(tīng)與存儲(chǔ)[3,6]。Ford 等[22]的實(shí)驗(yàn)發(fā)現(xiàn),電視音頻或用戶(hù)日常交談均可以在無(wú)喚醒詞的情景下觸發(fā)Amazon 語(yǔ)音助手的錄音功能,被記錄的私人對(duì)話(huà)還會(huì)被傳輸至服務(wù)器做進(jìn)一步的分析;Chung 等[2]則通過(guò)分析VA 的工作原理,指出4 種可能對(duì)系統(tǒng)安全與用戶(hù)隱私構(gòu)成風(fēng)險(xiǎn)的攻擊類(lèi)型,包括設(shè)備在用戶(hù)未知的情況下擅自錄音并將數(shù)據(jù)返還給供應(yīng)商的風(fēng)險(xiǎn)。VA 監(jiān)聽(tīng)并記錄用戶(hù)對(duì)話(huà),導(dǎo)致用戶(hù)對(duì)自身語(yǔ)言信息安全的可控程度大為降低。
VA 采用關(guān)鍵詞喚醒模式同時(shí)引發(fā)了其準(zhǔn)入門(mén)檻低、身份認(rèn)證困難等安全隱患[2,10]。研究發(fā)現(xiàn),在單因素身份驗(yàn)證模式下,播放的語(yǔ)音指令音頻也可能觸發(fā)VA 進(jìn)行回應(yīng)[10,23]。此外,現(xiàn)有的語(yǔ)音變形或合成技術(shù)可以基于有限的聲音樣本量提取合法用戶(hù)的生物特征以欺騙識(shí)別驗(yàn)證系統(tǒng),造成關(guān)鍵個(gè)人信息流失[24]。因此,盡管VA 的語(yǔ)音識(shí)別與處理技術(shù)采用數(shù)據(jù)驅(qū)動(dòng)下的機(jī)器學(xué)習(xí)模式,能夠根據(jù)訪(fǎng)問(wèn)者聲音特性預(yù)測(cè)身份,但依舊很難給予充分的安全準(zhǔn)入保障。
在此類(lèi)主題下,更多研究者探析了VA 在傳輸語(yǔ)音數(shù)據(jù)的過(guò)程中可能遭受的各類(lèi)攻擊,通過(guò)錄音、模仿、合成甚至篡改等多種方式遠(yuǎn)程操控并發(fā)布指令[25-26]。實(shí)證研究結(jié)果表明,不法訪(fǎng)客能夠利用人類(lèi)與機(jī)器語(yǔ)音識(shí)別之間的差距,通過(guò)調(diào)整原始語(yǔ)音信號(hào)的梅爾倒譜系數(shù)特征形成對(duì)抗性輸入以誤導(dǎo)機(jī)器學(xué)習(xí)模型。此類(lèi)擾動(dòng)方案對(duì)聲音質(zhì)量的影響幾乎可以忽略,但會(huì)破壞VA 深度神經(jīng)網(wǎng)絡(luò)的工作效率,極大削弱語(yǔ)音識(shí)別速度及準(zhǔn)確率[27-28]。同樣,實(shí)驗(yàn)驗(yàn)證音素變形能將來(lái)自不同訪(fǎng)客的源語(yǔ)音轉(zhuǎn)換為可以通過(guò)語(yǔ)音生物驗(yàn)證的來(lái)自正當(dāng)使用者的音頻[29]。發(fā)動(dòng)海豚攻擊的可行性得到驗(yàn)證,通過(guò)發(fā)送超出人類(lèi)聽(tīng)覺(jué)上限的超聲波頻率隱藏惡意語(yǔ)言指令以實(shí)現(xiàn)對(duì)設(shè)備的操控[30-33]。此外,研究者們還對(duì)惡意訪(fǎng)問(wèn)者通過(guò)調(diào)頻式天線(xiàn)[34]、激光照射等欺騙VA 語(yǔ)音識(shí)別及身份認(rèn)證系統(tǒng)的方式進(jìn)行了探究[35],深入剖析攻擊者如何操縱設(shè)備以獲得訪(fǎng)問(wèn)權(quán)限,實(shí)施惡意或侵權(quán)行為。
關(guān)于外部攻擊,鑒于VA 不斷擴(kuò)展的附加功能以及與物聯(lián)網(wǎng)設(shè)備日益緊密的聯(lián)系,擴(kuò)展VA 原始功能可能造成的數(shù)據(jù)傳輸漏洞及因第三方授權(quán)而造成的用戶(hù)敏感或保密信息的泄露引起研究者關(guān)注[21,36-37]。根據(jù)自然語(yǔ)言處理中的深度學(xué)習(xí)模型,發(fā)現(xiàn)了針對(duì)VA 功能啟用模式的兩種對(duì)抗性攻擊,即語(yǔ)音搶注(Voice Squatting)與語(yǔ)音偽裝(Voice Masquerading)[38]。Kumar 等[39-40]對(duì)Alexa 語(yǔ)音識(shí)別中可能存在的易混淆指令誤讀及語(yǔ)音搶注攻擊進(jìn)行了實(shí)證分析,深入討論了其對(duì)用戶(hù)隱私安全的影響。Mitev等[41]的實(shí)驗(yàn)則展示了惡意中間人通過(guò)擴(kuò)展程序在VA 與其良性附加功能之間發(fā)動(dòng)攻擊的可行性,詳細(xì)分析了攻擊者如何通過(guò)用戶(hù)家中的物聯(lián)網(wǎng)設(shè)備遠(yuǎn)程發(fā)射超聲波信號(hào)與VA 進(jìn)行交互,并將用戶(hù)的語(yǔ)音重新定向至惡意應(yīng)用程序,最終達(dá)到突破Alexa 的智能識(shí)別防線(xiàn)、監(jiān)聽(tīng)Alexa 與受害者之間對(duì)話(huà)的目的。此外,也有少部分研究者關(guān)注了VA 與其支持設(shè)備之間的秘密架線(xiàn)及電路竊聽(tīng)現(xiàn)象。盡管目前VA 與綁定設(shè)備之間的通信大多使用加密,但外部攻擊者仍可通過(guò)監(jiān)控網(wǎng)絡(luò)流量獲取數(shù)據(jù)傳送速率并識(shí)別設(shè)備所處的工作狀態(tài)[42],通過(guò)網(wǎng)絡(luò)流量推斷語(yǔ)音指令的正確率高于通過(guò)機(jī)器學(xué)習(xí)模型介入[43]。
商家對(duì)收集的用戶(hù)語(yǔ)音數(shù)據(jù)的分享與使用方式也影響著用戶(hù)隱私安全。用戶(hù)在商家如何使用語(yǔ)音數(shù)據(jù)方面尚未充分行使自決權(quán),無(wú)法監(jiān)督與控制自身的數(shù)據(jù)安全[44]?,F(xiàn)有的VA 產(chǎn)品架構(gòu)一般將數(shù)據(jù)集中存儲(chǔ)于云上,一旦空間遭到入侵,大量敏感信息將面臨泄露[10]。
(3)對(duì)策與優(yōu)化研究。針對(duì)VA 產(chǎn)品設(shè)計(jì)與運(yùn)行中暴露的語(yǔ)言信息安全問(wèn)題,研究者們也提出了相應(yīng)的改進(jìn)方案與使用建議。經(jīng)本次檢索及篩選得出的對(duì)策及優(yōu)化研究共有18 篇,占比33.9%,其中有半數(shù)以上為2020-2021 年發(fā)表,可見(jiàn)對(duì)策及優(yōu)化研究已成為VA 語(yǔ)言信息安全問(wèn)題研究中的新熱點(diǎn)。
考慮到用戶(hù)發(fā)布的語(yǔ)音指令中含有豐富的語(yǔ)言生物特征,學(xué)者就如何在確保VA 語(yǔ)音搜索任務(wù)執(zhí)行效率的同時(shí)強(qiáng)化用戶(hù)語(yǔ)言隱私保護(hù)展開(kāi)了探討。Li 等[45]提出語(yǔ)音加密搜索方案,采用粒計(jì)算技術(shù)對(duì)用戶(hù)指令進(jìn)行加密;根據(jù)Vaidya 等研究[46],鑒于語(yǔ)音識(shí)別與存儲(chǔ)的可分離性,產(chǎn)品在將數(shù)據(jù)傳輸至云端之前可采用音頻處理技術(shù)去除其可識(shí)別特征,只留下執(zhí)行服務(wù)所需信息。實(shí)驗(yàn)表明,此類(lèi)措施可以有效防御語(yǔ)音合成攻擊。此外,針對(duì)VA 竊聽(tīng)用戶(hù)談話(huà)、擅自記錄并交易語(yǔ)音數(shù)據(jù)的現(xiàn)象,Cheng 等[47]建議使用聲學(xué)標(biāo)記,即VA 在接收用戶(hù)聲音的同時(shí)接收輔助設(shè)備發(fā)出的獨(dú)特聲學(xué)信號(hào),并將此標(biāo)簽嵌入他們錄制的音頻流中。該標(biāo)簽不僅會(huì)向VA 合作軟件或后端系統(tǒng)發(fā)出信號(hào),表明用戶(hù)尚未同意錄制,還可用于追蹤記錄的拍攝時(shí)間和地點(diǎn),有利于增強(qiáng)產(chǎn)品監(jiān)聽(tīng)并錄制用戶(hù)語(yǔ)音的可控性;Sun 等[5]則提出并驗(yàn)證了一款能夠執(zhí)行隱私保護(hù)的VA配套設(shè)備MicShield,能夠在傳遞合法語(yǔ)音指令的同時(shí)混淆用戶(hù)的私人談話(huà),在不影響VA 響應(yīng)能力的前提下有效保護(hù)用戶(hù)的私密談話(huà)。Mhaidli 等[48]的研究則將人際交流的凝視方向及音量變化作為增強(qiáng)設(shè)備語(yǔ)言隱私性能的手段,即只有當(dāng)用戶(hù)對(duì)設(shè)備發(fā)話(huà)時(shí),其麥克風(fēng)或語(yǔ)音識(shí)別系統(tǒng)才會(huì)被激活。Kepuska 等[49]同樣提出一套包括用戶(hù)語(yǔ)音、手勢(shì)、觸摸、注視以及頭部或身體運(yùn)動(dòng)的多模態(tài)識(shí)別系統(tǒng),協(xié)同作用以減少VA 監(jiān)聽(tīng)用戶(hù)的日常談話(huà)。
研究者根據(jù)用戶(hù)與VA 的交互模式提出了對(duì)用戶(hù)身份認(rèn)證方式的改良建議。在分析VA 的語(yǔ)音識(shí)別漏洞后提出了連續(xù)身份驗(yàn)證系統(tǒng),以確保僅對(duì)合法用戶(hù)發(fā)出的指令進(jìn)行回應(yīng)[24,50]。經(jīng)實(shí)驗(yàn)驗(yàn)證,該解決方案能將設(shè)備接收到的語(yǔ)音與收集的合法用戶(hù)的體表振動(dòng)相關(guān)聯(lián),大大提高檢測(cè)準(zhǔn)確度,但系統(tǒng)功能依靠可穿戴安全令牌完成。Pradhan 等[51]和Lei 等[52]的解決方案則免于穿戴,其提出的語(yǔ)音檢測(cè)系統(tǒng)能夠根據(jù)實(shí)時(shí)發(fā)音與重放語(yǔ)音時(shí)人類(lèi)呼吸模式之間的固有差異實(shí)現(xiàn)基于物理存在的訪(fǎng)問(wèn)控制,并利用WiFi 檢測(cè)出不同類(lèi)型的外部攻擊,在此條件下,只有當(dāng)附近有人時(shí)設(shè)備才會(huì)啟用并接受語(yǔ)音指令。Cheng 等[53]則建議使用保護(hù)性干擾裝置,一旦識(shí)別到語(yǔ)音喚醒詞后便會(huì)發(fā)出干擾信號(hào),以防止VA 被喚醒并對(duì)語(yǔ)音信號(hào)作出進(jìn)一步的分析。為應(yīng)對(duì)海豚攻擊的隱藏指令,Zhang 等[30]推薦了兩種緩解措施,分別為改進(jìn)揚(yáng)聲器以抑制超聲波對(duì)源語(yǔ)音的影響,以及在語(yǔ)音捕獲子系統(tǒng)中的低通濾波器之前引入一個(gè)模塊,專(zhuān)門(mén)用以識(shí)別和消除隱藏語(yǔ)音指令的基帶信號(hào)。Wang 等[54]則考慮到雖然隱藏指令的音頻特征可能會(huì)欺騙身份驗(yàn)證系統(tǒng),但運(yùn)動(dòng)傳感器捕獲的由音頻引起的表面振動(dòng)卻很難偽造,因此提出采用低成本運(yùn)動(dòng)傳感器,同時(shí)要求語(yǔ)音指令與聲學(xué)特征和振動(dòng)域,為攻擊者帶來(lái)了更艱巨的挑戰(zhàn)。以上身份驗(yàn)證方法都可以在一定程度上減少惡意攻擊的發(fā)生,加大其他用戶(hù)在未經(jīng)許可的情況下訪(fǎng)問(wèn)VA 的難度,為用戶(hù)的隱私安全提供雙重保險(xiǎn)。鑒于有些認(rèn)證方法需要額外設(shè)備的支持,其實(shí)際的用戶(hù)接受度也值得考證[44]。
對(duì)策與優(yōu)化研究關(guān)注VA 第三方服務(wù)提供商的云端安全架構(gòu),根據(jù)對(duì)抗性攻擊利用系統(tǒng)漏洞的方式提出對(duì)應(yīng)的改進(jìn)措施。Kumar 等[40]建議對(duì)每個(gè)新技能的啟用指令進(jìn)行語(yǔ)音和文本分析,檢查是否與現(xiàn)有技能重疊,以減輕設(shè)備受語(yǔ)音搶注攻擊的風(fēng)險(xiǎn)。Zhang 等[38]也針對(duì)惡意技能的檢測(cè)提出了解決方案,新系統(tǒng)會(huì)將用戶(hù)指令與當(dāng)前正在交互的設(shè)備技能進(jìn)行匹配,通過(guò)考慮用戶(hù)話(huà)語(yǔ)與他們當(dāng)前使用技能之間的聯(lián)系確定切換意圖,減少惡意程序的回應(yīng)頻率。
云存儲(chǔ)的保密性能關(guān)乎著用戶(hù)的數(shù)據(jù)安全,研究者也針對(duì)VA 的存儲(chǔ)服務(wù)提出了改進(jìn)建議。根據(jù)Ford 等[22]研究,僅靠用戶(hù)定期查看記錄以減少惡意攻擊只能提供事后分析,存在一定的被動(dòng)與滯后性,并因此對(duì)提供商確保云端的安全組織架構(gòu)提出了要求。Vecchiato 等[55]針對(duì)數(shù)據(jù)收集與提取過(guò)程中的隱私與安全,提出由個(gè)人、環(huán)境和云三層組成,能夠?qū)膫鞲衅骱鸵苿?dòng)設(shè)備收集的數(shù)據(jù)進(jìn)行情景感知操作的基礎(chǔ)通信架構(gòu)。
總結(jié)可知,國(guó)外有關(guān)VA 語(yǔ)言信息安全威脅的應(yīng)對(duì)研究呈現(xiàn)出明顯的技術(shù)先導(dǎo)原則,即信息安全建立在技術(shù)發(fā)展的前提之上,但安全保護(hù)研究相對(duì)滯后,較少?gòu)挠脩?hù)、開(kāi)發(fā)者、第三方等多維主體角度,綜合考慮個(gè)體、團(tuán)隊(duì)、組織和社會(huì)對(duì)信息安全進(jìn)行立體、多層次地研究,缺乏根據(jù)語(yǔ)言信息安全敏感與風(fēng)險(xiǎn)程度的系統(tǒng)性分析,并將安全防控前瞻性地落實(shí)在產(chǎn)品開(kāi)發(fā)階段。
(4)綜述研究。自2014 年針對(duì)VA 與個(gè)人語(yǔ)言信息安全問(wèn)題的文章發(fā)表以來(lái),國(guó)外對(duì)該領(lǐng)域研究成果進(jìn)行系統(tǒng)回顧與反思的綜述論文也較為缺乏,共有7 篇,具有代表性的文獻(xiàn)來(lái)自Bolton、Edu 和Pal等[21,44,56]。前兩篇均為梳理已被證實(shí)的VA 對(duì)用戶(hù)隱私與安全造成的負(fù)面影響以及相應(yīng)的改進(jìn)措施,而非對(duì)研究主題或已有成果作出全面分析,后者以增強(qiáng)用戶(hù)對(duì)VA 的使用信任為研究視角,梳理了與用戶(hù)隱私與安全保護(hù)有關(guān)的利益主體及其詳細(xì)職責(zé),分類(lèi)討論了不同類(lèi)型的VA 隱私問(wèn)題,并據(jù)此提出了隱私保護(hù)信任模型以減輕VA 用戶(hù)在使用過(guò)程中的安全隱患。
2.3.3 研究方法
科學(xué)的研究方法是獲取可靠結(jié)果的前提與基礎(chǔ),決定著研究的有效性。梳理與分析研究方法既可以從宏觀(guān)上把握國(guó)外VA 與用戶(hù)語(yǔ)言生物信息安全問(wèn)題研究的理論視角與發(fā)展態(tài)勢(shì),也能為后續(xù)研究提供方法借鑒。本文采用信息系統(tǒng)領(lǐng)域內(nèi)學(xué)者廣泛采用的Alavi 和Carlson 的分類(lèi)方法[57],將研究劃分為實(shí)證研究和非實(shí)證研究。如圖4 所示,2014-2021上半年國(guó)外VA 與用戶(hù)語(yǔ)言隱私安全研究大多采用了實(shí)證研究方法(43 篇,81.13%),標(biāo)志該領(lǐng)域逐漸能夠以學(xué)科視角客觀(guān)解釋并驗(yàn)證假設(shè)的合理性,走向發(fā)展成熟階段。
Fig.4 Research methods of foreign research on VA and language bioinformation security from 2014 to June 2021圖4 2014-2021上半年國(guó)外VA與用戶(hù)語(yǔ)言信息安全問(wèn)題研究方法統(tǒng)計(jì)
從上述文獻(xiàn)梳理結(jié)果可知,用戶(hù)語(yǔ)言隱私與安全保護(hù)已成為國(guó)際VA 研究中的新興議題,處于持續(xù)發(fā)展階段,表現(xiàn)在文章發(fā)表總數(shù)不多但增幅較大,研究主題不斷拓寬,理論與實(shí)證研究的創(chuàng)新成果不斷涌現(xiàn)。相比之下,我國(guó)的VA 語(yǔ)言安全研究尚處于起步階段,學(xué)者大多探討VA 的適用場(chǎng)景、應(yīng)用效果及優(yōu)化功能的設(shè)計(jì)與實(shí)現(xiàn),但對(duì)與之相關(guān)的信息安全問(wèn)題,尤其是語(yǔ)言生物信息安全問(wèn)題研究仍停留在介紹階段。未來(lái)實(shí)證研究可從以下3 方面著手,深入探究VA 對(duì)用戶(hù)語(yǔ)言隱私安全的影響及優(yōu)化策略。
3.1.1 開(kāi)闊研究視角
盡管本領(lǐng)域研究的關(guān)注對(duì)象主要為用戶(hù)群體,但國(guó)外相關(guān)研究選擇的用戶(hù)范圍相對(duì)寬泛?,F(xiàn)有的國(guó)內(nèi)外研究缺少以特定客戶(hù),如兒童及家長(zhǎng)、商務(wù)人士、圖書(shū)館讀者、教育人士等為受試對(duì)象的研究,無(wú)法了解其在產(chǎn)品使用過(guò)程中遇到的具體語(yǔ)言信息安全問(wèn)題。未來(lái)研究可拓寬研究對(duì)象的選取范圍,豐富受試對(duì)象的多樣性和區(qū)分度。用戶(hù)語(yǔ)言隱私安全研究也應(yīng)更多回應(yīng)用戶(hù)的隱私顧慮,探究數(shù)據(jù)生命周期中各環(huán)節(jié)涉及的用戶(hù)個(gè)體、企業(yè)組織和社會(huì)等多層次利益主體及其詳細(xì)職責(zé)[56],建立用戶(hù)語(yǔ)言隱私關(guān)注與安全使用行為評(píng)估指標(biāo)體系與符合用戶(hù)隱私關(guān)注與感知風(fēng)險(xiǎn)、感知利益作用機(jī)制的語(yǔ)言信息保護(hù)模式,提升研究成果的科學(xué)性、系統(tǒng)性和實(shí)用性。
3.1.2 深化研究?jī)?nèi)容
現(xiàn)階段國(guó)內(nèi)研究對(duì)VA 隱私安全性能問(wèn)題大多處于介紹階段,只知其然而不知所以然,很少考慮到設(shè)備復(fù)雜的全貌架構(gòu),尤其對(duì)語(yǔ)言生物信息識(shí)別、用戶(hù)身份授權(quán)、語(yǔ)音數(shù)據(jù)安全技術(shù)研發(fā)與標(biāo)準(zhǔn)制定等方面已暴露問(wèn)題的實(shí)驗(yàn)驗(yàn)證及運(yùn)行機(jī)制研究不足,無(wú)法追溯不同安全問(wèn)題在來(lái)源上的相似性,進(jìn)而針對(duì)包括數(shù)據(jù)產(chǎn)生、傳輸、使用、分享及消除在內(nèi)的生命周期各個(gè)階段提出差異化的應(yīng)對(duì)措施,保護(hù)策略的理論研究也尚未得出體系化的建議。因此,研究者需要充分考慮不同環(huán)境下VA 與用戶(hù)語(yǔ)言安全問(wèn)題的多樣性,從優(yōu)化實(shí)踐出發(fā)深入分析產(chǎn)品開(kāi)發(fā)、運(yùn)行環(huán)境、使用風(fēng)格、第三方介入等因素對(duì)用戶(hù)語(yǔ)言隱私安全造成的潛在威脅,亦或從風(fēng)險(xiǎn)治理為視角,研究如何合理利用大數(shù)據(jù)技術(shù)更加精細(xì)、實(shí)時(shí)地監(jiān)測(cè)信息安全風(fēng)險(xiǎn),制定語(yǔ)言信息安全風(fēng)險(xiǎn)評(píng)估機(jī)制,并在此基礎(chǔ)上探索有效的信息安全風(fēng)險(xiǎn)規(guī)避措施。
云空間通常支持多種遠(yuǎn)程的數(shù)據(jù)訪(fǎng)問(wèn)模式,更加劇了其遭受外部攻擊的風(fēng)險(xiǎn)。目前,少有研究者關(guān)注商家掌握大量語(yǔ)言生物數(shù)據(jù)后其保密存儲(chǔ)性能能否保證用戶(hù)的數(shù)據(jù)安全,但其能為用戶(hù)語(yǔ)音數(shù)據(jù)的合理使用及語(yǔ)言信息的充分消除提供學(xué)界支持,具有較大的現(xiàn)實(shí)意義與研究潛力。
此外,國(guó)外有關(guān)VA 語(yǔ)言信息安全威脅的應(yīng)對(duì)研究呈現(xiàn)出明顯的技術(shù)先導(dǎo)原則,即信息安全建立在技術(shù)發(fā)展的前提之上,但較少?gòu)挠脩?hù)、開(kāi)發(fā)者、第三方等多維主體角度,對(duì)信息安全保護(hù)管理進(jìn)行立體、多層次地研究。國(guó)內(nèi)學(xué)者可據(jù)此對(duì)語(yǔ)言信息安全的敏感與風(fēng)險(xiǎn)程度進(jìn)行系統(tǒng)分析,并將安全防控前瞻性地落實(shí)在產(chǎn)品開(kāi)發(fā)階段。
3.1.3 調(diào)查隱私政策
隱私法規(guī)要求開(kāi)發(fā)者必須提供隱私政策,并通知用戶(hù)運(yùn)營(yíng)商在收集哪些信息、如何使用這些信息、正在共享什么信息[57]。第三方開(kāi)發(fā)者提供的多樣化隱私政策有可能對(duì)用戶(hù)使用隱私敏感服務(wù)造成潛在風(fēng)險(xiǎn)。為此,國(guó)內(nèi)研究者可關(guān)注隱私政策與許可信息一致性、語(yǔ)音應(yīng)用程序的更新是否及時(shí)反映在隱私政策、用戶(hù)如何參與隱私政策以及他們對(duì)VA 隱私政策的看法等。相關(guān)研究結(jié)果有助于開(kāi)發(fā)者的隱私?jīng)Q策、提高隱私政策質(zhì)量,并為VA 用戶(hù)提供有效的隱私通知,減少其隱私暴露風(fēng)險(xiǎn)。
近年來(lái),國(guó)外VA 與用戶(hù)語(yǔ)言隱私安全的實(shí)證研究多采用解釋主義的質(zhì)性研究范式,研究者通過(guò)調(diào)查、訪(fǎng)談、實(shí)驗(yàn)等方法探究VA 可能存在的隱私安全性能問(wèn)題及相關(guān)用戶(hù)行為。相比之下,國(guó)內(nèi)在該領(lǐng)域的實(shí)證研究十分缺乏,可以通過(guò)引進(jìn)國(guó)外較成熟的測(cè)量工具或機(jī)理框架,在尊重中國(guó)法律、政策等特定情境因素的前提下力圖得出更多具有概括性的研究結(jié)果,也可以考慮在自然情境下運(yùn)用仿真實(shí)驗(yàn),有效提升研究的信度和效度。
VA 通過(guò)系統(tǒng)編譯大量敏感數(shù)據(jù)集與個(gè)人身份信息,可能暴露用戶(hù)記錄在語(yǔ)音通信中的生物信息。為應(yīng)對(duì)此類(lèi)挑戰(zhàn),設(shè)計(jì)者和策劃者應(yīng)在設(shè)計(jì)初期考慮到VA 使用過(guò)程中的隱私風(fēng)險(xiǎn)、安全問(wèn)題及倫理道德。同時(shí),無(wú)線(xiàn)連接在增強(qiáng)用戶(hù)體驗(yàn)的同時(shí),也加劇了與網(wǎng)絡(luò)可靠性相關(guān)的風(fēng)險(xiǎn)。研究者可考慮設(shè)計(jì)和優(yōu)化能應(yīng)用于本地運(yùn)行的算法,實(shí)現(xiàn)本地?cái)?shù)據(jù)的靈活處理[58]。
為保護(hù)用戶(hù)隱私,針對(duì)VA 的國(guó)內(nèi)研究也可考慮借鑒國(guó)外相關(guān)技術(shù),如基于sm-ALTP(sign modified acoustic local ternary pattern)的SASV(Secure Automatic Speaker Verification)技術(shù)、Vocal Tract Length Normalization(VTLN)技術(shù),以期混淆用戶(hù)語(yǔ)音并刪除敏感的語(yǔ)音特征、構(gòu)建語(yǔ)音隱私保護(hù)框架、實(shí)現(xiàn)離線(xiàn)處理語(yǔ)音命令,挖掘其應(yīng)用發(fā)展前景。
對(duì)智能設(shè)備VA 與個(gè)人生物語(yǔ)言信息安全問(wèn)題的國(guó)際文獻(xiàn)進(jìn)行綜述發(fā)現(xiàn),近年來(lái)該領(lǐng)域的關(guān)注對(duì)象主要為廣泛的用戶(hù)群體,研究主題涉及用戶(hù)行為與意愿、對(duì)語(yǔ)言信息安全問(wèn)題的解釋、對(duì)策優(yōu)化及綜述研究,較為全面地探究了語(yǔ)音數(shù)據(jù)全生命周期中可能存在的隱私安全問(wèn)題,預(yù)測(cè)了國(guó)內(nèi)該領(lǐng)域未來(lái)的關(guān)鍵趨勢(shì)、核心挑戰(zhàn)和研究路徑。國(guó)外研究樣本缺乏多樣性,對(duì)策與綜述研究在以技術(shù)視角之余,較少有基于多維責(zé)任主體的系統(tǒng)觀(guān)照。鑒于國(guó)內(nèi)VA與用戶(hù)語(yǔ)言隱私的研究尚處于起步階段,期望本研究能為學(xué)者提供較為綜合的信息參考,秉承問(wèn)題意識(shí)開(kāi)闊研究視角,從優(yōu)化用戶(hù)語(yǔ)言信息的安全保護(hù)出發(fā)深化研究?jī)?nèi)容,促進(jìn)國(guó)內(nèi)成果的進(jìn)一步涌現(xiàn)。