沈知涵
你和朋友坐在一起聊天,隨手把手機(jī)扔在桌上。你問他,家里暖氣不熱怎么辦?夜晚,你便在小紅書的信息流里刷到“教你給暖氣放氣”。你一驚,心想“難道又被手機(jī)竊聽了”?因?yàn)槟銖奈粗鲃铀阉鬟^類似話題。
“App監(jiān)聽談話”,被反復(fù)提及,原因是用戶總能發(fā)現(xiàn)“巧合”,卻難以將其證實(shí)。相關(guān)商業(yè)公司也只是否認(rèn),拿不出反駁證據(jù)。如果App真的通過麥克風(fēng)一直監(jiān)聽我們,到底可不可行?
人們的確抓到過智能音箱和語音助手的把柄,亞馬遜Alexa曾因?yàn)殄e誤理解指令,把“偷聽”來的談話錄音發(fā)給用戶通訊錄里的好友,證明麥克風(fēng)偷聽并非臆想。
2020年,一位產(chǎn)品經(jīng)理在hackernoon(一個技術(shù)分享社區(qū))寫過一篇文章專門解釋這個困惑。他拿Siri舉例,說Siri確實(shí)在“聽”,但它“聽不懂”,直到被“Hey Siri”觸發(fā)后,它才開始理解你的指令。
因?yàn)镾iri只是聽懂你在喊它,就已經(jīng)耗費(fèi)很多“力氣”。落到麥克風(fēng)上的聲音會以0.01秒為一幀,每次20幀(0.2s),被輸入深度神經(jīng)網(wǎng)絡(luò),進(jìn)行本地計(jì)算。深度神經(jīng)網(wǎng)絡(luò)將這些聲音轉(zhuǎn)換成概率密度函數(shù)。當(dāng)函數(shù)值達(dá)到閾值,主處理器被激活。在主處理器激活之前,處理聲音的是協(xié)處理器。
所謂協(xié)處理器可以理解為,具備有限的功能和電量消耗的輔助處理器,允許用戶在屏幕關(guān)閉時,訪問一些“始終開啟”的功能?!癏ey Siri”功能推出后,它就幫著Siri處理聲音。Siri理解,你不想讓它聽的聲音,它就“左耳進(jìn)右耳出”。
那App會不會跟語音助手一樣呢?如果它“左耳進(jìn)”,但“沒右耳出”呢?
“Hey Siri”可被看作蘋果的“底層應(yīng)用”,是寫在系統(tǒng)內(nèi)部的,相比之下,iOS系統(tǒng)之上的應(yīng)用,調(diào)用系統(tǒng)權(quán)限的時候,用戶不會那么“無感”。
2019年,國內(nèi)的一個開發(fā)者團(tuán)隊(duì)寫了一個安卓App,在演示中,App獲取“錄音”權(quán)限后,鎖屏在后臺監(jiān)聽。開發(fā)者對麥克風(fēng)說:“今晚吃什么?”服務(wù)器端就收到App上傳的語音轉(zhuǎn)文字后的信息。他們?yōu)榱俗C明,拋開所有限制條件,僅從技術(shù)角度來說,“App在后臺監(jiān)聽到用戶說什么”是可行的。
為什么強(qiáng)調(diào)“僅從技術(shù)上”?因?yàn)橄胍耆@過用戶的注意,實(shí)現(xiàn)“偷”聽,難度可就大了。2017年,F(xiàn)acebook廣告負(fù)責(zé)人加西亞·馬丁內(nèi)斯在《連線》上撰文。他說,如果Facebook通過麥克風(fēng)記錄聽到的所有內(nèi)容,在功能上等同于用戶和Facebook在“一直通電話”。
有人做了實(shí)驗(yàn),錄音一小時,消耗電量6%。低功耗長時間的錄音,耗電量不是很大。如果多個 App,多個SDK同時使用該方式,手機(jī)會變得又熱又燙。
你難以想象“實(shí)時傳輸”能產(chǎn)生多少用戶數(shù)據(jù)。馬丁內(nèi)斯假設(shè)用戶每天使用手機(jī)時長為半天,以當(dāng)時來計(jì)算,“網(wǎng)絡(luò)通話”的單向傳輸速率平均24kbps,每人每天傳輸數(shù)據(jù)大約130MB。當(dāng)時Facebook僅在美國的日活是1.5億,每天產(chǎn)生大約20PB數(shù)據(jù)。Facebook數(shù)據(jù)庫中存儲了300PB的數(shù)據(jù),每天處理的數(shù)據(jù)量大約為600TB。這樣一算,監(jiān)聽所產(chǎn)生的音頻數(shù)據(jù)就是每天要處理的33倍了。即便公司體量如Facebook,也難承其重。
也許有人仍有疑問。既然這條路行不通了,手機(jī)、App廠商可以在本地將“語音轉(zhuǎn)文字”,過濾后提取有價值的信息,再上傳到后臺服務(wù)器。拋開這樣做后臺運(yùn)算會“吞噬”CPU,造成手機(jī)性能下降不說,擔(dān)負(fù)的成本也不低。
Google以0.006美元/15秒向第三方出售其“語音轉(zhuǎn)文字”服務(wù)。(一個用戶)每天轉(zhuǎn)寫24小時的成本是12614美元,即便每天轉(zhuǎn)寫1小時也得525美元。
根據(jù)各個平臺的隱私政策,獲取麥克風(fēng)權(quán)限,淘寶是為了與AI客服對話,抖音是為了拍攝短視頻作品,百度是為了語音搜索。
我做了一次從個人消費(fèi)者出發(fā)的測試,想去證實(shí)兩個懷疑,這三款主流的App有沒有在無感知(沒有啟用麥克風(fēng))的情況下,錄下我的對話;并將此用于App的個性化推薦和廣告系統(tǒng)。
為此我盡可能規(guī)避其他變量,用一部抹掉所有內(nèi)容和設(shè)置,并升級到iOS15以上的iPhone 7 Plus進(jìn)行測試。并且注冊了以上三款A(yù)pp的新賬戶。
至少在這次實(shí)驗(yàn)中,App調(diào)用麥克風(fēng)時無法不被察覺,也沒有將我的談話內(nèi)容,和周圍環(huán)境聲音,“轉(zhuǎn)化為”個性化推薦。
就像開篇提到的“供暖”例子,基于社交媒體對用戶的了解,你可能已經(jīng)被準(zhǔn)確打上“年輕女性”“北漂”標(biāo)簽,恰好“北京供暖”這個話題搜索熱度高。帖子可能被推給了10萬打著同樣標(biāo)簽的人,其中恰好包括你,你理所當(dāng)然地認(rèn)為自己被監(jiān)聽了。
這可能是證實(shí)偏差(confirmation bias)在作祟。證實(shí)偏差是一個心理學(xué)上的概念,它就像腦中的過濾器,留下你認(rèn)為正確的,而把那些與需要不相關(guān)的其他信息無意識地過濾掉,選擇性注意。它也被稱作“視網(wǎng)膜效應(yīng)”或“孕婦效應(yīng)”。
類似例子非常常見。你與男朋友在外散步,討論起最近搬家,談及買什么牌子的投影儀好。結(jié)果你晚上回家刷手機(jī),不僅在社交媒體上被推薦中介看房,淘寶還給你推送了新款投影儀。這時候,你剛準(zhǔn)備跟男朋友炫耀“我就說,手機(jī)一定在竊聽我們”。等等,冷靜了一下,回憶起自己出門根本沒帶手機(jī)。
這種情況之所以發(fā)生,也許是你的男朋友已經(jīng)在網(wǎng)上瀏覽過搬家,如何挑選投影儀。而你們因?yàn)樵诰W(wǎng)絡(luò)上互為好友,被監(jiān)測到相互轉(zhuǎn)發(fā)等行為,已經(jīng)被廣告系統(tǒng)標(biāo)注為“有共同興趣”。
所以廣告系統(tǒng)已經(jīng)這樣成熟了嗎?沒必要!真的沒必要!
至少在商業(yè)消費(fèi)領(lǐng)域,通過“偷”聽獲得的用戶數(shù)據(jù),質(zhì)量不見得高,但需要付出的成本極其高昂,公司沒必要為此買單。
大部分主流App都表明類似立場。因?yàn)閷τ诘谌紸pp來說,它們想不被用戶發(fā)覺,或突破系統(tǒng)權(quán)限進(jìn)行監(jiān)聽幾乎不可能。
2019年,澎湃新聞的記者發(fā)現(xiàn),在今日頭條App中關(guān)閉程序化廣告后,用戶看到的廣告數(shù)量保持不變,但廣告相關(guān)度會降低。南都在2020年的《個人信息安全年度報(bào)告》中對50款頭部App進(jìn)行測評,發(fā)現(xiàn)六款沒有提供個性化推薦關(guān)閉選項(xiàng)。兩年之后,這些頭部App均增加了這一選項(xiàng)。
好了,這下手機(jī)不會“搶答”了。