国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

破解人工智能的迷思

2020-12-30 07:49:42北京張煒卓李靜
網(wǎng)絡(luò)安全和信息化 2020年2期
關(guān)鍵詞:機(jī)器神經(jīng)網(wǎng)絡(luò)人工智能

■北京 張煒卓 李靜

人工智能可以定義為“通過調(diào)用各種計(jì)算、數(shù)學(xué)、邏輯、機(jī)械甚至生物學(xué)的原理和設(shè)備來理解,建模和復(fù)制智力、認(rèn)知過程的跨學(xué)科方法”。隨著數(shù)學(xué)、信息技術(shù)相關(guān)領(lǐng)域近30年的快速發(fā)展,AI博弈、圖像識(shí)別、AI翻譯、語音識(shí)別等應(yīng)用系統(tǒng)呈井噴之勢(shì)。但究其技術(shù)背景,無不依賴機(jī)器學(xué)習(xí)理論。

實(shí)際上,大多數(shù)機(jī)器學(xué)習(xí)方法使用的是最初相當(dāng)簡(jiǎn)單的模型的復(fù)雜組合,例如決策樹或廣義線性模型。不幸的是,盡管它們可能非常高效,但它們經(jīng)常爆發(fā)難以理解的風(fēng)險(xiǎn),而肇因難以解釋,并且在某些情況下幾乎不可能檢測(cè)到錯(cuò)誤或偏見。

算法具有的本質(zhì)困難在于,無法自行選擇參數(shù)或選擇模型,因此最終多是根據(jù)經(jīng)驗(yàn)或開發(fā)者的主觀印象進(jìn)行參數(shù)或模型的選擇。換句話說,機(jī)器學(xué)習(xí)需要專家的干預(yù)。他們非常準(zhǔn)確地告訴機(jī)器它需要學(xué)習(xí)什么以及應(yīng)該如何學(xué)習(xí)。因此,機(jī)器的作用往往僅是進(jìn)行人力不及的計(jì)算。

神經(jīng)網(wǎng)絡(luò)代表了機(jī)器學(xué)習(xí)的一個(gè)很好的例子:它在非常復(fù)雜的模型中結(jié)合了相當(dāng)簡(jiǎn)單的算法操作,這些模型經(jīng)過訓(xùn)練可以學(xué)習(xí)重現(xiàn)現(xiàn)有數(shù)據(jù)集。當(dāng)然神經(jīng)網(wǎng)絡(luò)也承襲了一般機(jī)器學(xué)習(xí)方法的主要優(yōu)缺點(diǎn):一方面,它可以準(zhǔn)確地對(duì)復(fù)雜情況建模,并自動(dòng)檢測(cè)迄今為止人類和機(jī)器都無法理解的模式。另一方面,即使開發(fā)它們的研究人員也往往對(duì)其輸出結(jié)果難以預(yù)料。人們還需要進(jìn)行大量的微調(diào)才能找到最佳模型。所以深度神經(jīng)網(wǎng)絡(luò)絕不是機(jī)器自行學(xué)習(xí)選擇最佳模型的神奇方法。相反,算法需要研究人員的專業(yè)知識(shí)和不斷的監(jiān)督。

對(duì)當(dāng)下AI技術(shù)現(xiàn)狀常見的誤解

誤解1:人工智能已經(jīng)能用計(jì)算機(jī)代替人的智力活動(dòng)

簡(jiǎn)單結(jié)論:這是美好愿景,但現(xiàn)實(shí)還遠(yuǎn)遠(yuǎn)達(dá)不到。人的智力活動(dòng)是建立在大腦神經(jīng)生物學(xué)基礎(chǔ)上的系統(tǒng)而復(fù)雜的人類活動(dòng),目前最新的技術(shù)水平也只是達(dá)到類推理的部分學(xué)習(xí)功能。具體地說,表象上類似嬰兒對(duì)語音、語義、圖像等的辨識(shí)學(xué)習(xí)過程,雖然冠以神經(jīng)網(wǎng)絡(luò)這種擬人化的名稱,但其統(tǒng)計(jì)學(xué)原理卻與人腦的神經(jīng)學(xué)原理完全不同。因此對(duì)于實(shí)質(zhì)上的概念語義理解從而進(jìn)行有效溝通等思維活動(dòng),現(xiàn)有技術(shù)沒有給出可行方法。

不過我們也看到另一種思路指導(dǎo)下的歐洲人工大腦研究項(xiàng)目采用了與現(xiàn)有統(tǒng)計(jì)學(xué)機(jī)器學(xué)習(xí)理論完全不同的研究方法,試圖從結(jié)構(gòu)上重建人類生物大腦,進(jìn)而實(shí)現(xiàn)模擬的神經(jīng)活動(dòng),最終達(dá)到仿生意義上的人工智能。不幸的是,這個(gè)研究計(jì)劃20多年來似乎進(jìn)展很不順利。

因此當(dāng)前的熱潮反映了確實(shí)技術(shù)在進(jìn)步,但也止于模仿特定領(lǐng)域的人類學(xué)習(xí)能力。不過這一進(jìn)步帶來的應(yīng)用確實(shí)可以解決很多現(xiàn)實(shí)問題。

誤解2:人們對(duì)現(xiàn)有的人工智能系統(tǒng)擁有完全的理解和掌握,至少這些系統(tǒng)的開發(fā)者可以做到。

從神經(jīng)網(wǎng)絡(luò)算法的原理上講他們不能,任何人也不能完全理解算法黑箱中隱藏層所代表的含義或者人為掌握控制這些隱藏層。隱藏層是完全產(chǎn)生于統(tǒng)計(jì)學(xué)意義下的抽象神經(jīng)節(jié)的網(wǎng)絡(luò),人們力所能及的只是對(duì)參數(shù)做調(diào)整,使得系統(tǒng)輸出盡量滿足人們預(yù)期。AI系統(tǒng)經(jīng)歷越多的訓(xùn)練和調(diào)整就越能符合人們希望其實(shí)現(xiàn)的功能:分類、識(shí)別、翻譯等。其實(shí)這種所謂的滿意程度也是以數(shù)字形式體現(xiàn)的誤差函數(shù),簡(jiǎn)單說就是以數(shù)值達(dá)標(biāo)作為系統(tǒng)功能的實(shí)現(xiàn)目標(biāo)。

雖然人們無法理解算法黑箱內(nèi)部,但是好在當(dāng)下AI系統(tǒng)實(shí)現(xiàn)的功能已經(jīng)足夠好和吸引人。比如街談巷議的圍棋稱雄、人臉識(shí)別、自動(dòng)駕駛等。

另外提到完全掌握也不免令人疑慮。人們一早就發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的AI系統(tǒng)存在脆弱性:對(duì)于輸入數(shù)據(jù)的微小擾動(dòng)就會(huì)使成熟的AI系統(tǒng)出現(xiàn)不可接受的錯(cuò)誤?!蹲匀弧冯s志2019年10月的一篇文章就深入的討論了這一問題。例如一幅貼有小廣告的交通牌可能使自動(dòng)駕駛的AI系統(tǒng)誤將停止圖像識(shí)別為限速圖像從而釀成車禍。

誤解3:目前的AI算法建立在數(shù)學(xué)理論基礎(chǔ)上并且運(yùn)行在精準(zhǔn)的計(jì)算機(jī)硬件上,所以這些系統(tǒng)產(chǎn)生的結(jié)果應(yīng)該是中立、客觀、公正的。

又是一個(gè)美好的愿望。深度神經(jīng)網(wǎng)絡(luò)算法確實(shí)是基于統(tǒng)計(jì)學(xué)理論發(fā)展起來的,但這個(gè)算法的實(shí)現(xiàn)依賴于對(duì)大量已標(biāo)簽化數(shù)據(jù)的“學(xué)習(xí)”。這種標(biāo)簽化全部由人類完成,不可避免的帶有這些訓(xùn)練者的主觀意見。這就如同來中國學(xué)習(xí)的福原愛學(xué)到的純正中文帶有東北口音。

這種由于輸入數(shù)據(jù)和訓(xùn)練過程產(chǎn)生的傾向性稱為算法偏見,再加上統(tǒng)計(jì)學(xué)本身也存在有偏抽樣的問題,使得隱藏在高科技外衣下的人類主觀偏見得以借由AI系統(tǒng)表現(xiàn)出來。

這一缺陷有解么?可以漸進(jìn)式優(yōu)化么?很難。當(dāng)下機(jī)器學(xué)習(xí)的原理決定了功能上AI系統(tǒng)嚴(yán)格依賴人類的調(diào)教,訓(xùn)練過的AI系統(tǒng)可以高效地像人那樣依據(jù)學(xué)習(xí)做事情,但并不會(huì)離開人們做事情的標(biāo)準(zhǔn)和方式。

目前在人力資源篩選和法律事件處理領(lǐng)域,我們正看到新興的AI系統(tǒng)帶著同行前輩類似的價(jià)值觀以客觀之名進(jìn)行決策。謹(jǐn)慎的研究者發(fā)現(xiàn)它們充其量只能與人類過去一樣“公平”。在某些情況下,它們甚至可能通過選擇現(xiàn)有模式并過度利用它們來改善結(jié)果,從而導(dǎo)致歧視加劇。這是因?yàn)樗褂玫挠?xùn)練數(shù)據(jù)可能會(huì)被錯(cuò)誤地標(biāo)記或受到歷史偏見的污染。例如AI招聘系統(tǒng),雇主本意依靠績效衡量指標(biāo),但提供學(xué)習(xí)數(shù)據(jù)的人類編碼員會(huì)系統(tǒng)地低估有色人種或女性的績效,或者采用對(duì)某些群體代表性不足的數(shù)據(jù),僅僅因?yàn)閺臍v史上看公司雇用這樣的人數(shù)較少。AI模型可能迅速了解這些模式的偏見并使之加強(qiáng)??纯磥嗰R遜公司的AI招聘工具,該工具學(xué)會(huì)了低估包含“女性”一詞的簡(jiǎn)歷。

值得警惕的是像法律這種需要做價(jià)值判斷的工作,不容許出現(xiàn)算法誤判,而這種誤判在現(xiàn)有AI系統(tǒng)中由于固有的脆弱性無法避免。所以在基礎(chǔ)理論產(chǎn)生“少數(shù)派報(bào)告”之前,我們應(yīng)該時(shí)刻銘記:當(dāng)前的AI不完全可靠,最佳發(fā)揮也就是達(dá)到人類已有的價(jià)值判斷水準(zhǔn)。

誤解4:目前AI離不開人,超不過人(能力范圍)是受限于技術(shù)條件,很快技術(shù)進(jìn)步就會(huì)突破現(xiàn)狀。

目前AI采用的理論基礎(chǔ)決定只能從能力上模仿人類智力活動(dòng)的特定功能,真正突破恐怕還是依賴于理論基礎(chǔ)的進(jìn)步。這種進(jìn)步可能誕生于生物領(lǐng)域或者信息技術(shù)領(lǐng)域或者任何新興科學(xué)領(lǐng)域。

這里我們不妨回顧人工智能發(fā)展史上的前一個(gè)重要節(jié)點(diǎn)。1956年達(dá)特茅斯會(huì)議上,參會(huì)者提出了這樣的理論:學(xué)習(xí)或者智能的任何其他特性都能被精確地描述,使得機(jī)器可以對(duì)其進(jìn)行模擬。也就是說,人工智能需要經(jīng)過特征提取、模型訓(xùn)練和數(shù)據(jù)預(yù)測(cè)三個(gè)階段。

當(dāng)然,人工智能在發(fā)展過程中也遇到過非常多的挑戰(zhàn)。20世紀(jì)70年代,人工智能的發(fā)展遇到了計(jì)算資源上的瓶頸,當(dāng)時(shí)的大型機(jī)器無法負(fù)擔(dān)這一切,同時(shí),在數(shù)據(jù)積累方面也才剛剛起步,人工智能在很長的一段時(shí)間內(nèi)都受限于計(jì)算能力以及數(shù)據(jù)量的不足。

到了21世紀(jì),互聯(lián)網(wǎng)呈現(xiàn)出井噴式的發(fā)展態(tài)勢(shì),互聯(lián)網(wǎng)已經(jīng)變成了一個(gè)大數(shù)據(jù)倉庫。許多有遠(yuǎn)見的公司或個(gè)人紛紛將注意力投向數(shù)據(jù)挖掘領(lǐng)域,大家開始用一行行公式和代碼挖掘數(shù)據(jù)背后的價(jià)值,這些代碼和公式的主角就是機(jī)器學(xué)習(xí)算法。數(shù)據(jù)的積累就像是一塊塊肥沃的土地,需要機(jī)器學(xué)習(xí)算法在上面耕種。

因此在底層理論領(lǐng)域和當(dāng)今互聯(lián)網(wǎng)架構(gòu)的技術(shù)領(lǐng)域沒有發(fā)生種子萌發(fā)那樣發(fā)展的情況下。在目力所及的中短期內(nèi),我們看到的主要是現(xiàn)有AI技術(shù)出現(xiàn)在更多應(yīng)用場(chǎng)景下,那種質(zhì)的飛躍還在等待時(shí)機(jī)。

誤解5:當(dāng)下已部署的AI技術(shù)對(duì)社會(huì)個(gè)體有百利而無一害

AI是當(dāng)前科學(xué)武器庫中的一把利器,同時(shí)也是雙刃劍。以下僅就業(yè)已出現(xiàn)的針對(duì)社會(huì)個(gè)體的危害簡(jiǎn)單羅列。

Deepfake 泛指以現(xiàn)有圖像、語音、視頻作為基礎(chǔ)素材,由機(jī)器學(xué)習(xí)算法進(jìn)行修改合成產(chǎn)生現(xiàn)實(shí)中不存在的高可信度影音資料,從而實(shí)現(xiàn)詐騙、欺騙、構(gòu)陷等目的。

人臉識(shí)別、語音識(shí)別、步態(tài)識(shí)別等個(gè)體識(shí)別技術(shù)系統(tǒng)構(gòu)成對(duì)社會(huì)個(gè)體隱私的侵害,個(gè)體往往處于被動(dòng)強(qiáng)制采集隱私信息狀態(tài)。不當(dāng)使用可能造成人身威脅。

AI系統(tǒng)脆弱性造成誤判,可能釀成事故。例如Google 自動(dòng)駕駛汽車的AI視覺錯(cuò)誤造成騎車人事故死亡事件。某些AI安防系統(tǒng)錯(cuò)誤導(dǎo)致發(fā)出恐襲假警報(bào)造成混亂。

當(dāng)今網(wǎng)站的AI推薦系統(tǒng)會(huì)集中推薦符合個(gè)體用戶口味的信息、產(chǎn)品、社交關(guān)系。久之,用戶會(huì)落入自我設(shè)定的信息孤島,人際關(guān)系也陷入意見相近的社交孤島。以上是形成網(wǎng)絡(luò)偏見甚至極端主義的溫床和沃土。

AI系統(tǒng)由于需要海量數(shù)據(jù)進(jìn)行訓(xùn)練,又需要高成本的硬件計(jì)算資源進(jìn)行部署實(shí)施,這就使AI資源自然集中在商業(yè)寡頭或極權(quán)政府手里,對(duì)普通消費(fèi)者或社會(huì)個(gè)體形成數(shù)字壓迫。個(gè)體始終處于被跟蹤、被建模、被篩選、被操縱、被預(yù)測(cè)、被剔除的不利地位。

誤解6:目前 AI已經(jīng)可以進(jìn)行創(chuàng)造性活動(dòng)

最近越來越多的AI系統(tǒng)走近我們身邊,使我們誤認(rèn)為這些應(yīng)用系統(tǒng)已經(jīng)擁有創(chuàng)造性。Deepfake 如前文所述只是將已有素材按照特定意圖進(jìn)行修改與合成,它可以制造不存在的情景,但并沒有創(chuàng)造任何不存在的視覺或聽覺元素,這只是高級(jí)造假絕不是無中生有。有趣的是當(dāng)我們?yōu)g覽https://generated.photos/ 生成的AI人像時(shí),經(jīng)常會(huì)碰到算法脆弱性導(dǎo)致的令人啼笑皆非的錯(cuò)誤。

另一個(gè)很火的系統(tǒng)可以把任何圖片轉(zhuǎn)換成特定藝術(shù)家繪畫風(fēng)格的合成繪畫圖像,這里圖片是現(xiàn)成的,藝術(shù)家繪畫風(fēng)格是經(jīng)訓(xùn)練模型化的。所以該系統(tǒng)并沒有創(chuàng)造新的繪畫風(fēng)格,而只是模仿這種風(fēng)格重繪了所給圖片。

那些AI作詩、編小說、講鬼故事的系統(tǒng)所產(chǎn)生的貌似原創(chuàng)內(nèi)容更像是以算法所學(xué)素材標(biāo)準(zhǔn)對(duì)隨機(jī)語言要素進(jìn)行的篩選結(jié)果,與其他AI輸出一樣只能做到“看上去像傳統(tǒng)作品”,卻無法創(chuàng)造出“出圈”的東西。

上述誤解可能帶給我們的不良影響

前文所述的關(guān)于當(dāng)下人工智能技術(shù)的各種誤解其實(shí)具有一定代表性,這些誤解可能給我們現(xiàn)實(shí)生活帶來不良影響。這些影響包括:

1.迷信人工智能帶來的確定性神話而回避應(yīng)有的思辨和討論。

2.算法偏見繼承了訓(xùn)練數(shù)據(jù)已有的偏見,AI系統(tǒng)可能使這種偏見被自然化而易于接受。

3.由于社會(huì)整體對(duì)AI算法內(nèi)核理解的困難性,對(duì)于算法開發(fā)者和廠商應(yīng)承擔(dān)的責(zé)任容易被忽視,甚至在必要時(shí)難于追究這種責(zé)任。人人都可以說這問題是AI的責(zé)任,不是我的責(zé)任。

行文到最后筆者想再度重申:指出并澄清當(dāng)下我們對(duì)現(xiàn)有AI技術(shù)的誤解,只是幫助大家更清晰準(zhǔn)確地了解事實(shí)真相。只有當(dāng)我們?nèi)媪私饽壳癆I技術(shù)的能力和局限性,才能更準(zhǔn)確地理解AI產(chǎn)生的決策來源和依據(jù)以及可靠性。能夠做到不迷信才有繼續(xù)追求技術(shù)進(jìn)步的需求和動(dòng)力,對(duì)于可能出現(xiàn)的來源于AI系統(tǒng)脆弱性的事故和風(fēng)險(xiǎn)我們才能有所準(zhǔn)備。

希望未來的AI更美好,希望有AI的未來更美好。

猜你喜歡
機(jī)器神經(jīng)網(wǎng)絡(luò)人工智能
機(jī)器狗
機(jī)器狗
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
未來機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
扶沟县| 达尔| 安达市| 巴彦淖尔市| 沭阳县| 墨脱县| 林州市| 嘉义县| 大余县| 广河县| 横峰县| 郓城县| 保康县| 荔浦县| 溆浦县| 喜德县| 清涧县| 芦山县| 开阳县| 芦溪县| 赤城县| 深水埗区| 景洪市| 沈丘县| 峨山| 建阳市| 石泉县| 吉水县| 渭源县| 濉溪县| 宁明县| 宁强县| 军事| 宜兴市| 望城县| 岑巩县| 南京市| 曲阳县| 巴林左旗| 徐州市| 沁水县|