国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

扎心了,機器比我會學習

2022-12-17 09:21
中外文摘 2022年17期
關鍵詞:犯罪率氣溫機器

□ 汪 寒

能自動避開障礙物的無人駕駛汽車,在無聊時陪主人“神聊”的智能手機語音助手,比親朋好友還“懂”我們的推薦算法……不知道你是否已經(jīng)注意到,人工智能技術早已滲透進生活的方方面面,正以前所未有的速度接近下一次技術革命,而開啟下一次技術革命大門的鑰匙就藏身于人工智能技術的廣闊藍海中。

機器學習,也要先打好基礎

面對自動運行的家用電器或與智能音箱對談的時候,也許你會對它們的貼心、智能化感到不可思議,機器為何能讀懂人類的想法呢?其實,目前的人工智能基本都是基于機器學習技術實現(xiàn)的,可以說,是“機器學習”讓家里的電器讀懂了你。

機器學習,顧名思義,就是讓機器具有學習的能力,而學習能力正是普通機器與人工智能的分水嶺。

18 世紀中葉,在瓦特改良蒸汽機的時代,開啟了人類第一次工業(yè)革命的蒸汽機只會夜以繼日地重復一個動作,任何看過這臺機器的人都不會把它與“智能”二字聯(lián)系起來。隨著科技的進步,人們設計了許多更為復雜的機器,但它們?nèi)匀徊痪邆浠镜闹悄堋?/p>

20 世紀50 年代,計算機理論迅速發(fā)展,機器學習終于登上了歷史的舞臺。機器學習的基本思想其實并不復雜,即將大量數(shù)據(jù)輸入人工智能算法(AI 算法)中,對其進行訓練,讓AI 算法生成模型,從而實現(xiàn)對事物潛在規(guī)律的揭示和對未來情況的預測。

例如,你想觀察家門口路過的灑水車,并對它的“行為”進行預測。在觀察的前6 天,你發(fā)現(xiàn)灑水車每天清晨5 點準時路過家門口,此時便形成了一個簡單的認識模型:灑水車每天清晨5點都會路過。如果第7 天是周日,是灑水車司機的休息日(但你并不清楚),你發(fā)現(xiàn)灑水車沒有像往常一樣路過,此時意味著之前的模型并不準確。又過了一周,灑水車仍然是周一到周六每天清晨5 點路過,周日不再出現(xiàn),你便可以通過新數(shù)據(jù)來糾正模型,從而更加接近事實。

機器學習的過程與觀察灑水車差不多。輸入數(shù)據(jù)之前,機器就像一張白紙,一無所知,正如同第一天之前你也不知道灑水車會來。當研究者試圖給具有學習能力的機器輸入數(shù)據(jù)時,一切都變得不一樣了。假設灑水車的觀察者是一個十分懶惰的人,不愿意動腦筋推測灑水車的運行規(guī)律,他就可以把每一天灑水車的“行為”數(shù)據(jù)輸入到機器的AI 算法中,這個過程被稱為“訓練”。通過大量的數(shù)據(jù)訓練,AI 算法對于灑水車“行為”的預測將會越來越準。

機器也躲不過題海戰(zhàn)術

有了數(shù)據(jù)之后,研究者還需要選擇合適的“學習方法”才能讓機器學得更快、更好。你也許聽說過一些與機器學習有關的名詞,比如監(jiān)督學習、強化學習等,實際上這些都是描述機器學習過程中不同的訓練方法,往往適用于不同的情況。

例如,研究者希望讓一個算法學會辨認貓和狗,如果提前給算法輸入大量貓和狗的照片,并且告訴它這張照片是貓還是狗,那么這就是監(jiān)督學習(Supervised Learning);如果研究者給算法大量貓和狗的照片,但是不告訴它哪些是貓,哪些是狗,而讓算法自動尋找貓和狗的差異,這就是非監(jiān)督學習(Unsupervised Learning):如果讓算法不斷地做選擇題,每次都讓算法“看圖”后選擇是貓還是狗,答對獎勵加分,答錯懲罰扣分,算法在試圖盡量得分且規(guī)避扣分的情況下,經(jīng)過大量訓練便會“進化”出辨認貓狗的能力,這就是強化學習(Reinforcement Learning)。

正是通過大量的數(shù)據(jù)訓練,機器才獲得了強大的能力,即使人工智能“阿爾法圍棋”(Alpha Go)背后的科學家們并不是圍棋大師,有些甚至完全不會下圍棋,也能讓它戰(zhàn)勝人類圍棋世界冠軍,而這在傳統(tǒng)的機器上是不可能發(fā)生的。傳統(tǒng)機器的所有“行為”都是設計者提前編寫好的,因此它無法實現(xiàn)超出設計者認知的行為。

機器學習并非無懈可擊

雖然機器學習讓人們身邊的很多物品越來越智能化,但距離真正的“強人工智能”還有很大的差距,這是因為當前基于數(shù)據(jù)的AI 算法在很多時候有很大的局限性。比如,一個長期接受“辨識貓狗”訓練的AI 算法可能會把吉娃娃錯認為貓,也有可能把無毛貓誤認為狗,這主要是因為機器學習得到的結(jié)果與訓練數(shù)據(jù)高度相關。如果訓練AI 用的數(shù)據(jù)是偏頗的,比如訓練用的貓的照片基本都是有毛的長尾貓,狗的照片基本都是大型犬,那么這樣訓練得到的AI 算法就很容易在辨識某些其他種類的貓狗時犯錯。

目前,人工智能系統(tǒng)的問題在于機器學習的可解釋性缺陷,即機器學習是一個“黑箱”過程,我們無法解釋它到底根據(jù)什么特征做出判斷。人類在學習辨認貓狗的時候,往往會把判斷特征集中在貓狗身上的某些關鍵部位。一個通過圖像訓練得到的AI 算法,即使結(jié)果正確率很高,卻有可能把某些判斷特征放在環(huán)境上,顯然這是不合理的,可能導致其系統(tǒng)應用存在潛在的風險。例如,在研發(fā)一個人工智能自動駕駛系統(tǒng)時,如果研發(fā)者不能判斷它是根據(jù)什么做出駕駛決策的,那么即使該系統(tǒng)在推廣前的測試中表現(xiàn)完美,也可能在遭遇復雜路況時出現(xiàn)致命錯誤。曾有一場發(fā)生在美國的車禍,就是因為人工智能自動駕駛系統(tǒng)錯誤地把卡車的白色車廂識別為天空,導致汽車徑直撞了上去。

這也從另一個角度闡明了一個道理:題海戰(zhàn)術雖然有用,但并不高效,而且會導致潛在錯誤,要想學習新知,還是要運用因果邏輯,從根本上搞清楚事物的來龍去脈。目前,科學家希望能在人工智能上實現(xiàn)這一點。

實現(xiàn)因果邏輯,機器還需努力

貝葉斯網(wǎng)絡的創(chuàng)始人、圖靈獎得主朱迪亞·珀爾認為,讓人工智能實現(xiàn)本質(zhì)飛躍的關鍵就藏在每一個人的大腦中,即上天賜予人類的強大武器——因果邏輯。

珀爾把思維分成三個等級:第一個等級是關聯(lián),與之對應的是觀察的能力,這是目前基于數(shù)據(jù)的“弱人工智能”所處的級別;第二個等級是干預,與之對應的是控制變量實施行動的能力,即能夠借助干預來獲得認知;第三個等級是反事實,與之對應的是想象的能力。幸運的是,人類的大腦處在第三等級,想象力給予我們通過想象構(gòu)建反事實——虛構(gòu)世界的能力,從而建構(gòu)認知。例如,愛因斯坦通過思想實驗將狹義相對論推廣到具有加速度的非慣性系中。

機器學習過程與人類學習過程異同

關聯(lián)和因果的區(qū)別在于,關聯(lián)僅反映數(shù)據(jù)間最表層的信息,即相關性。例如,有數(shù)據(jù)表明,氣溫與犯罪率有相關性,氣溫低的時候犯罪率更高。我國春節(jié)期間的犯罪率的確會上升,其原因主要是春節(jié)期間小偷的活動變得頻繁,而恰好春節(jié)一般處于一年中氣溫最低的時間段。如果我們把數(shù)據(jù)輸入只懂得分析關聯(lián)性的人工智能系統(tǒng)中,僅從關聯(lián)的角度分析數(shù)據(jù),將會得到“氣溫降低導致犯罪率上升”的結(jié)論。如果利用這個人工智能系統(tǒng)預測一個沒有春節(jié)文化的國家的犯罪率,或者一個氣溫異常年份的犯罪率,很有可能會得到“謬以千里”的結(jié)論。

從因果關系的角度出發(fā),研究者不僅要分析數(shù)據(jù)之間的關聯(lián)性,還要判斷其內(nèi)部的邏輯鏈條,比如,當全年氣溫保持不變時,犯罪率是否會變化?如果得到的答案為“是”,那么便可以認為除了氣溫還有其他影響因素。比如,由于新冠肺炎疫情暴發(fā),2020 年春節(jié)期間人員流動降低,雖然冬天的氣溫仍照常下降,但犯罪率卻沒有隨之變化。

珀爾認為,從機器學習上升到因果學習的一個重要渠道是引入“干預”算子?!案深A”與“觀測”有本質(zhì)上的不同,例如,觀測到公雞打鳴和強制讓公雞打鳴是完全不同的兩件事。目前的AI算法可以判斷公雞打鳴和太陽升起這兩件事之間的相關性,可是卻很難判斷強制讓公雞打鳴時太陽是否也會隨之升起。珀爾認為,只接受被動觀測數(shù)據(jù)的人工智能無法攀登上第二等級回答與“干預”有關的問題,也就無從理解“公雞打鳴”與“太陽升起”這兩件事之間的因果關系,因為因果關系的確認需要進行控制變量實驗,而這樣的實驗本身是建立在干預上的。

也許你會問,如果觀測到的維度足夠豐富,獲得的數(shù)據(jù)足夠充分,觀測是否可以代替干預呢?實際上,我們很難保證數(shù)據(jù)范圍與實際測試環(huán)境一致,更困難的是,很多時候無法知道數(shù)據(jù)本身是否完備。這就導致無論用多么巨量的數(shù)據(jù)訓練AI 算法,都有可能因為數(shù)據(jù)與測試環(huán)境不完全一致而出錯,這被稱為OOD(Out Of Distribution)問題。圖靈獎得主約書亞·本吉奧也認為,OOD 泛化是當前人工智能最急需解決的一個問題。

現(xiàn)在,生活中常見的人工智能系統(tǒng)與“強人工智能”還有很大差距,它們還不具備判斷因果關系的能力,也完全沒有第三等級的想象力。不過,科學家已經(jīng)認識到“因果學習”是讓人工智能實現(xiàn)下一次飛躍的關鍵,許多科學家相繼投入到“因果機”的理論研究中。例如,清華大學的崔鵬教授提出了通過將因果推理與機器學習相結(jié)合的穩(wěn)定學習(Stab1e Learning)來改進OOD 泛化問題;卡內(nèi)基梅隆大學的黃碧薇博士利用因果關系發(fā)現(xiàn)框架,在時間序列的非穩(wěn)態(tài)數(shù)據(jù)上實現(xiàn)了更精準的預測。隨著技術的發(fā)展,人工智能技術一定會越來越可靠,并能最終造福人類。

猜你喜歡
犯罪率氣溫機器
基于FY-3D和FY-4A的氣溫時空融合
機器狗
機器狗
深冬氣溫多變 蔬菜管理要隨機應變
未來機器城
民生支出對犯罪率惡化影響研究——基于29個省份的面板數(shù)據(jù)
與氣溫成反比的東西
基于莫蘭指數(shù)的盜竊犯罪率全局分布模式分析
基于浙江省犯罪率多變量權重的算法研究
福州市| 嘉祥县| 得荣县| 丹东市| 祁连县| 利川市| 阿瓦提县| 西昌市| 林西县| 南充市| 吉木萨尔县| 石门县| 两当县| 彭阳县| 霍林郭勒市| 五大连池市| 沁阳市| 诏安县| 汶上县| 监利县| 绥化市| 威宁| 黎平县| 马公市| 囊谦县| 吴桥县| 博乐市| 武城县| 香河县| 邵阳市| 泰兴市| 页游| 五指山市| 宁阳县| 大荔县| 余干县| 收藏| 龙海市| 鹤山市| 蒙自县| 萨迦县|