1月15日,阿里巴巴開發(fā)的人工智能(AI)模型,在斯坦福大學(xué)閱讀理解測試中的得分超出了人類。
阿里巴巴上周讓其深度神經(jīng)網(wǎng)絡(luò)模型接受了測試,要求AI給出超過10萬個問題的確切答案,而這些問題所構(gòu)成的試卷被認(rèn)為是當(dāng)前世界檢測機器閱讀水平的最權(quán)威的標(biāo)準(zhǔn)之一。由阿里巴巴數(shù)據(jù)科學(xué)技術(shù)研究院開發(fā)的這一AI模型在測試中得了82.44分,相比人類對手82.304的得分稍勝一籌。
阿里巴巴說,這是機器首次在此類測試中戰(zhàn)勝真人。微軟開發(fā)的機器也取得了同樣的戰(zhàn)績,在同一測試中得到了82.650的高分,只是成績的最終確認(rèn)比阿里巴巴的AI模型晚了一天。
所謂的自然語言處理是模仿人類對語言詞句的理解。斯坦福大學(xué)的測試題基于500多篇維基百科文章編制而成,旨在通過這套試題梳理出線索,看機器學(xué)習(xí)模型是否能夠在經(jīng)過大量信息處理后給出問題的確切答案。
阿里巴巴研究院自然語言處理首席科學(xué)家司羅在一份公告中說,對于像“天為什么會下雨”這樣的客觀問題,機器給出的答案準(zhǔn)確率會很高。公告稱,其中的技術(shù)可以逐步應(yīng)用于諸如客服、博物館指南、在線解答患者醫(yī)療問題等廣泛的實際應(yīng)用領(lǐng)域,從而以一種前所未有的方式減少人力投入的需求。
(彭博新聞社)endprint