人工智能“阿爾法圍棋”新版本“從零開始”學(xué)習(xí)圍棋,僅用3天就擊敗前輩版本,40天成為新的王者。
之前的版本在剛開始學(xué)習(xí)圍棋時,都要依靠人類知識,即先教它們一些人類摸索出的基本下法,然后再開始自己學(xué)習(xí)。而這個阿爾法元程序(AlphaGo Zero)擺脫了這個限制,研究人員沒有給它除棋盤和棋子外的任何輸入,它完全是“從零開始”,自己與自己對弈,通過更為優(yōu)秀的算法,取得飛速進(jìn)步。
開始學(xué)習(xí)圍棋3天后,它就以100比0的成績戰(zhàn)勝“阿爾法圍棋-李”;40天后,它又戰(zhàn)勝了在所有人類高手看來已不可企及的“阿爾法圍棋-大師”(AlphaGo Master)。