張小川,劉 溜,陳 龍,涂 飛
(重慶理工大學(xué) 兩江人工智能學(xué)院,重慶 401135)
文化是一個國家、一個民族的血脈和精神家園。中華優(yōu)秀傳統(tǒng)文化是中華民族生存發(fā)展的精神支撐,也是現(xiàn)階段中國特色社會主義建設(shè)所植根的文化沃土。習(xí)近平總書記在河北省承德市考察時曾經(jīng)強(qiáng)調(diào):“保護(hù)好、傳承好、利用好中華優(yōu)秀傳統(tǒng)文化,挖掘其豐富內(nèi)涵,以利于更好堅定文化自信、凝聚民族精神”。中國棋文化正是中國幾千年積淀并傳承下來的優(yōu)秀傳統(tǒng)文化內(nèi)容之一,其中包含了各民族多種棋類項目,它們共同構(gòu)成中國棋文化。
藏棋,顧名思義就是主要流行于藏區(qū)的棋類項目,是藏族文化的重要組成部分,它極大地豐富了廣大人民群眾的精神文化生活,其歷史源遠(yuǎn)流長,折射出藏民族獨特氣質(zhì)、智慧和精神價值追求[1]。藏棋種類繁多,按照布局、著法等行棋規(guī)則和棋具及其形狀的不同,大致可以分為“久棋”“密芒”兩大類型。本文講述的是廣泛流傳于我國西北的安多地區(qū)——青海省海南州、黃南州、果洛州、海東市和四川省阿壩州的“久棋”。
藏族久棋一度瀕臨失傳,經(jīng)過多方努力,正在穩(wěn)步恢復(fù)發(fā)展中。2018年,在中國人工智能學(xué)會機(jī)器博弈專委會副主任委員、中央民族大學(xué)吳立成教授和副秘書長李霞麗教授的大力支持下,將久棋引薦進(jìn)中國計算機(jī)博弈競賽項目庫,讓人工智能與久棋博弈項目相結(jié)合,為其傳承和發(fā)展帶來深遠(yuǎn)影響。其實,全國高校,特別是民族類大學(xué)的師生們,此前已經(jīng)開展了早期研究工作。比如,2011年青海民族大學(xué)開發(fā)了全國首款藏族棋類軟件,首次詳細(xì)介紹了棋盤、棋子和棋局的狀態(tài)空間的表示方法,以及系統(tǒng)的解決方案[2-3];2016年,中央民族大學(xué)引入極大-極小值方法,開發(fā)了藏式圍棋博弈軟件[4];2018年,中央民族大學(xué)設(shè)計了具有優(yōu)先級別的防守、攻擊、連子等策略[5];2019年首次進(jìn)入中國大學(xué)生計算機(jī)博弈大賽暨第十三屆中國計算機(jī)博弈錦標(biāo)賽的正式比賽項目系列。從此,久棋的發(fā)展邁進(jìn)了新篇章。
基于上述背景,首先分析了計算機(jī)博弈構(gòu)成要素,提出博弈智能體結(jié)構(gòu),理清計算機(jī)博弈規(guī)則的離散化思路,以規(guī)則庫、置換表等為案例,梳理了知識庫構(gòu)建思路,以此奠定博弈智能體的知識基礎(chǔ);然后,根據(jù)久棋特有的布局、行棋、飛子3個階段,按照分段評估思路,根據(jù)久棋行棋過程以特殊棋型為標(biāo)桿的逼近策略,對這些特殊棋型進(jìn)行量化估值,從而形成久棋博弈的不同階段盤面評估方法,構(gòu)成了完整的久棋博弈局面評估體系;最后,再以此為基礎(chǔ),開發(fā)了久棋博弈軟件,其棋力得到顯著提升,取得全國大學(xué)生計算機(jī)博弈大賽優(yōu)異成績。希望此文能起到拋磚引玉之效,共同推動計算機(jī)博弈研究發(fā)展。
博弈本意源于游戲,而棋牌類項目是屬于博弈活動的重要內(nèi)容。棋牌類游戲是兩人或多人針對特定規(guī)則的對抗性游戲活動,其中不乏各方斗智斗勇,既有智力對抗、也有益智娛樂,能實現(xiàn)切磋、消磨時光和增進(jìn)了解之效,是大眾喜聞樂見的游戲項目,這也是棋牌類活動經(jīng)久不衰的根本所在。在棋牌游戲中,各方依據(jù)自己判斷、理解、推理,會產(chǎn)生下棋、出牌行為,顯然,此行為僅僅是博弈活動的外在表現(xiàn),更為重要的思考、推理、算路等才是博弈活動的內(nèi)在本質(zhì),此稱之為著法。但是,所有這些過程、行為、著法都需要一種物理承載,以承載博弈活動的展開,這就是棋盤等物質(zhì)載體。因此,一個完整的棋牌類博弈游戲,包含了5個關(guān)鍵性要素:至少有2個博弈方、博弈規(guī)則、博弈行為、博弈著法、博弈收益,如圖1所示。
圖1 博弈游戲的五大要素
圖1中,如果某方變成計算機(jī),就成為人-機(jī)博弈,如果雙方都是計算機(jī),就變成機(jī)-機(jī)對弈,它們都屬于計算機(jī)博弈的具體研究對象,其研究本質(zhì)就是對人類博弈活動中的方法、戰(zhàn)術(shù)、謀略、推理、情感等行為,以計算機(jī)系統(tǒng)形式予以模擬、模仿、仿真實現(xiàn)。因此,計算機(jī)博弈活動不僅有IBM“深深的藍(lán)”打敗國際象棋冠軍、谷歌“阿爾法狗”打敗圍棋冠軍這樣高光實例,而且還是承載研究人們高智力、強(qiáng)對抗行為的最佳科學(xué)載體,這也是有學(xué)者將計算機(jī)博弈稱為是人工智能研究的標(biāo)準(zhǔn)平臺或果蠅的重要原因。
藏族久棋是一種兩人對弈棋類項目,也具有圖1的5個要素。藏民的先輩們還因地制宜、因陋就簡地下棋。比如在野外,以大地為盤,就地劃一個棋盤網(wǎng)格,此時棋盤的大小、美觀和對抗思考時間長短已不是最重要的,正因為如此,現(xiàn)在流行的久棋規(guī)則也是參差不齊,給久棋推廣、傳承帶來困難。為便于研究工作的開展,人們選擇了大小為14×14的網(wǎng)格、類似于圍棋的棋盤,如圖2所示。也嚴(yán)格規(guī)定了博弈各方對抗用時和一些特定約定、條款,從而形成久棋博弈規(guī)則,詳細(xì)內(nèi)容可見中國人工智能學(xué)會機(jī)器博弈專委會官方網(wǎng)站下載專區(qū)(http://computergames.caai.cn/)。下面以吃子規(guī)則為例予以說明。
1)跳吃:要求本方棋子與相鄰對方棋子在同一條棋路上,且有一個空棋位,本方棋子跳過對方棋子落在空位上,就可以將對方棋子吃掉;跳吃含單跳和連跳,只要滿足條件,就可以吃掉對方若干枚棋子,如圖2所示。
2)成方吃:要求四子成方形布局,即將四枚棋子走至一個棋格的4個角,就可吃掉對方任意一枚棋子,此稱為單棋門。若在走子時形成2個方形,就可以吃掉對方任意2枚棋子,稱為雙棋門。如圖2所示。
3)陣型吃:陣型包括基本陣型和特殊陣型。圖2所示為褡褳、拉薩2種常見久棋陣型。其實,在藏區(qū)民間,久棋存在許多特殊陣型,需要整理、挖掘和完善。在久棋博弈中,某方棋子形成特定陣型后,就能吃掉對方若干枚棋子。
圖2 跳吃、成方吃和褡褳、拉薩陣型示例圖
計算機(jī)博弈的外在表現(xiàn)通常是一個計算機(jī)軟件,但是,作為一個模擬人類棋手的智能軟件,更提倡以智能體形式進(jìn)行開發(fā)設(shè)計。智能體是英文Intelligent Agent(簡稱IA)的意譯,目前學(xué)術(shù)界對其還沒統(tǒng)一定義,不同學(xué)者也有不同解釋。比如,Russell等[6]在1995年從3個角度進(jìn)行了描述:
1)行為角度:任何一種智能體可通過感知器感知環(huán)境,并通過效用器對環(huán)境做出有影響的反應(yīng)。
2)知識角度:對每個感知到的序列,智能體能根據(jù)自己所內(nèi)嵌的知識和所感知到的序列,按照使其能最大化的原則選擇自己的行動。
3)經(jīng)驗角度:智能體能依靠自己的經(jīng)驗,不是依據(jù)設(shè)計者提供的環(huán)境知識來決定自己的行為,并能適時做出選擇。
綜上可見,智能體是一個與某個博弈項目緊密融合的計算機(jī)系統(tǒng),但它與一般的計算機(jī)系統(tǒng)還是存在明顯差異的:一般的計算機(jī)系統(tǒng)是一成不變地、按編寫代碼簡單地運行;智能體要具有較強(qiáng)的自主性,即智能體行為不受外界的直接干預(yù),能最大限度控制自己行為和自身狀態(tài)。而且,智能體具有一定的靈活性,即有一定的反應(yīng)力和自發(fā)性行為,能感知環(huán)境并及時做出有針對的智能型響應(yīng)。本文所說的博弈智能體是針對計算機(jī)博弈活動的,選擇以知識庫支撐為基礎(chǔ)、智能算法為核心、能自適應(yīng)軟件架構(gòu)為載體的方式,予以構(gòu)建。采用分層遞進(jìn)的控制思想,將博弈智能體分成交互、感知、知識和算法共4個層,并設(shè)計了相應(yīng)的流程,如圖3所示。
圖3 久棋博弈智能體層次結(jié)構(gòu)與流程圖
從圖3可見,規(guī)則是博弈智能體知識庫的重要內(nèi)容之一。一般來講,棋牌規(guī)則需要進(jìn)行預(yù)處理,先提取其中關(guān)鍵性指標(biāo)、博弈邏輯與步驟等特征信息,再進(jìn)行知識化實現(xiàn),通常采用If…then…、語義網(wǎng)絡(luò)等形式存儲。本質(zhì)上是對棋牌規(guī)則離散化、可計算性處理,當(dāng)然也是一個降維處理過程,該過程當(dāng)前仍然以人工操作為主。至于AlphaGo Zero聲稱通過短時間學(xué)習(xí),能自己掌握圍棋、日本將棋等規(guī)則并打敗了之前AlphaGo Lee(即打敗李世乭的版本)、AlphaGo Master(即創(chuàng)造線上與人類棋手對戰(zhàn)的60∶0戰(zhàn)績版本)和日本將棋冠軍等程序,當(dāng)下并不具有普適性,因為Zero版本需要強(qiáng)大算力和電力支持,還需要標(biāo)注后的、符合博弈項目規(guī)則的大量對局?jǐn)?shù)據(jù),這在普通博弈智能體的構(gòu)造過程中,是不具備這些條件的或者難以做到[7]。因此,本文中選擇了性價比更高、更具有應(yīng)用普及意義的人工建立知識庫方法。
久棋博弈規(guī)則是藏族精神、久棋要義的具體體現(xiàn),也是藏文化精髓所在,它們在久棋博弈智能體中,就具體表現(xiàn)為程序代碼的特殊限制和博弈流程的特定規(guī)約,而這些都可用知識形式存儲于數(shù)據(jù)庫中。為在全國大學(xué)生課外科技活動中推廣,機(jī)器博弈專委會為此成立專家委員會并完成了久棋計算機(jī)博弈規(guī)則整理與定義。為節(jié)約篇幅,在此以跳吃規(guī)則為例予以簡要說明。
第一,博弈載體的離散化。在久棋計算機(jī)博弈中,棋盤是博弈活動的舞臺、棋子是博弈活動的舞者,首先需要離散化,這是久棋可計算的前提,而相應(yīng)的數(shù)據(jù)結(jié)構(gòu)和框架就是離散化的具體呈現(xiàn)。對久棋棋盤通常采用二維矩陣方式、用數(shù)組形式予以實現(xiàn),在此注意的是要充分考慮智能體代碼的自適應(yīng)性。比如,棋盤長、寬坐標(biāo)等參數(shù)值,就要考慮到不同地域、不同比賽的不同變化,擬采取參數(shù)可配置法予以實現(xiàn),其偽代碼如下。
public class Board
{
public int x_wide;//棋盤寬度
public int y_long;//棋盤長度
x_wide=inita.wide;//取初始化參數(shù)值
y_long=inita.long;
public Position[,] positions =new Position[x_wide,y_long];……
}
14×14棋盤共有196個網(wǎng)格節(jié)點,每個節(jié)點有3種狀態(tài),可使用點數(shù)組方法量化處置:如黑方棋子標(biāo)記為1、白方棋子標(biāo)記為-1、空白點標(biāo)記為0。如果采用點數(shù)組的話,就可以建立網(wǎng)格節(jié)點與點數(shù)組中元素的1、-1對應(yīng)關(guān)系,并以此表示棋子的數(shù)據(jù)結(jié)構(gòu),從而所有元素構(gòu)成的點數(shù)組在某時間點t就成為久棋t時刻的久棋局面,記為狀態(tài)St,隨著時間t的改變,獲得博弈狀態(tài)隨時間變化的狀態(tài)序列{St|t=1,2,3,…},可以描述成根節(jié)點在上的一棵博弈樹,如圖4所示。
圖4 博弈狀態(tài)的博弈樹結(jié)構(gòu)圖
此外,還可以通過增加點數(shù)組的維數(shù)或賦予網(wǎng)格節(jié)點多于3種狀態(tài)的表示方法,從而讓點數(shù)組承載更多的棋局信息,比如黑方棋子是成方的棋子,標(biāo)記為4…,從而滿足博弈智能體更寬泛的需求。
第二,規(guī)則條款的離散化。久棋規(guī)則同其他博弈項目規(guī)則一樣,也是對行棋過程中設(shè)置系列邊界條件,外觀呈現(xiàn)就是條條款款,體現(xiàn)的是久棋內(nèi)在的邏輯。因此,可采用函數(shù)體或類結(jié)構(gòu)等方式來構(gòu)造。此時,需特別注意條款的量化表示方式,即數(shù)據(jù)結(jié)構(gòu),也要嚴(yán)格包含執(zhí)行時序,即空間順序和時間約束與限制。在此以久棋跳吃規(guī)則的2種情況為例予以說明:首先是同方向棋路中,異子相鄰時,可以隔空跳吃;然后連續(xù)跳吃時,可多次吃子。據(jù)此規(guī)則,在設(shè)計規(guī)則庫時,就要體現(xiàn)2個關(guān)鍵性觸發(fā)因素:一是搜索當(dāng)前棋子是否具備處于跳吃的位置;二是判斷在某個方向上是否可以具備跳吃的條件。如圖5所示就為此知識點的工作流程,最后,據(jù)此可設(shè)計為一個跳吃函數(shù)。
圖5 久棋跳吃規(guī)則實現(xiàn)流程圖
由于狀態(tài)St與St-1狀態(tài)密切相關(guān),不具有完全的隨機(jī)性,也不是完全意義的馬爾科夫隨機(jī)過程,但博弈論中相關(guān)的一些搜索算法,特別是著名的極大值-極小值算法,以及剪枝、啟發(fā)等方法,就能快速發(fā)現(xiàn)圖4博弈樹合適的著法,這就是圖2優(yōu)化計算步驟的主要工作內(nèi)容。
在實際對弈中,僅依靠單次搜索就想達(dá)到目標(biāo)是不現(xiàn)實的。但是,如果每次都重復(fù)上次搜索,其效率又將極其低下,因此,如果能充分利用上次搜索,利用增量搜索思想,即僅僅搜索上次搜索中變化的博弈樹樹枝,無疑將極大提高搜索效率。這就是引入置換表的目的之一。
置換表是基于空間換時間的思想[8],用表格將之前搜索過的信息保存下來,表中每個數(shù)據(jù)項對應(yīng)于一個博弈樹的節(jié)點及其估值等,在搜索時,把已被搜索節(jié)點的相關(guān)信息記錄下來,如果與該表中待搜索節(jié)點特征相匹配的話,就直接提取置換表對應(yīng)結(jié)果而勿需繼續(xù)搜索,以此節(jié)約搜索時間。
置換表可以保留搜索記錄,幫助改變節(jié)點搜索順序,從而達(dá)到對博弈樹的剪枝效果。比如,在搜索過程中,節(jié)點評估值如果是介于某一個區(qū)間,此區(qū)間可以假設(shè)為此節(jié)點的最小評估值與最大評估值所構(gòu)成的區(qū)間,則立即啟動搜索操作并將當(dāng)前節(jié)點評估值存入置換表之中,以備后續(xù)查詢。而對于評估值不在上述區(qū)間的,可以忽略,從而加快了搜索速度,能幫助盡快發(fā)現(xiàn)最優(yōu)節(jié)點。
置換表是基于哈希表的一種數(shù)據(jù)結(jié)構(gòu),它存在一個重要問題:即在數(shù)據(jù)量特別大時,哈希表存在地址沖突問題。對這個問題,常用方法是基于Zobrist鍵值的哈希方法,針對久棋棋盤的196網(wǎng)格節(jié)點,使用Zobrist方法可構(gòu)造32位哈希值,用Zobrist[X,N,N]數(shù)組保存32位隨機(jī)數(shù),X=0表示黑子棋盤,X=1表示白子棋盤。例如,當(dāng)棋盤上(2,2)點有黑子、(3,3)點有白子時,棋盤的哈希值可由式(1)計算獲得:
Hashcode=Zobrist[0][2][2]^Zobrist[0][3][3]
(1)
如果在(3,3)點黑子被吃掉,通過異或計算即可得新的哈希值,如式(2):
Hashcode=Hashcode^Zobrist[1][2][2]
(2)
另外,增加一個32位的blackZobrist常量來區(qū)分先手、后手。若是黑子落子,計算完哈希值后異或上blackZobrist,如式(3):
Hashcode=Hashcode^Zobrist
(3)
通過上述方式,就使得創(chuàng)建關(guān)鍵字的地址沖突概率極低。其他的如開局庫、終局庫、定式庫,以及棋手的妙招與經(jīng)典著法等人類經(jīng)驗,也是博弈智能體知識庫的重要內(nèi)容。通過知識庫,博弈智能體就可以掌握人類棋手許多常識、下棋著法,實現(xiàn)對博弈智能體的首次賦能。限于篇幅,在此僅以開局中布局定式為例,予以說明設(shè)計思路。
布局是久棋對弈中第一個階段,高質(zhì)量的布局不僅有利于快速吃子、確立開局優(yōu)勢,還能幫助構(gòu)建理想陣型、奠定勝利基礎(chǔ)[9]。經(jīng)過大量棋譜分析和實戰(zhàn)測試,發(fā)現(xiàn)久棋最終勝利與一些特定棋型密切相關(guān),如圖6所示。
圖6 久棋布局中的5種典型棋型
第1種棋型為山字棋型,此種棋型包含2個棋門,有2次成方機(jī)會;第2種棋型為回字棋型,此種棋型在中心填子便能成方,且在四周填子還可以形成4個山字棋型;第3種為十字棋型,此種棋型包含4個棋門,具有4次成方的機(jī)會;第4種棋型為方陣棋型,此種棋型已經(jīng)成方,可以吃掉對方任意棋子,以此為基礎(chǔ)還可以演化為褡褳、拉薩等更復(fù)雜棋形;第5種為三角陣型,此種棋型有1個棋門,在角落填子就可成方,適當(dāng)填子后還可演變成山字陣型。將上述基本棋型存入開局庫中,以此指導(dǎo)博弈智能體的布局,能最大限度避免走出愚型、昏招,提高智能體布局棋力。
藏族久棋博弈過程與一般棋類博弈過程的不同之處就體現(xiàn)在規(guī)則迥異的3個階段:即布局階段、行棋階段、飛子階段。3個階段彼此獨立、又相互聯(lián)系、相互影響[10]。因此照搬其他棋類的盤面評估方法,在久棋博弈中就行不通。本文基于分段評估思想,結(jié)合棋型匹配方法,針對每個階段規(guī)則和特性,為每個階段構(gòu)造不同評估策略,以提高整體評估的準(zhǔn)確性[11]。
久棋實戰(zhàn)中,棋手往往會根據(jù)對手實力和風(fēng)格,確定不同策略。面對整體實力較弱的對手,通常采用進(jìn)攻策略,盡快建立優(yōu)勢,以快速取得勝利;面對實力較強(qiáng)的對手,通常采用防守策略,極力避免在布局階段產(chǎn)生較大劣勢,以待行棋階段再與對方進(jìn)行斡旋、尋找機(jī)會。進(jìn)一步研究發(fā)現(xiàn),久棋的防守和攻擊策略與布局階段的棋型存在較強(qiáng)的關(guān)聯(lián)性:適合于進(jìn)攻的有圖6中十字、回字等陣型;偏重于防守的有圖6中山字型、方型;而比較中性的為三角型。以此,就可以按照表1分值,賦予不同陣型的估值。
表1 不同策略下的棋型得分表
注意,表1中估計值來源于經(jīng)驗,對博弈智能體來講屬于先驗性知識。其實還可以利用優(yōu)化方法,比如遺傳算法等進(jìn)行離線尋優(yōu),獲得更優(yōu)估值。
行棋是久棋全局中承上啟下的階段,直接關(guān)乎棋局最終的輸贏。其中的局面評估尤其重要,同時局面也最為渾濁從而使得局面評估最為艱難。在行棋階段,可以通過棋型分類,為不同策略提供相應(yīng)的先驗棋型:將用于逐漸吃子后,建立優(yōu)勢的歸為基礎(chǔ)棋型;將能直接獲得勝利的棋型歸為勝利棋型,久棋中也稱吉祥棋型。
經(jīng)過研究發(fā)現(xiàn),基礎(chǔ)棋型中最常見的有“門”棋型,如圖2左圖右上角的單門和雙門所示,其實本質(zhì)就是圖6的最具效率的僅有3顆棋子的三角形棋型,至于其他所有棋型都是基于門棋型的變化而來。因此,將門棋型定義為基礎(chǔ)棋型。至于勝利棋型包含棋型就多了。而且在藏文化中,對一些特殊形狀“棋”有獨鐘,常見的勝利棋型有圖2中的褡褳及其演化的拉薩兩大類棋型,它們至少需要13顆棋子、最多的需要24顆棋子,這對行棋時間與空間都有較強(qiáng)的要求,在實際對局中產(chǎn)生這樣的勝利棋型自然難度就非常大。
分析發(fā)現(xiàn),久棋在行棋階段的局面評估可以從式(4)獲得相應(yīng)估值:
(4)
式中:kill是吃子評分;basicScore是基礎(chǔ)得分;victoryScore是勝利得分;β是表2中棋型對應(yīng)的分值。特別是對于各種勝利棋型,β估值可以給予智能體最大值。
表2 行棋階段中基礎(chǔ)棋型得分表
飛子是久棋行棋的最后階段,通常情況下,某方處于巨大劣勢時,在行棋階段就可以確定輸贏。但是,久棋規(guī)則中,在飛子階段,對少子方的移動棋子是不會受限制的,此時該方可以移動任何棋子到任意空白位置,如果此時能構(gòu)成勝利棋型,便可以反敗為勝,這是久棋獨有魅力的地方,當(dāng)然,也給博弈智能體的決策構(gòu)造帶來極大不確定性。
分析發(fā)現(xiàn),在飛子階段主要有2種棋型,如圖7所示,一種是十字飛子型,由6顆棋子組成具有3個棋門的十字圖形。此時,黑方的任意棋子可以落在圖形中A、B、C點,并吃掉對方任意棋子;第二種是九子飛子型,它以9顆棋子組成了包含7個棋門的圖形,此時少子方的任意棋子可以落到A、B、C、D、E點,并能連續(xù)成方吃掉對方棋子。
圖7 飛子階段的2種棋型
對飛子階段2種棋型,可以賦予如表3所示的分值。
表3 飛子階段的基礎(chǔ)棋型得分表
當(dāng)然,久棋還有其他一些吉祥陣型[12-13],比如由14顆棋子構(gòu)成的金魚陣型,15顆棋子的幢陣型,16顆棋子的右旋海螺陣型、寶瓶陣型和寶傘陣型,17顆棋子的妙蓮陣型,20顆棋子的吉祥結(jié)陣型,以及24顆棋子的法輪陣型等,由于這些陣型需要棋子多,對方一般不會給予己方如此的大空間和長時間去擺放這些棋型,自然在實際博弈中,出現(xiàn)概率少,但是從完備性角度講,在博弈智能體知識庫中還是有存在必要的。
提出了久棋博弈智能體層次結(jié)構(gòu),描述了知識庫構(gòu)建方法,梳理了博弈智能體關(guān)鍵流程,針對藏族久棋特殊的分段行棋規(guī)則,依據(jù)分段評估思路,構(gòu)造了不同階段的局面評估方法。以上述方法構(gòu)建了久棋博弈智能體,參加了2021年中國大學(xué)生計算機(jī)博弈大賽暨中國計算機(jī)博弈錦標(biāo)賽久棋項目比賽,取得全國一等獎優(yōu)異成績,證明了本文思想、方法的可行性和實效性。但是,在久棋其他特殊陣型的挖掘與知識化方面,特別是機(jī)器學(xué)習(xí)方法應(yīng)用上,還需要進(jìn)一步開展研究工作。