李建
摘 要:技術(shù)科目作為浙江省新高考科目以來,算法加試部分難度不斷提高。近幾年的考題對計數(shù)思想的考查,更標(biāo)志著程序填空題的難度從代碼層面到思維深度的跨越。文章作者將結(jié)合思維程度的深入,逐步給出數(shù)個經(jīng)典動態(tài)規(guī)劃問題的思考過程,并提出一種“加一維”的思考方法,切實(shí)有效提高學(xué)生解決動態(tài)規(guī)劃問題的能力。
關(guān)鍵詞:動態(tài)規(guī)劃;狀態(tài)定義;狀態(tài)轉(zhuǎn)移;加一維
中圖分類號:O221.3 文獻(xiàn)標(biāo)識碼:A 收稿日期:2019-04-07 文章編號:1674-120X(2019)24-0117-02
很多教師錯誤地認(rèn)為動態(tài)規(guī)劃問題就是背包問題,甚至有教師因?yàn)樵搯栴}太過抽象,“簡單粗暴”地讓學(xué)生死記背包模型代碼,顯然這種教學(xué)方法是非常不可取的。
下面筆者逐步給出數(shù)個經(jīng)典動態(tài)規(guī)劃問題的解題步驟,建立概念之間的內(nèi)在聯(lián)系,讓學(xué)生了解動態(tài)規(guī)劃算法的本質(zhì),并提出“加一維”,切實(shí)有效提高學(xué)生解決問題的能力。
一、動態(tài)規(guī)劃算法基本原理
在信息學(xué)競賽中,第一次考查動態(tài)規(guī)劃是在IOI1994(國際信息學(xué)競賽)中的“數(shù)塔問題”,雖然當(dāng)時全世界信息學(xué)頂尖選手的此題得分率極低,但是現(xiàn)在已經(jīng)作為DP算法的入門題出現(xiàn)。其模型比較直觀,有助于我們理解動態(tài)規(guī)劃算法中的相關(guān)概念和性質(zhì)。很多教師在講授動態(tài)規(guī)劃時,先羅列相關(guān)生澀的概念,很多學(xué)生對此無法真正理解。下面我們從一個相對直觀的問題出發(fā),一步一步引導(dǎo)學(xué)生主動思考,在解決問題的過程中,學(xué)生可以逐漸理解問題的本質(zhì)。
問題一:數(shù)塔問題。有一些數(shù)字排成數(shù)塔的形狀,其中第一層有一個數(shù)字,第二層有兩個數(shù)字……第n層有n個數(shù)字。現(xiàn)在要從第一層走到第n層,每次只能選擇左下方或者右下方的數(shù)字,問:“最后將路徑上所有數(shù)字相加后得到的和最大是多少?”
教師引導(dǎo)思考過程:
(1)從起點(diǎn)到第一行第一列的答案是固定的。
(2)在第一步驟基礎(chǔ)上,從起點(diǎn)到第二行的答案也是固定的。
(3)在第三行時,7有兩種選擇,顯然選擇累積更大的8才是最優(yōu)的。若將f[i][j]定義為從第一行第一列到第i行第j列的路徑上的數(shù)字和的最大值,則到數(shù)字7的遞推式為:f[3][2] = max(f[2][1] , f[2][2])+7。
(4)可得出一般遞推式為f[i][j]=max(f[i-1][j-1],f[i-1][j])+a[i][j],我們只需要推到第n行,就可以得到ans=max(f[n][1…n])。
解法提煉:
(1)狀態(tài)定義:f[i][j]定義從第一行第一列到第i行第j列的路徑上的數(shù)字和的最大值。
(2)所求:max(f[n][1…n])。
(3)狀態(tài)轉(zhuǎn)移:f[i][j]=max(f[i-1][j-1],f[i-1][j])+a[i][j]。
正確性分析:
(1)前面推導(dǎo)的結(jié)果不會隨著后幾行得到的結(jié)果而改變——無后效性。
(2)局部最優(yōu)可以保證全局最優(yōu)——最優(yōu)子結(jié)構(gòu)。
這兩個性質(zhì)也是動態(tài)規(guī)劃算法解決問題的先決條件。
二、動態(tài)規(guī)劃的狀態(tài)定義
問題二:最長上升子序列問題。給定一個長度為n的數(shù)字序列,求最長的上升子序列長度。如3,1,2,6,4,5的最長上升子序列為1,2,4,5,故答案為4。
在問題一的基礎(chǔ)上,很容易想到如下解法。
(1)狀態(tài)定義:f[i]定義為到第i個數(shù)字為止,能獲得最長子序列長度。
(2)所求:f[n]。
(3)狀態(tài)轉(zhuǎn)移:顯然此時很難尋找到f[i]關(guān)于f[1…i-1]的遞推關(guān)系。
無法找到遞推關(guān)系是由于遞推時的大小關(guān)系需要第i個數(shù)與前面某個確定的數(shù)進(jìn)行比較,而原有的狀態(tài)定義無法得知哪些數(shù)字被選中,故無法直接進(jìn)行比較,帶著這個問題,容易想到新的解法。
(1)狀態(tài)定義:f[i]定義為到第i個數(shù)字為止,且第i個數(shù)必須為改子序列的最后一個數(shù)字時,所獲得的最長子序列的長度。
(2)所求:max(f[1…n])。
(3)狀態(tài)轉(zhuǎn)移:f[i] = max(f[j]) + 1|1 <= j <= i - 1,a[j] 該算法的時間復(fù)雜度為0(n2),空間復(fù)雜度為0(n)。 問題三:最長公共子序列問題。給定兩個長度為n的數(shù)字序列,求最長的公共子序列長度。如第一個數(shù)字序列為1,6,2,5,4,7,第二個數(shù)字序列為1,2,5,5,2,7,則最長的公共子序列為1,2,5,7,其長度為4。 順著問題二的思路,可以得到如下解法。 (1)狀態(tài)定義:f[i][j]定義為當(dāng)?shù)谝恍袛?shù)字取到第i個,第二行數(shù)字取到第j個時,所能得到的最長公共子序列長度,且第i個數(shù)字和第j個數(shù)字分別為所求子序列的最后一個數(shù)字(即這兩個數(shù)字必須取到)。 (2)所求:max(f[1…n][1…n])。 (3)狀態(tài)轉(zhuǎn)移: 該解法狀態(tài)總數(shù)共有n2個,每個狀態(tài)需要枚舉i和j前面所有的p和q,求解單個狀態(tài)需要的枚舉量為(i-1)*(j-1),其時間復(fù)雜度是0(n2),總共有n2個狀態(tài),故總的時間復(fù)雜度為0(n4),空間復(fù)雜度為0(n2)。該算法的瓶頸主要在于求解每個狀態(tài)都需要去枚舉前面所有的狀態(tài),下面我們嘗試使用另外一種狀態(tài)定義來開拓學(xué)生的思路。 (1)狀態(tài)定義:f[i][j]定義為當(dāng)?shù)谝恍袛?shù)字取到第i個,第二行數(shù)字取到第j個時,所能得到的最長子序列長度,且第i個數(shù)字和第j個數(shù)字不需要為所求子序列的最后一個數(shù)字(即這兩個數(shù)字取到與否都可以)。 (2)所求:f[n][n]。 (3)狀態(tài)轉(zhuǎn)移: 當(dāng)a[i]與b[j]相等時,其會對目標(biāo)值貢獻(xiàn)1,而a[i]與b[j]不相等時,顯然這兩個數(shù)字無法配對,故對f[i][j]而言,a[i]和b[j]中必有一個是多余的,故f[i][j]=max(f[i-1][j],f[i][j-1])。此時計算f[i][j]的時間復(fù)雜度為0(1),故總的時間復(fù)雜度為0(n2)。 經(jīng)過前面三個問題的鋪墊,我們對解決動態(tài)規(guī)劃的問題的模式與思考方式有了一定了解,在此基礎(chǔ)上,我們再開始對更抽象的背包問題進(jìn)行解答。 三、動態(tài)規(guī)劃算法在裝箱問題中的應(yīng)用 問題四:裝箱問題。有一個箱子容量為V(正整數(shù),0<=V<=20000),同時有n個物品(0 (1)狀態(tài)定義:f[i][j]定義為放到第i個物品為止,體積為j能否得到,1表示取到,0表示取不到。 (2)所求:V-max(j)|f[n][j]=1。 (3)狀態(tài)轉(zhuǎn)移:f[i][j]=f[i-1][j-a[i]]|f[i-1][j-a[i]]=1。 優(yōu)化一:觀察狀態(tài)轉(zhuǎn)移方程,f[i]僅與f[i-1]有關(guān),故我們可以采用滾動數(shù)組來優(yōu)化空間,f[flag][j]=f[!flag][j-a[i]]|f[!flag][j-a[i]]=1,一輪計算完畢后,flag=!flag,此時空間復(fù)雜度從0(n*V)優(yōu)化到0(V)。 優(yōu)化二:只需要從大到小枚舉j就可保證同一個物品不會被計算多次,f[j]=f[j-a[i]]|f[j-a[i]]=1。 拓展思考:如果每個物品有無窮多個呢? 四、“加一維”思想在動態(tài)規(guī)劃問題中的應(yīng)用 問題五:數(shù)塔問題加強(qiáng)版。在問題一的基礎(chǔ)上,增加一個條件:有且僅有一次機(jī)會可以將路徑中的一個數(shù)字獲得兩次,求最后路徑中路徑上數(shù)字的和的最大值。 顯然存在幾種明顯錯誤的貪心思想: (1)在問題一基礎(chǔ)上,對路徑中最大的數(shù)字使用額外取一次的機(jī)會。 可構(gòu)造如下反例: 1 1 ?8 14 8 8 經(jīng)過問題一的處理,會發(fā)現(xiàn)路徑為1-8-8,再對路徑中最大值8額外取一次,最后結(jié)果為25,而顯然存在更優(yōu)的答案為1-1-14,其最后的結(jié)果為30。 (2)有了上述反例,又嘗試進(jìn)行如下的貪心策略:將所有數(shù)字中最大的數(shù)字選定,再以這個數(shù)字為起點(diǎn)往上取到頂,往下取到最后一行,又可構(gòu)造反例如: 1 1 ? 10 11 10 10 按照貪心策略,其路徑為1-1-11,結(jié)果為24,而存在答案為1-10-10,31。 正確做法就是本文要提出的“加一維”解法,引導(dǎo)思考過程: (1)在不使用額外機(jī)會時,與問題一是完全一樣的。 (2)機(jī)會使用后,也與問題一是完全一樣的。 (3)每個數(shù)字都有使用該機(jī)會的可能性。 提出解法: (1)狀態(tài)定義:f[i][j][k]定義為取到第i行第j列時,機(jī)會的狀態(tài)是k時能獲得的目標(biāo)值最優(yōu)為多少,k為0表示機(jī)會已經(jīng)使用,k為1表示機(jī)會尚未使用。 (2)所求:max(f[n][1..n][0])。 (3)狀態(tài)轉(zhuǎn)移: 如果在第i行第j列時,機(jī)會依舊存在,則在此之前其機(jī)會也必須存在故遞推式為:f[i][j][1]=max(f[i-1][j-1][1],f[i-1][j][1])+a[i][j]。 如果機(jī)會已經(jīng)被使用,則f[i][j][0]有兩種可能性:在此之前機(jī)會已經(jīng)被使用max(f[i-1][j-1][0],f[i-1][j][0])+a[i][j]或者對a[i][j]使用取兩次的機(jī)會max(f[i-1][j-1][1],f[i-1][j][1])+2*a[i][j],我們只需在這兩種可能性中取最大值便可。 我們把加入該機(jī)會是否被使用的狀態(tài)作為新的一維,枚舉其轉(zhuǎn)移時的所有可能性,巧妙地解決了該問題,且時間復(fù)雜度和空間復(fù)雜度依舊和原問題同階。這種技巧也在大量的動態(tài)規(guī)劃問題中適用,當(dāng)我們無法很輕松地將“不可控的量”交代清楚時,可以將其狀態(tài)作為單獨(dú)的一維代入計算。 參考文獻(xiàn): [1]吳傳松.信息學(xué)奧賽中“動態(tài)規(guī)劃算法”的教學(xué)方法探究[J].中學(xué)理科園地,2008(3):11-13. [2]廖慧芬,邵小兵.動態(tài)規(guī)劃算法的原理及應(yīng)用[J].中國科技信息,2005(21):42.