劉 凡
江蘇省泰州市公安局刑偵支隊,江蘇 泰州 225300
論強(qiáng)化在警犬訓(xùn)練中的作用
劉 凡
江蘇省泰州市公安局刑偵支隊,江蘇 泰州 225300
在警犬訓(xùn)練過程中,強(qiáng)化既可以作為警犬日復(fù)一日的與自然環(huán)境和社會環(huán)境相互作用的結(jié)果自然發(fā)生,也可以作為改變警犬行為的矯正訓(xùn)練的一部分,通過人為的計劃而發(fā)生。強(qiáng)化的塑造和保持作用將會使警犬的個體優(yōu)勢更加鞏固和突出。同時在適當(dāng)?shù)臅r機(jī)利用強(qiáng)化的方法,使警犬訓(xùn)練的效果明顯提高。本文主要通過四個方面闡述強(qiáng)化在警犬訓(xùn)練中的作用。
強(qiáng)化;警犬訓(xùn)練;作用
許多科學(xué)家都對強(qiáng)化進(jìn)行過論述,如蘇爾譯——阿薩羅夫和邁耶等,他們對強(qiáng)化對人類行為構(gòu)成的自然影響和對多種人類行為影響所起的決定作用都有深刻、系統(tǒng)、全面的研究。但是,強(qiáng)化原理最初的建立是利用動物實(shí)驗(yàn)的結(jié)果,這就決定了它對警犬訓(xùn)練的適應(yīng)性。就警犬訓(xùn)練而言,強(qiáng)化的定義應(yīng)該是:緊隨著警犬的某一具體行為的發(fā)生,并會對這個行為將來在類似的環(huán)境中再次出現(xiàn)可能性加強(qiáng)的一個直接刺激結(jié)果。例如:在撲咬訓(xùn)練中,警犬吠叫使助訓(xùn)員逃跑,助訓(xùn)員逃跑是對犬的直接刺激,而助訓(xùn)員逃跑這一結(jié)果又直接強(qiáng)化了犬,會激發(fā)犬的兇猛性和對人的仇視性。
強(qiáng)化可分為負(fù)強(qiáng)化和正強(qiáng)化,它們都是經(jīng)警犬的行為結(jié)果出現(xiàn)的,都有增強(qiáng)警犬行為再次出現(xiàn)的可能性。二者之間的區(qū)別是:正強(qiáng)化是隨著警犬這個行為出現(xiàn)了刺激的增加或刺激強(qiáng)度的增加,而負(fù)強(qiáng)化是隨著警犬的這個行為出現(xiàn)了刺激的轉(zhuǎn)移或刺激強(qiáng)度的降低,其結(jié)果都是導(dǎo)致警犬的這個行為的增加。例如,當(dāng)警犬做出某一正確行為時,訓(xùn)導(dǎo)員給犬銜取物品的強(qiáng)化,就是對警犬這種行為的正強(qiáng)化;而在訓(xùn)練警犬搜索物品時,訓(xùn)導(dǎo)員將警犬急于獲得的物品假拋出去,就是對警犬迫切獲得物品的負(fù)強(qiáng)化。
無論是正強(qiáng)化還是負(fù)強(qiáng)化對警犬行為的形成和改變都起著至關(guān)重要的作用。對任何一種刺激,在我們還沒有觀察到它的效果之前,我們都不能對它起是正強(qiáng)化還是負(fù)強(qiáng)化給予簡單的判斷。同時,也不能以日常生活中狹隘的意思去理解強(qiáng)化的“正”和“負(fù)”,關(guān)鍵是依據(jù)強(qiáng)化的效果而言。對強(qiáng)化的正確把握與理解,利于警犬訓(xùn)導(dǎo)員在警犬訓(xùn)練中正確運(yùn)用強(qiáng)化的方法和手段,提高警犬訓(xùn)練的效率。
強(qiáng)化有兩種基本功能,一是使犬的某些良好行為長久保持;二是使犬的某些不良行為得以消除(即負(fù)強(qiáng)化),負(fù)強(qiáng)化強(qiáng)度不夠,犬的不良行為不但不會消除,反而還會發(fā)展成痼癖。例如當(dāng)犬咬牽引帶時,訓(xùn)導(dǎo)員敲擊犬嘴,想制止它咬牽引帶的行為,但由于敲擊力量小,不能使犬停止撕咬,這時犬可能認(rèn)為訓(xùn)導(dǎo)員是在鼓勵它,此時訓(xùn)導(dǎo)員對犬的負(fù)強(qiáng)化強(qiáng)度不夠,反而鼓勵了犬這種不良行為的發(fā)生。
從強(qiáng)化的兩個基本功能可以看出,強(qiáng)化在訓(xùn)練中的重要性。在我們訓(xùn)練過程中經(jīng)常對犬的不規(guī)范動作進(jìn)行糾正,過多的糾正時間上對犬是一種負(fù)強(qiáng)化,當(dāng)犬在訓(xùn)導(dǎo)員糾正后對犬不作任何獎勵,或者反復(fù)實(shí)施同一種刺激而絲毫沒有強(qiáng)化的意思,犬的反應(yīng)會消失,甚至變得被動,例如:我在訓(xùn)練犬隨行時,隨行過程中令犬“坐”,犬坐姿不正確,頭部靠里,此時,我對犬的不規(guī)范動作進(jìn)行糾正,方法是當(dāng)發(fā)出“靠”口令同時將犬臀部向左下側(cè)敲擊,這樣重復(fù)了幾次,當(dāng)隨行中再令犬“坐”時,犬馬上逃離我,那正是因?yàn)檫^多的糾正對犬實(shí)際上實(shí)施了負(fù)強(qiáng)化,而沒有對犬進(jìn)行獎勵強(qiáng)化。但這種犬的反應(yīng)的消失不會是持久的,犬產(chǎn)生了抑制,訓(xùn)導(dǎo)員可以更換訓(xùn)練地點(diǎn)、訓(xùn)練物品等,目的是使犬產(chǎn)生的抑制在較為緩和的環(huán)境中將抑制消退,前面所說的隨行訓(xùn)練中,訓(xùn)練實(shí)際上是給了犬的間接性負(fù)強(qiáng)化,我們可以通過在同一地點(diǎn)的長時間反復(fù)訓(xùn)練就能使原來的抑制消退。由此可見,訓(xùn)導(dǎo)員應(yīng)正確認(rèn)識和理解強(qiáng)化的重要性,并積極投入到實(shí)際訓(xùn)練中有效運(yùn)用。
警犬的行為發(fā)生與強(qiáng)化結(jié)果之間的時間間隔直接決定強(qiáng)化的最終效果,一個結(jié)果要成為有效的強(qiáng)化刺激,應(yīng)該在行為發(fā)生之后立即發(fā)生,如果反應(yīng)和結(jié)果之間間隔過長,那么強(qiáng)化也就不會產(chǎn)生效果。本人曾經(jīng)在訓(xùn)練犬鑒別時,由于訓(xùn)導(dǎo)員和助訓(xùn)員的原因,連續(xù)三次使犬在正確反應(yīng)后相隔3-5分鐘才獎勵,而獎勵時犬正在啃咬拖布,當(dāng)下一次帶犬進(jìn)入鑒別室時,犬對鑒別罐沒有興趣,只是亂興奮,當(dāng)本人令犬嗅嗅源后,犬不進(jìn)入形式,直接找拖布撕咬。由此可見,獎勵強(qiáng)化的時機(jī)對犬強(qiáng)化效果有著直接的影響。
強(qiáng)化的強(qiáng)度大小對警犬影響很大,當(dāng)犬進(jìn)行了大強(qiáng)度訓(xùn)練后,我們要選擇強(qiáng)化強(qiáng)度大的方法來進(jìn)行獎勵強(qiáng)化。例如在追蹤訓(xùn)練中,犬追蹤了很長距離,在大強(qiáng)度訓(xùn)練后,我們可以在終點(diǎn)放上犬最喜歡的物品,讓犬自己找到銜取,進(jìn)行直接獎勵,隨后扶拍犬或令犬吠叫,使其興奮再拋球,同時訓(xùn)導(dǎo)員發(fā)出“好”的口令,使犬在聽覺、皮膚感覺、視覺等方面得到滿足,那么犬在下一次追蹤訓(xùn)練中會保持積極性。例如,在犬按訓(xùn)導(dǎo)員口令指揮做出相應(yīng)的行為,而這一行為的條件反射十分鞏固了,我們就不必大強(qiáng)度的強(qiáng)化獎勵,只需用口令或面部表情等,使犬“明白”這一行為令主人滿意,是正確的就足夠了,同樣達(dá)到了強(qiáng)化的效果。
強(qiáng)化的方式?jīng)]有固定的模式,在不同的訓(xùn)練中視條件我們可以選擇不同的強(qiáng)化方式,例如在追蹤訓(xùn)練中,我們可以在跡線上布設(shè)犬喜歡的物品,讓犬在追蹤過程中聯(lián)系氣味直接找到物品,讓其自然直接地銜取,滿足犬的銜取占有欲,對犬是一種自然強(qiáng)化,這種強(qiáng)化很及時,能提高犬的工作積極性,又減少了犬的一些不良聯(lián)系。比如我們在追蹤過程中,適時時候拋球給犬,久而久之,犬會形成經(jīng)常抬頭看訓(xùn)導(dǎo)員,企盼訓(xùn)導(dǎo)員拋球這種不良聯(lián)系。又例如在隨行訓(xùn)練中,訓(xùn)導(dǎo)員不能經(jīng)常往前拋球進(jìn)行獎勵強(qiáng)化,這樣會使犬形成隨行超前的毛病,我們可以在保持隨行狀態(tài)情況下給犬食物獎勵,也可以突然帶犬跑動,進(jìn)行這種“爆發(fā)”式獎勵??傊?xùn)導(dǎo)員應(yīng)該在不同的訓(xùn)練中視情況而定,采取最有效的方式進(jìn)行獎勵強(qiáng)化,這一點(diǎn)尤為重要。
當(dāng)犬的反應(yīng)產(chǎn)生出結(jié)果,那么反應(yīng)與結(jié)果之間就存在著一致性。作為警犬訓(xùn)練,不僅要單純地形成反應(yīng)與結(jié)果的一致性,還要形成警犬的行為反應(yīng)與訓(xùn)導(dǎo)員的要求的一致性。例如在鑒別訓(xùn)練中,犬嗅嗅源進(jìn)入大形式,但犬由于某些因素沒有對氣味成功地分化,但是犬按訓(xùn)導(dǎo)員要求嗅嗅源,逐個嗅認(rèn),整個鑒別形式很好,此時我們也應(yīng)該給犬以獎勵強(qiáng)化,只是強(qiáng)化的強(qiáng)度可適當(dāng)把握。
犬與犬之間有著差異,我們的強(qiáng)化應(yīng)因犬而異,在訓(xùn)練中確定某一頭警犬用某種方式進(jìn)行獎勵強(qiáng)化也很重要。比如,犬食欲不強(qiáng)而銜取欲強(qiáng),在訓(xùn)練中我們選擇拋物品讓犬銜取的方法比給犬食物更有效。扶拍對許多犬是一種強(qiáng)化刺激,但對有些皮膚敏感的犬撫拍就會起到相反的作用,由于警犬存在個體差異,也就導(dǎo)致了警犬訓(xùn)練的復(fù)雜性,警犬訓(xùn)練在遵循普遍規(guī)律的同時,還要針對每頭犬的情況制定具體的訓(xùn)練計劃,包括強(qiáng)化手段,采取有效的刺激,不斷強(qiáng)化警犬做出的目標(biāo)行為,這時的強(qiáng)化帶有明顯的個體特征。
在警犬訓(xùn)練中,訓(xùn)導(dǎo)員應(yīng)靈活運(yùn)用強(qiáng)化手段,不拘于一種形式。應(yīng)根據(jù)條件刺激的強(qiáng)度來掌握強(qiáng)化刺激的強(qiáng)度,還要根據(jù)犬的反應(yīng)行為結(jié)果來運(yùn)用不同形式的強(qiáng)化手段,過度使用同一種強(qiáng)化方式,沒有新異刺激,會使犬產(chǎn)生超限抑制。
總之,強(qiáng)化是確保警犬的能力在訓(xùn)練中不斷提高并長久保持的一種有效訓(xùn)練手段,在警犬訓(xùn)練中起著極其重要的作用,大量的實(shí)踐和事實(shí)證明,訓(xùn)導(dǎo)員只要正確理解強(qiáng)化的概念,根據(jù)個體差異通過人為的計劃靈活運(yùn)用強(qiáng)化手段,同時在適當(dāng)?shù)臅r機(jī)利用強(qiáng)化的方法,將會使警犬訓(xùn)練的效果明顯提高。
[1]單軍.全國工作犬學(xué)術(shù)研討會論文集[M].北京:北京群眾出版社2001:67-77.
[2]南會林.犬行為原理[M].沈陽:東北大學(xué)出版社,2011:220-221.
D631.1
A
2095-4379-(2017)36-0246-02
劉凡(1981-),男,內(nèi)蒙古赤峰人,本科,畢業(yè)于中國刑事警察學(xué)院警犬技術(shù)系,江蘇省泰州市公安局刑偵支隊,助理工程師,研究方向:從事于警犬的訓(xùn)練與使用的研究以及警犬技術(shù)在國內(nèi)的發(fā)展。