国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從警犬訓(xùn)練角度辨析斯金納操作式條件反射理論中名詞的修正用法

2023-02-25 08:11周士兵翟純藝
中國工作犬業(yè) 2023年1期
關(guān)鍵詞:訓(xùn)導(dǎo)警犬懲罰

周士兵 翟純藝

條件反射理論是巴甫洛夫的高級神經(jīng)活動學(xué)說的核心內(nèi)容,指在一定條件下,外界刺激與有機(jī)體反應(yīng)之間建立起來的暫時神經(jīng)聯(lián)系。條件反射為后天形成,有經(jīng)典條件反射和操作式條件反射兩種形式,操作式條件反射亦稱“工具性條件反射”,是由美國行為主義心理學(xué)家斯金納于20 世紀(jì)30 年代在經(jīng)典條件反射的基礎(chǔ)上創(chuàng)立的理論。他為研究動物的學(xué)習(xí)行為,采用精確的測量習(xí)得反應(yīng)技術(shù),設(shè)計了一種由動物進(jìn)行操作活動的實(shí)驗(yàn)箱(通常稱斯金納箱),用來測定動物完成壓桿或按鍵活動的特定反應(yīng)。除了可訓(xùn)練大鼠,還可訓(xùn)練貓、家兔和獼猴等實(shí)驗(yàn)動物進(jìn)行該項(xiàng)操作。

操作式條件反射理論在心理學(xué)或教育學(xué)中有較多的研究和廣泛的應(yīng)用,在警犬訓(xùn)練中也常應(yīng)用此基本原理。通過警犬訓(xùn)練實(shí)踐發(fā)現(xiàn),斯金納操作式條件反射中相關(guān)的中文名詞,存在含義混淆或使用混亂的問題,這會對研究和使用這一理論的訓(xùn)導(dǎo)員或心理學(xué)研究者造成誤導(dǎo),本文對此進(jìn)行辨析和修正。

一、在警犬訓(xùn)練中,犬感受到的兩種刺激

在警犬訓(xùn)練中,訓(xùn)導(dǎo)員、助訓(xùn)員或環(huán)境作用于犬的刺激,從犬的體驗(yàn)及好惡角度來考慮,可以將刺激劃分為獎勵和懲罰。獎勵是犬喜歡的刺激,多指在特定情境下能使犬產(chǎn)生愉悅感的刺激,比如喂給犬喜歡的食物、拋給犬喜歡的玩具、讓犬到喜歡的區(qū)域玩耍等。懲罰是犬厭惡的刺激,多指在特定情境下能使犬產(chǎn)生疼痛感或恐懼感等負(fù)面情緒的刺激,比如使用電擊脖圈使犬感受到電刺激的疼痛、用硬木棒擊打犬的背脊或尾根部使其產(chǎn)生疼痛感等。犬有趨利避害的本能,在操作式條件反射形成過程中,將獎勵或懲罰作為犬某一動作的后果,會對某一動作的形成起到促進(jìn)或減弱的作用。

二、在警犬訓(xùn)練中,兩種刺激的使用方法與效果

在警犬訓(xùn)練中,建立條件反射時,較多的情況是由訓(xùn)導(dǎo)員或助訓(xùn)員等對警犬予以獎勵或懲罰。在某些特殊情況下,也可以將已經(jīng)施予犬的獎勵或懲罰撤銷,以達(dá)到訓(xùn)練目的。將其歸納起來,有以下四種情形:

(一)給予獎勵。在利用犬的食物本能訓(xùn)練犬吠叫時,訓(xùn)導(dǎo)員往往創(chuàng)設(shè)能使犬產(chǎn)生焦急情緒的情境,比如在犬舍門外向犬展示美味食物,犬往往因?yàn)榧庇诘玫绞澄锒a(chǎn)生在犬舍內(nèi)轉(zhuǎn)圈、扒門、向上躥跳或吠叫等動作,每當(dāng)犬吠叫時訓(xùn)導(dǎo)員就給予犬食物,經(jīng)過多次操作,犬處于相同情境時轉(zhuǎn)圈、扒門、向上躥跳的動作會減少,而吠叫的動作會更多地出現(xiàn),這是典型的操作式條件反射形成過程,給予獎勵增加了犬吠叫發(fā)生的概率,逐漸形成吠叫的條件反射。

(二)撤銷獎勵。在訓(xùn)練隨行過程中,訓(xùn)導(dǎo)員左手持食物小塊,一邊步行前進(jìn)一邊頻繁地喂飼犬,犬就會保持著尋食的抬頭姿態(tài)隨行,而當(dāng)訓(xùn)導(dǎo)員撤銷給予食物小塊的獎勵,犬的抬頭尋食狀態(tài)將逐漸減弱甚至消失,這符合操作式條件反射的基本原理,即無獎勵的支持使形成的條件反射消退。撤銷獎勵減少了犬抬頭的發(fā)生概率。

(三)給予懲罰。在訓(xùn)練犬搜爆示警能力期間,當(dāng)犬出現(xiàn)扒物品的動作時,訓(xùn)導(dǎo)員用硬棍擊打犬的爪子使其疼痛,經(jīng)過多次刺激后犬這種扒物品的動作會減少直至消失。給予懲罰減少了犬扒物品的發(fā)生概率。

(四)撤銷懲罰。在訓(xùn)練犬的銜取能力時,有一種不常用的方法,就是使用電擊脖圈給犬施予較強(qiáng)的電刺激,犬會因?yàn)樘弁炊鴴暝騺y咬,這時給犬一個銜取物品,當(dāng)犬突然間咬住物品時立即撤銷對犬的電擊,經(jīng)過多次重復(fù)后,犬會為防止受到電擊而主動地咬住銜取物品,從而形成銜取能力。撤銷電擊懲罰增加了犬銜取物品的發(fā)生概率。

綜上,給予或撤銷對犬的獎勵或懲罰,構(gòu)成了訓(xùn)練中的四種模式,且只有這四種形成操作式條件反射的模式,它們的效果包括兩類:給予獎勵和撤銷懲罰能增加某種行為的發(fā)生概率;撤銷獎勵和給予懲罰能減少某種行為的發(fā)生概率。

三、在警犬訓(xùn)練中,四種模式的兩類效果與操作式條件反射理論的對應(yīng)

斯金納操作式條件反射理論,按照目前通用譯法,它有四個相關(guān)的概念,分別是:正強(qiáng)化、懲罰、負(fù)強(qiáng)化和消退(或稱為“負(fù)懲罰”)。

在期金納的理論中,強(qiáng)化是一個基礎(chǔ)概念?!耙环N自發(fā)性的行為會有什么樣的結(jié)果?根據(jù)斯金納對行為的分析,最重要的結(jié)果便是強(qiáng)化。如果一個行為受到強(qiáng)化,它就可以得以維持和加強(qiáng),將來在類似的環(huán)境中再次出現(xiàn)此種行為的可能性增加?!?/p>

正強(qiáng)化,指給予一個愉快刺激,來增加行為發(fā)生的概率。應(yīng)用于人的行為常舉的例子是:你完成作業(yè),就可以看電視。呈現(xiàn)看電視這個愉快刺激,來增加完成作業(yè)行為的發(fā)生概率。這與前述的“給予獎勵”原理基本一致。

懲罰,呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等),來降低行為發(fā)生的概率。典型的例子是:你完不成作業(yè),就去打掃衛(wèi)生。呈現(xiàn)打掃衛(wèi)生這個厭惡刺激,來減少不完成作業(yè)行為的發(fā)生概率。這與前述的“給予懲罰”原理基本一致。

負(fù)強(qiáng)化,指撤銷一個厭惡刺激,來增加行為發(fā)生的概率。典型的例子是:你完成作業(yè),就不用打掃衛(wèi)生了。撤銷打掃衛(wèi)生這個厭惡刺激,來增加完成作業(yè)行為的發(fā)生概率。這與前述的“撤銷懲罰”原理基本一致。

消退(或稱為“負(fù)懲罰”),簡單說就是減掉獎勵或不予理睬,能使動作發(fā)生的概率減少。這與前述的“撤銷獎勵”類似。

四、操作式條件反射理論中混亂名詞的辨析

分析操作式條件反射原理中現(xiàn)有的名詞,結(jié)合將本文的二、三點(diǎn)進(jìn)行對比,可以發(fā)現(xiàn)在操作式條件反射理論中的名詞,存在幾個明顯的問題。

(一)“正強(qiáng)化”和“負(fù)強(qiáng)化”定義界定的標(biāo)準(zhǔn)不合邏輯。對比“正強(qiáng)化”和“負(fù)強(qiáng)化”的定義不難發(fā)現(xiàn):正強(qiáng)化和負(fù)強(qiáng)化的結(jié)果均為“增加行為發(fā)生的概率”,故可以理解為“強(qiáng)化”意指對某行為鞏固的效果。據(jù)此推論:假設(shè)“正”和“負(fù)”分別代表其前提,即分別代表“給予一個愉快刺激”中的“給予”和“撤銷一個厭惡刺激”中的“撤銷”,則兩種刺激中的“愉快刺激”和“厭惡刺激”均有意義但未做區(qū)別,邏輯上說不通;假設(shè)“正”和“負(fù)”分別代表其刺激的性質(zhì),即分別代表“給予一個愉快刺激”中的“愉快刺激”和“撤銷一個厭惡刺激”中的“厭惡刺激”,則兩種刺激中的“給予”和“撤銷”均有意義但未做區(qū)別,邏輯上也說不通。換言之,在“正強(qiáng)化”定義中使用一個“正”來指代“給予一個愉快刺激”中的“給予”和“愉快刺激”兩個要素,不合邏輯。

(二)“正強(qiáng)化”和“懲罰”不匹配。在操作式條件反射理論中“正強(qiáng)化”與“懲罰”通常作為一對相反的概念出現(xiàn),但其含義明顯不對等。正強(qiáng)化描述的是“給予一個愉快刺激,來增加行為發(fā)生的概率”,而懲罰描述的是“呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等),來降低行為發(fā)生的頻率”。在這里按照“正”表示的是“給予”,則“懲罰”一詞中沒有表示“給予或呈現(xiàn)”的字;假設(shè)“懲罰”表示“厭惡刺激”則對其“增加”或“減少”的不同效果未做區(qū)分。從字面也可以看出,這兩個名詞的組詞方式不對等,不構(gòu)成一對概念。造成這一問題的根源在于對一對名詞定義的標(biāo)準(zhǔn)不一致,原理論存在缺陷?;蛘邚牧硪粋€角度來說,根據(jù)操作式條件反射理論,在自發(fā)動作后出現(xiàn)某一正強(qiáng)化物時動作得到了加強(qiáng)稱為強(qiáng)化,同理在自發(fā)動作后出現(xiàn)某一負(fù)強(qiáng)化物時動作得到了減弱,為什么不稱為“弱化”呢?使用“懲罰”一詞在原理論中顯然將“撤除正強(qiáng)化物”這一過程替代了其對效果的描述,與“正強(qiáng)化”不對應(yīng)。

(三)“懲罰”和“負(fù)懲罰”(或稱為“消退”)的含義不對等。在原理中,“懲罰”定義為“呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等)來降低行為發(fā)生的頻率”,與中文里面偶爾出現(xiàn)的“負(fù)懲罰”的定義“減掉獎勵或不予理睬,能使動作發(fā)生的概率減少”相對比,如果按“懲罰”的定義將懲罰理解為“厭惡刺激”,則在“負(fù)懲罰”中并無“厭惡刺激”,故這一理解不正確;如果將“負(fù)懲罰”中的“負(fù)”理解為“減掉”,則在“懲罰”定義中默認(rèn)為不表述的“呈現(xiàn)”,此時對于“厭惡刺激”和“獎勵”則未做區(qū)別,這兩個定義仍不對等。此外,理論中對于“獎勵”這一名詞的回避,導(dǎo)致了“懲罰”這一名詞的無法配對和“負(fù)懲罰”這一非中文常見詞的被迫使用。

從上述這三對名詞的對比分析可以看出,雖然我們直譯了原文的名詞,并賦予他們特定的含義,但從邏輯和中文習(xí)慣的角度,這幾個名詞存在含義混亂、邏輯不通的問題。分析其根源,在操作式條件反射理論中,對名詞界定的標(biāo)準(zhǔn)不一致,同時在翻譯為中文的過程中,采用直譯的方法也使其含義不準(zhǔn)確。為明晰在警犬訓(xùn)練中的使用,不妨在符合基本理論的前提下,規(guī)范或重新界定各名詞,以方便在訓(xùn)練中使用,也建議在心理學(xué)和教育學(xué)中進(jìn)行修正。

五、操作式條件反射相關(guān)名詞修正后的用法

通過前述的分析,結(jié)合本文的前兩點(diǎn),我們可以將操作式條件反射中的各種要素,按照刺激的特性、操作方法以及對行為效果等,進(jìn)行更為簡化而準(zhǔn)確的定義和分類。

(一)犬或動物個體感受到的刺激包括兩種,即:獎勵與懲罰。獎勵是指犬喜歡的刺激,懲罰是指犬厭惡的刺激。在警犬訓(xùn)練中,訓(xùn)導(dǎo)員對犬施加刺激的方式包括兩種,即:施予和撤除,施予或給予刺激是常見情形,撤除、撤銷或減除的情況較少。對犬的訓(xùn)練操作包括:給予獎勵、撤除獎勵、給予懲罰、撤銷懲罰。在通常情況下,根據(jù)實(shí)際使用的情況,簡化給予獎勵稱為“獎勵”。同時,獎勵和懲罰在中文里是一對相反定義的詞。

(二)通過各種操作,對犬能力形成的效果定義為兩種,可以有兩種方案,一種是凡是使某種行為出現(xiàn)的概率增加的稱為“強(qiáng)化”,而使某種行為概率減少的稱為“弱化”,這又需要新引入“弱化”一詞;另一種即筆者主張的方案,即重新定義正強(qiáng)化和負(fù)強(qiáng)化?!皬?qiáng)化”的含義是使某一效果程度加劇,“正”“負(fù)”意指其效果的方向,“正”的含義是使某種行為增加,“負(fù)”的含義是使某種行為減少。導(dǎo)致“正強(qiáng)化”效果的操作,包括給予獎勵和撤銷懲罰,均是使某種行為發(fā)生的概率增加;導(dǎo)致“負(fù)強(qiáng)化”效果的操作,包括撤銷獎勵和給予懲罰。

這種重新界定的名詞,既能對應(yīng)原操作式條件反射的各種要素,又彌補(bǔ)了原理論存在的缺陷,還能將各名詞與中文本義貼近,符合中文習(xí)慣。此分析基于警犬訓(xùn)練,但是對于操作式條件反射相關(guān)名詞的剖析糾正,筆者認(rèn)為此觀點(diǎn)適用于動物行為學(xué),也適用于心理學(xué)和教育學(xué)范疇。

猜你喜歡
訓(xùn)導(dǎo)警犬懲罰
警犬是怎樣“煉”成的
黑子,對不起
神的懲罰
Jokes笑話
“研訓(xùn)導(dǎo)一體化”教師研修方式的實(shí)踐與探索
懲罰
警犬戈爾吉
警犬守護(hù)春運(yùn)路 每天工作12小時
警犬集體過生日
真正的懲罰等