從警犬訓(xùn)練角度辨析斯金納操作式條件反射理論中名詞的修正用法

2023-02-25 08:11周士兵翟純藝

中國工作犬業(yè) 2023年1期

周士兵翟純藝

條件反射理論是巴甫洛夫的高級神經(jīng)活動學(xué)說的核心內(nèi)容，指在一定條件下，外界刺激與有機(jī)體反應(yīng)之間建立起來的暫時神經(jīng)聯(lián)系。條件反射為后天形成，有經(jīng)典條件反射和操作式條件反射兩種形式，操作式條件反射亦稱“工具性條件反射”，是由美國行為主義心理學(xué)家斯金納于20 世紀(jì)30 年代在經(jīng)典條件反射的基礎(chǔ)上創(chuàng)立的理論。他為研究動物的學(xué)習(xí)行為，采用精確的測量習(xí)得反應(yīng)技術(shù)，設(shè)計了一種由動物進(jìn)行操作活動的實(shí)驗(yàn)箱（通常稱斯金納箱），用來測定動物完成壓桿或按鍵活動的特定反應(yīng)。除了可訓(xùn)練大鼠，還可訓(xùn)練貓、家兔和獼猴等實(shí)驗(yàn)動物進(jìn)行該項(xiàng)操作。

操作式條件反射理論在心理學(xué)或教育學(xué)中有較多的研究和廣泛的應(yīng)用，在警犬訓(xùn)練中也常應(yīng)用此基本原理。通過警犬訓(xùn)練實(shí)踐發(fā)現(xiàn)，斯金納操作式條件反射中相關(guān)的中文名詞，存在含義混淆或使用混亂的問題，這會對研究和使用這一理論的訓(xùn)導(dǎo)員或心理學(xué)研究者造成誤導(dǎo)，本文對此進(jìn)行辨析和修正。

一、在警犬訓(xùn)練中，犬感受到的兩種刺激

在警犬訓(xùn)練中，訓(xùn)導(dǎo)員、助訓(xùn)員或環(huán)境作用于犬的刺激，從犬的體驗(yàn)及好惡角度來考慮，可以將刺激劃分為獎勵和懲罰。獎勵是犬喜歡的刺激，多指在特定情境下能使犬產(chǎn)生愉悅感的刺激，比如喂給犬喜歡的食物、拋給犬喜歡的玩具、讓犬到喜歡的區(qū)域玩耍等。懲罰是犬厭惡的刺激，多指在特定情境下能使犬產(chǎn)生疼痛感或恐懼感等負(fù)面情緒的刺激，比如使用電擊脖圈使犬感受到電刺激的疼痛、用硬木棒擊打犬的背脊或尾根部使其產(chǎn)生疼痛感等。犬有趨利避害的本能，在操作式條件反射形成過程中，將獎勵或懲罰作為犬某一動作的后果，會對某一動作的形成起到促進(jìn)或減弱的作用。

二、在警犬訓(xùn)練中，兩種刺激的使用方法與效果

在警犬訓(xùn)練中，建立條件反射時，較多的情況是由訓(xùn)導(dǎo)員或助訓(xùn)員等對警犬予以獎勵或懲罰。在某些特殊情況下，也可以將已經(jīng)施予犬的獎勵或懲罰撤銷，以達(dá)到訓(xùn)練目的。將其歸納起來，有以下四種情形：

（一）給予獎勵。在利用犬的食物本能訓(xùn)練犬吠叫時，訓(xùn)導(dǎo)員往往創(chuàng)設(shè)能使犬產(chǎn)生焦急情緒的情境，比如在犬舍門外向犬展示美味食物，犬往往因?yàn)榧庇诘玫绞澄锒a(chǎn)生在犬舍內(nèi)轉(zhuǎn)圈、扒門、向上躥跳或吠叫等動作，每當(dāng)犬吠叫時訓(xùn)導(dǎo)員就給予犬食物，經(jīng)過多次操作，犬處于相同情境時轉(zhuǎn)圈、扒門、向上躥跳的動作會減少，而吠叫的動作會更多地出現(xiàn)，這是典型的操作式條件反射形成過程，給予獎勵增加了犬吠叫發(fā)生的概率，逐漸形成吠叫的條件反射。

（二）撤銷獎勵。在訓(xùn)練隨行過程中，訓(xùn)導(dǎo)員左手持食物小塊，一邊步行前進(jìn)一邊頻繁地喂飼犬，犬就會保持著尋食的抬頭姿態(tài)隨行，而當(dāng)訓(xùn)導(dǎo)員撤銷給予食物小塊的獎勵，犬的抬頭尋食狀態(tài)將逐漸減弱甚至消失，這符合操作式條件反射的基本原理，即無獎勵的支持使形成的條件反射消退。撤銷獎勵減少了犬抬頭的發(fā)生概率。

（三）給予懲罰。在訓(xùn)練犬搜爆示警能力期間，當(dāng)犬出現(xiàn)扒物品的動作時，訓(xùn)導(dǎo)員用硬棍擊打犬的爪子使其疼痛，經(jīng)過多次刺激后犬這種扒物品的動作會減少直至消失。給予懲罰減少了犬扒物品的發(fā)生概率。

（四）撤銷懲罰。在訓(xùn)練犬的銜取能力時，有一種不常用的方法，就是使用電擊脖圈給犬施予較強(qiáng)的電刺激，犬會因?yàn)樘弁炊鴴暝騺y咬，這時給犬一個銜取物品，當(dāng)犬突然間咬住物品時立即撤銷對犬的電擊，經(jīng)過多次重復(fù)后，犬會為防止受到電擊而主動地咬住銜取物品，從而形成銜取能力。撤銷電擊懲罰增加了犬銜取物品的發(fā)生概率。

綜上，給予或撤銷對犬的獎勵或懲罰，構(gòu)成了訓(xùn)練中的四種模式，且只有這四種形成操作式條件反射的模式，它們的效果包括兩類：給予獎勵和撤銷懲罰能增加某種行為的發(fā)生概率；撤銷獎勵和給予懲罰能減少某種行為的發(fā)生概率。

三、在警犬訓(xùn)練中，四種模式的兩類效果與操作式條件反射理論的對應(yīng)

斯金納操作式條件反射理論，按照目前通用譯法，它有四個相關(guān)的概念，分別是：正強(qiáng)化、懲罰、負(fù)強(qiáng)化和消退（或稱為“負(fù)懲罰”）。

在期金納的理論中，強(qiáng)化是一個基礎(chǔ)概念?！耙环N自發(fā)性的行為會有什么樣的結(jié)果？根據(jù)斯金納對行為的分析，最重要的結(jié)果便是強(qiáng)化。如果一個行為受到強(qiáng)化，它就可以得以維持和加強(qiáng)，將來在類似的環(huán)境中再次出現(xiàn)此種行為的可能性增加?！?/p>

正強(qiáng)化，指給予一個愉快刺激，來增加行為發(fā)生的概率。應(yīng)用于人的行為常舉的例子是：你完成作業(yè)，就可以看電視。呈現(xiàn)看電視這個愉快刺激，來增加完成作業(yè)行為的發(fā)生概率。這與前述的“給予獎勵”原理基本一致。

懲罰，呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等)，來降低行為發(fā)生的概率。典型的例子是：你完不成作業(yè)，就去打掃衛(wèi)生。呈現(xiàn)打掃衛(wèi)生這個厭惡刺激，來減少不完成作業(yè)行為的發(fā)生概率。這與前述的“給予懲罰”原理基本一致。

負(fù)強(qiáng)化，指撤銷一個厭惡刺激，來增加行為發(fā)生的概率。典型的例子是：你完成作業(yè)，就不用打掃衛(wèi)生了。撤銷打掃衛(wèi)生這個厭惡刺激，來增加完成作業(yè)行為的發(fā)生概率。這與前述的“撤銷懲罰”原理基本一致。

消退（或稱為“負(fù)懲罰”），簡單說就是減掉獎勵或不予理睬，能使動作發(fā)生的概率減少。這與前述的“撤銷獎勵”類似。

四、操作式條件反射理論中混亂名詞的辨析

分析操作式條件反射原理中現(xiàn)有的名詞，結(jié)合將本文的二、三點(diǎn)進(jìn)行對比，可以發(fā)現(xiàn)在操作式條件反射理論中的名詞，存在幾個明顯的問題。

（一）“正強(qiáng)化”和“負(fù)強(qiáng)化”定義界定的標(biāo)準(zhǔn)不合邏輯。對比“正強(qiáng)化”和“負(fù)強(qiáng)化”的定義不難發(fā)現(xiàn)：正強(qiáng)化和負(fù)強(qiáng)化的結(jié)果均為“增加行為發(fā)生的概率”，故可以理解為“強(qiáng)化”意指對某行為鞏固的效果。據(jù)此推論：假設(shè)“正”和“負(fù)”分別代表其前提，即分別代表“給予一個愉快刺激”中的“給予”和“撤銷一個厭惡刺激”中的“撤銷”，則兩種刺激中的“愉快刺激”和“厭惡刺激”均有意義但未做區(qū)別，邏輯上說不通；假設(shè)“正”和“負(fù)”分別代表其刺激的性質(zhì)，即分別代表“給予一個愉快刺激”中的“愉快刺激”和“撤銷一個厭惡刺激”中的“厭惡刺激”，則兩種刺激中的“給予”和“撤銷”均有意義但未做區(qū)別，邏輯上也說不通。換言之，在“正強(qiáng)化”定義中使用一個“正”來指代“給予一個愉快刺激”中的“給予”和“愉快刺激”兩個要素，不合邏輯。

（二）“正強(qiáng)化”和“懲罰”不匹配。在操作式條件反射理論中“正強(qiáng)化”與“懲罰”通常作為一對相反的概念出現(xiàn)，但其含義明顯不對等。正強(qiáng)化描述的是“給予一個愉快刺激，來增加行為發(fā)生的概率”，而懲罰描述的是“呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等)，來降低行為發(fā)生的頻率”。在這里按照“正”表示的是“給予”，則“懲罰”一詞中沒有表示“給予或呈現(xiàn)”的字；假設(shè)“懲罰”表示“厭惡刺激”則對其“增加”或“減少”的不同效果未做區(qū)分。從字面也可以看出，這兩個名詞的組詞方式不對等，不構(gòu)成一對概念。造成這一問題的根源在于對一對名詞定義的標(biāo)準(zhǔn)不一致，原理論存在缺陷?；蛘邚牧硪粋€角度來說，根據(jù)操作式條件反射理論，在自發(fā)動作后出現(xiàn)某一正強(qiáng)化物時動作得到了加強(qiáng)稱為強(qiáng)化，同理在自發(fā)動作后出現(xiàn)某一負(fù)強(qiáng)化物時動作得到了減弱，為什么不稱為“弱化”呢？使用“懲罰”一詞在原理論中顯然將“撤除正強(qiáng)化物”這一過程替代了其對效果的描述，與“正強(qiáng)化”不對應(yīng)。

（三）“懲罰”和“負(fù)懲罰”（或稱為“消退”）的含義不對等。在原理中，“懲罰”定義為“呈現(xiàn)一個厭惡刺激(如體罰、譴責(zé)等)來降低行為發(fā)生的頻率”，與中文里面偶爾出現(xiàn)的“負(fù)懲罰”的定義“減掉獎勵或不予理睬，能使動作發(fā)生的概率減少”相對比，如果按“懲罰”的定義將懲罰理解為“厭惡刺激”，則在“負(fù)懲罰”中并無“厭惡刺激”，故這一理解不正確；如果將“負(fù)懲罰”中的“負(fù)”理解為“減掉”，則在“懲罰”定義中默認(rèn)為不表述的“呈現(xiàn)”，此時對于“厭惡刺激”和“獎勵”則未做區(qū)別，這兩個定義仍不對等。此外，理論中對于“獎勵”這一名詞的回避，導(dǎo)致了“懲罰”這一名詞的無法配對和“負(fù)懲罰”這一非中文常見詞的被迫使用。

從上述這三對名詞的對比分析可以看出，雖然我們直譯了原文的名詞，并賦予他們特定的含義，但從邏輯和中文習(xí)慣的角度，這幾個名詞存在含義混亂、邏輯不通的問題。分析其根源，在操作式條件反射理論中，對名詞界定的標(biāo)準(zhǔn)不一致，同時在翻譯為中文的過程中，采用直譯的方法也使其含義不準(zhǔn)確。為明晰在警犬訓(xùn)練中的使用，不妨在符合基本理論的前提下，規(guī)范或重新界定各名詞，以方便在訓(xùn)練中使用，也建議在心理學(xué)和教育學(xué)中進(jìn)行修正。

五、操作式條件反射相關(guān)名詞修正后的用法

通過前述的分析，結(jié)合本文的前兩點(diǎn)，我們可以將操作式條件反射中的各種要素，按照刺激的特性、操作方法以及對行為效果等，進(jìn)行更為簡化而準(zhǔn)確的定義和分類。

（一）犬或動物個體感受到的刺激包括兩種，即：獎勵與懲罰。獎勵是指犬喜歡的刺激，懲罰是指犬厭惡的刺激。在警犬訓(xùn)練中，訓(xùn)導(dǎo)員對犬施加刺激的方式包括兩種，即：施予和撤除，施予或給予刺激是常見情形，撤除、撤銷或減除的情況較少。對犬的訓(xùn)練操作包括：給予獎勵、撤除獎勵、給予懲罰、撤銷懲罰。在通常情況下，根據(jù)實(shí)際使用的情況，簡化給予獎勵稱為“獎勵”。同時，獎勵和懲罰在中文里是一對相反定義的詞。

（二）通過各種操作，對犬能力形成的效果定義為兩種，可以有兩種方案，一種是凡是使某種行為出現(xiàn)的概率增加的稱為“強(qiáng)化”，而使某種行為概率減少的稱為“弱化”，這又需要新引入“弱化”一詞；另一種即筆者主張的方案，即重新定義正強(qiáng)化和負(fù)強(qiáng)化?！皬?qiáng)化”的含義是使某一效果程度加劇，“正”“負(fù)”意指其效果的方向，“正”的含義是使某種行為增加，“負(fù)”的含義是使某種行為減少。導(dǎo)致“正強(qiáng)化”效果的操作，包括給予獎勵和撤銷懲罰，均是使某種行為發(fā)生的概率增加；導(dǎo)致“負(fù)強(qiáng)化”效果的操作，包括撤銷獎勵和給予懲罰。

這種重新界定的名詞，既能對應(yīng)原操作式條件反射的各種要素，又彌補(bǔ)了原理論存在的缺陷，還能將各名詞與中文本義貼近，符合中文習(xí)慣。此分析基于警犬訓(xùn)練，但是對于操作式條件反射相關(guān)名詞的剖析糾正，筆者認(rèn)為此觀點(diǎn)適用于動物行為學(xué)，也適用于心理學(xué)和教育學(xué)范疇。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

從警犬訓(xùn)練角度辨析斯金納操作式條件反射理論中名詞的修正用法

一、在警犬訓(xùn)練中，犬感受到的兩種刺激

二、在警犬訓(xùn)練中，兩種刺激的使用方法與效果

三、在警犬訓(xùn)練中，四種模式的兩類效果與操作式條件反射理論的對應(yīng)

四、操作式條件反射理論中混亂名詞的辨析

五、操作式條件反射相關(guān)名詞修正后的用法

一、在警犬訓(xùn)練中，犬感受到的兩種刺激

二、在警犬訓(xùn)練中，兩種刺激的使用方法與效果

三、在警犬訓(xùn)練中，四種模式的兩類效果與操作式條件反射理論的對應(yīng)

四、操作式條件反射理論中混亂名詞的辨析