黃睿紅
(北京師范大學 國際中文教育學院,北京 100875)
感知(perception)與產(chǎn)出(production)是第二語言語音習得研究中的關(guān)鍵問題,也是目前語音學領(lǐng)域研究的熱點之一。感知和產(chǎn)出是語音鏈的重要組成部分,對其的研究可以粗略分為三大類:一是語音感知;二是語音產(chǎn)出;三是語音感知與產(chǎn)出之間的關(guān)系。
20 世紀70 年代,范疇感知,即識別(identification)和區(qū)分(discrimination)連續(xù)變化的語音音段邊界(phonetic boundary),在幼兒語音習得領(lǐng)域研究得到廣泛開展。20 世紀80 年代,二語習得領(lǐng)域的語音學家,如Strange、Flege、Kuhl 和Best 等設(shè)計了針對成年人二語語音習得的實證研究,試圖探尋成年學習者對非母語語音的感知情況并找到科學合理的解釋。進入21 世紀,中國國內(nèi)的學者翻譯并總結(jié)了Flege 等語音學家關(guān)于二語語音感知與產(chǎn)出方面的理論和模型,并結(jié)合理論開展?jié)h語二語習得中感知與產(chǎn)出方面的研究[1]。
二語語音產(chǎn)出受到學習者母語語音系統(tǒng)的深刻影響。語音產(chǎn)出是發(fā)音產(chǎn)生的聽覺和聲學結(jié)果,也是語言加工的外在表現(xiàn)形式[2]。語音產(chǎn)出是從模仿開始并通過積累經(jīng)驗在語言學、生理學和聲學層面感知和產(chǎn)出語音[3]。Flege 通過實證研究發(fā)現(xiàn)二語語音產(chǎn)出存在等值匹配 (Equivalence Classification)模式,即學習者總是把二語語音中的相似音素(Similar Phoneme)歸入母語某個語音范疇中[4]。
感知與產(chǎn)出領(lǐng)域主要有以下四種理論模型。母語磁吸模型(Native Language Magnet,NLM)認為母語者腦中存儲著對某一個音的感知形式。二語語音中的某個音與學習者母語系統(tǒng)中的相似音感知效果越相近,學習者將這個音與母語中相似音分開的難度越大[5]。Best 提出的感知同化模型(Perceptual Assimilation Model,PAM) 認為學習者傾向于把二語語音范疇歸類到與其發(fā)音相似的母語語音范疇[6]。Strange 提出的自動選擇感知模型(Automatic Selective Perception,ASP) 認為語音行為反映學習者對聲學信息的選擇和整合,學習者對二語和母語的聽覺能力并不能決定其二語語音行為[7]。Flege 于1995 年提出了語音學習模型(Speech Learning Model,SLM),并認為二語語音學習基本是從學習者的母語范疇開始的。該模型認為,二語語音感知先于產(chǎn)出,且感知能力會極大地影響產(chǎn)出能力[8]。
利用WOS 的SCI-EXPANDED、SSCI、CPCI-S、CPCI-SSH 五大引文庫對2012—2022 年期間以TS=“perception” and “production”為主題詞的文獻進行高級檢索,文獻類型設(shè)置為“文章(article)”,文獻出版時間設(shè)定為“2012—2022 年”,得到有效文獻17358 篇。通過WOS 類別篩選保留“l(fā)inguistics”“psychology” “psychology experimental” “audiology speech language pathology” “neurosciences” “l(fā)anguage linguistics”“acoustics”8 個與語言學相關(guān)的類別,剔除“agriculture”“business management”等與語言學無關(guān)的類別,從WOS 導出1627 篇文獻的全記錄txt 文件。利用Cite Space 軟件自動去重功能,最終得到1564 篇文獻。這樣的文獻獲取方式和文獻篩選方法能較好地平衡總文獻的查全率和查準率,保證基礎(chǔ)數(shù)據(jù)的代表性和權(quán)威性。
Cite Space 軟件是由美國德雷克塞爾大學信息科學與技術(shù)學院和大連理工大學WISE 實驗室聯(lián)合開發(fā)的信息可視化軟件,可以測量和分析研究數(shù)據(jù),展示知識圖譜可視化研究領(lǐng)域的研究趨勢和合作情況[9]。本文利用Cite Space 軟件,通過對研究國家(地區(qū))、研究作者、研究機構(gòu)、關(guān)鍵詞、關(guān)鍵詞聚類及關(guān)鍵詞突現(xiàn)的分析,總結(jié)了國外語言學領(lǐng)域感知與產(chǎn)出研究的研究熱點和研究趨勢。
數(shù)據(jù)導入Cite Space 5.8.R3,軟件參數(shù)設(shè)置如下:時間區(qū)域(Time Slicing)為“2012 年1 月—2022年12 月”,時間切片(Year Per Slice)為“1”,節(jié)點類型(node types)分別為“作者(author)”“國家(country)”“機構(gòu)(institution)”“關(guān)鍵詞(keyword)”。
利用WOS 網(wǎng)站自帶的引文分析功能對1564篇文獻及其被引頻次進行統(tǒng)計分析,探究國外感知與產(chǎn)出研究的基本發(fā)展情況。經(jīng)分析,2012—2022年國外感知與產(chǎn)出研究的文獻數(shù)量在2022 年前一直保持穩(wěn)定的數(shù)量,大約每年有140—160 篇文章產(chǎn)出,研究文獻年產(chǎn)出較為穩(wěn)定,說明感知與產(chǎn)出領(lǐng)域的研究發(fā)展平穩(wěn)。感知與產(chǎn)出領(lǐng)域的文獻被引頻次逐年上升,在2020 年后曲線增陡,增速加快,說明語言學領(lǐng)域感知與產(chǎn)出研究熱度逐步升高。由于在檢索時文獻發(fā)表時間限定在2022 年6 月30日前,所以2022 年的發(fā)文量為平均值的一半左右,符合事物發(fā)展的普遍規(guī)律。
1.研究國家(地區(qū))分布
通過對研究所在的國家(地區(qū))進行文獻計量,可以明確國外對感知與產(chǎn)出研究的地域空間分布,從而分析出不同國家(地區(qū))在該領(lǐng)域的關(guān)注度和貢獻度。首先將分析對象設(shè)定為“國家(地區(qū))”,在Cite Space 軟件中的Node Types 界面選取“country”,經(jīng)數(shù)據(jù)處理分析得到國外感知與產(chǎn)出研究的國家(地區(qū))可視化圖譜。國外感知與產(chǎn)出研究的國家(地區(qū))可視化圖譜中共有節(jié)點74 個,連線65條,網(wǎng)絡(luò)密度0.0241。以上數(shù)據(jù)說明感知與產(chǎn)出的相關(guān)研究共涉及74 個國家(地區(qū)),這些國家和地區(qū)之間的研究互動過65 次,總體合作程度不高。目前國家(地區(qū))間的合作互動以美國為中心,英國、加拿大、德國等國家(地區(qū))之間的合作居于次位。
在可視化圖譜中,中介中心性(Centrality)表示相同節(jié)點在某領(lǐng)域當中的中介作用,凸顯節(jié)點在結(jié)構(gòu)中的重要程度。中介中心性數(shù)值>0.1 即說明該節(jié)點的影響力較強。突現(xiàn)性(Burst)數(shù)值通過突增算法得出,突現(xiàn)性高說明未來具有爆發(fā)力和創(chuàng)新性。Sigma 值由公式Sigma=(Centrality+1)* Burstness(突現(xiàn)指數(shù))得出。Sigma 值可以用來識別創(chuàng)新性文獻或者創(chuàng)新性主題。
由表1 可以得知,2012—2020 年美國、加拿大、英國、德國和法國占據(jù)了國外有關(guān)感知與產(chǎn)出研究的文獻總量排名的前五位。作為語音學領(lǐng)域的熱點研究,感知與產(chǎn)出研究在各國研究的規(guī)模與國家(地區(qū))的發(fā)展水平密切相關(guān)。
表1 2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出領(lǐng)域研究國家(地區(qū))中心性分布表
位列第七的中國發(fā)文量85,中心度為0.01,影響力與美國、英國還有一定差距,但中國的發(fā)文突現(xiàn)性為4.91,位列第一,Sigma 為1.04,體現(xiàn)中國在感知與產(chǎn)出方面的研究勢頭正猛,研究潛力大,未來應(yīng)加強國際間的學術(shù)交流合作,提升我國在感知與產(chǎn)出研究領(lǐng)域的學術(shù)影響力。
2.研究作者分布
核心作者的可視化分布可以幫助我們了解該研究領(lǐng)域內(nèi)主要研究者狀況。Cite Space 結(jié)合作者發(fā)文數(shù)量與引用率,在知識圖譜中突顯具有高影響力的作者。
在Cite Space 軟件中,選取節(jié)點類型為 “作者”,時間跨度依舊設(shè)定為“2012—2022 年”,單個時間區(qū)分長度為“1 年”,節(jié)點條件(Threshold)設(shè)置被引頻次為“5 以上”,得到2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出領(lǐng)域研究作者被引頻次共現(xiàn)圖。研究發(fā)現(xiàn)該領(lǐng)域內(nèi)有一定量的研究者合作發(fā)文,高頻次作者中有一定比例的作者形成了合作網(wǎng)絡(luò),但其余的多數(shù)研究者仍以獨立發(fā)文為主,研究作者呈現(xiàn)出明顯的分散狀態(tài)。
據(jù)表2(發(fā)文量≥6 篇)的研究作者信息可見,2012—2022 年國外感知與產(chǎn)出領(lǐng)域排名前五的作者為 Katherine Demuth、Barbara Tillmann、Lucie Menard、Holger Mitterer 和Benjamin Munson。其中Katherine Demuth 和Barbara Tillmann 發(fā)文數(shù)量最多,為8 篇,引用率也居高位次。
表2 2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出領(lǐng)域發(fā)文量≥6 篇的作者信息
Katherine Demuth 發(fā)現(xiàn)在澳大利亞英語母語兒童中,閉音/l/(peel)的掌握要比起始音/l/(Leap)晚,兒童對起始音/l/的產(chǎn)生和感知的差異與生理和語音發(fā)展都有關(guān)[10]。Barbara Tillmann 研究音樂和語言認知研究的相似性,認為音樂認知研究為理解語言加工、語音感知與產(chǎn)出以及其他結(jié)構(gòu)化刺激加工提供了啟示。Lucie Menard 等研究了先天性視覺障礙對成人語音產(chǎn)出的影響,在正常和擾動(在唇間插入25mm 直徑管道)條件下讓視力正常者和盲人進行了法語元音/u/的發(fā)音,雖然所有被試在受干擾的情況下都將舌頭后移,但盲人更多地修改了舌形參數(shù)[11]。Holger Mitterer 通過眼動實驗發(fā)現(xiàn)荷蘭語中擦音在早期就被感知學習改變,進一步說明感知學習影響語音加工的早期階段[12]。Benjamin Munson用視覺模擬刻度(VAS)評價兒童自然產(chǎn)生的/s/-/θ/、/t/-/k/和/d/-/ɡ/這三個目標音在單詞開頭的位置,并考察了有經(jīng)驗的言語病理學家(SLPs)與沒有經(jīng)驗的人在感知兒童語音細節(jié)方面的不同,證明有言語病理學工作經(jīng)驗的人會更好地感知兒童說話時的語音細節(jié)[13]。
3.研究機構(gòu)分布
感知與產(chǎn)出研究領(lǐng)域的研究機構(gòu)分布圖譜中包括307 個節(jié)點,508 條連線,網(wǎng)絡(luò)密度為0.0108。據(jù)表3 信息可見,在國外感知與產(chǎn)出領(lǐng)域中高等院校是研究主力,其中麥吉爾大學(McGill Univ)、英國倫敦大學(UCL)、哈斯金斯實驗室(Haskins Labs Inc)、蒙特利爾大學(Montreal University)是核心研究機構(gòu)。麥吉爾大學發(fā)文數(shù)量為42 篇,居于首位。英國倫敦大學緊隨其后,發(fā)文40 篇,且具有高中介中心度(Centrality=0.24),英國倫敦大學與蒙特利爾大學研究合作密切,蒙特利爾大學發(fā)文32 篇,位列第四。位列第三的是美國耶魯大學的哈斯金斯實驗室,發(fā)文38 篇。表3 顯示,拉德堡德大學(Rad-boud Univ Nijmegen, Burst=3.17, Sigma=1.33)、法國國家科學研究中心 (CNRS, Burst=2.7, Sigma=1.22) 和麥考瑞大學 (Macquarie Univ, Burst=3.1,Sigma=1.18) 在感知與產(chǎn)出領(lǐng)域具有高創(chuàng)新性,2012 年至2022 年的相關(guān)發(fā)文數(shù)量突增,具有極高的研究潛力。
表3 2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出研究的研究機構(gòu)分布表(前10)
1.研究前沿分析
Cite Space 通過詞頻統(tǒng)計、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞聚類,聚焦某一領(lǐng)域的研究熱點。詞頻分析方法就是通過在文獻信息中提取能夠表達文獻核心內(nèi)容的關(guān)鍵詞或主題詞頻次的高低分布,來研究該領(lǐng)域發(fā)展動向和研究熱點的方法。關(guān)鍵詞聚類則是對文獻主要關(guān)鍵詞的高度凝練與概括,對文獻的關(guān)鍵詞進行詞頻分析后,找出頻率相對較高的關(guān)鍵詞聚類成主題詞,這在一定程度上可反映該領(lǐng)域形成了哪幾個研究類團。節(jié)點的大小與關(guān)鍵詞出現(xiàn)的頻次成正比,各節(jié)點間的連線代表不同關(guān)鍵詞之間的共現(xiàn)關(guān)系,關(guān)鍵詞之間共現(xiàn)關(guān)系的強度由連線的粗細反映[14]。
通過Cite Space 進行詞頻和關(guān)鍵詞聚類分析后,可以得到國外感知與產(chǎn)出研究的關(guān)鍵詞聚類知識圖譜,圖譜中N=184,E=263,網(wǎng)絡(luò)密度為0.0156,每個時間段排在前50 的文獻中一共包括了184 個關(guān)鍵詞,圖譜共有263 條連線?,F(xiàn)將頻次排名前20的關(guān)鍵詞制成表4。
表4 2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出研究文獻關(guān)鍵詞排名(按頻次)
通過表4 可知,國外感知與產(chǎn)出研究領(lǐng)域中出現(xiàn)頻次最高的詞是“perception”,一共出現(xiàn)588 次。高頻詞反映出以“perception”為中心的其他關(guān)鍵詞節(jié)點還有“l(fā)anguage”“speech”“perception”“English”“acquisition” “discrimination” “brain” “recognition”“children”“FMRI”“frequency”等。國外感知與產(chǎn)出領(lǐng)域研究以感知研究為主,且對英語學習的研究數(shù)量較多。研究角度多聚焦于習得、認知、表征、可理解度、人腦語音感知和產(chǎn)出的機制神經(jīng)等。研究理論多采用感知與產(chǎn)出方面的經(jīng)典理論模型,如SLM、PAM、NLM 等。近十年神經(jīng)語言學研究技術(shù)FMRI 是感知產(chǎn)出領(lǐng)域熱門的研究方法。在被試群體方面,針對兒童的語音感知和產(chǎn)出研究較多。
突現(xiàn)是指短時間內(nèi)突然增長或者頻次明顯增加的關(guān)鍵詞。Cites Space 的突變檢測計算可以檢測一個學科內(nèi)研究興趣的驟變程度,反映研究前沿的時間變化規(guī)律和演化路徑。結(jié)合突現(xiàn)詞和關(guān)鍵詞,可以進行以下分析。第一,鏡像神經(jīng)元(mirror neuron)、基地神經(jīng)節(jié)(basal ganglia)、前運動皮質(zhì)(premotor cortex)等關(guān)鍵詞的突現(xiàn)表明近年來感知與產(chǎn)出領(lǐng)域神經(jīng)科學、腦科學、語音學習等相結(jié)合的研究趨勢。第二,語音知識和詞匯加工之間的關(guān)系也受到研究者們的關(guān)注,語音短時記憶在詞匯加工上發(fā)揮著重要作用。此外,許多研究發(fā)現(xiàn),影響語言加工的因素,如經(jīng)驗 (experience)、短期記憶(short term memory)等會產(chǎn)生個人差異(individual difference),個人差異研究受到許多學者的關(guān)注[15]。
2.研究熱點分析
采用Cite Space 對關(guān)鍵詞進行聚類,采用對數(shù)似然率算法,通過提取文獻的關(guān)鍵詞對聚類進行命名。Cite Space 依據(jù)網(wǎng)絡(luò)結(jié)構(gòu)和聚類的清晰度,提供了模塊值(Q 值)和平均輪廓值(S 值)兩個指標。聚類的模塊值可反映網(wǎng)絡(luò)的模塊度。該值越大,表明網(wǎng)絡(luò)的聚類效果越好。Q 值一般在[0,1)區(qū)間內(nèi),Q>0.3 就意味著劃分出來的社團結(jié)構(gòu)是顯著的。聚類的平均輪廓值可反映網(wǎng)絡(luò)同質(zhì)性的高低,該值越接近1 說明網(wǎng)絡(luò)的同質(zhì)性越高。當S 值在0.5 以上,一般認為聚類是合理的,若在0.7 時,聚類是高效率的、令人信服的。
此次共得到了46 個聚類,篩選出的前8 個聚類(聚類大?。?0)分別為“intelligibility(可理解度)”“speech(語音)”“eeg(腦電圖)”“fmri(功能性磁共振成像)”“voice onset time (發(fā)音起始時間,VOT)”“l(fā)anguage(語言)”“English(英語)”“extended bandwidth(頻帶擴展)”。
由表6 可見,本次共有8 個聚類生成。聚類0的標簽是“可理解度”,指說話者的言語被實際理解的程度[16]。近年來,可理解度是國外語音教學的研究熱點,相關(guān)研究數(shù)量快速增加[17-21]。聚類1 的標簽是“語音”。在此聚類下,感知、韻律、可預(yù)測性是重要的下一級標簽。2012 年至2022 年間,韻律及其可預(yù)測性是語音感知領(lǐng)域研究的熱點。聚類2 和聚類3 的標簽分別是“eeg”和“fmri”。這反映了近十年的研究熱點是將語音研究與腦科學和核磁共振技術(shù)結(jié)合,探索人類語音習得的神經(jīng)機制。聚類4 以“發(fā)音起始時間(VOT)”為標簽。在語音產(chǎn)出領(lǐng)域,塞音的研究最為廣泛,VOT 是塞音最突出的聲學特征。近十年圍繞VOT 開展的研究多聚焦于音韻發(fā)展和語言老化等,其中針對西班牙語的研究數(shù)量較多。
表6 2012—2022 年WOS 數(shù)據(jù)庫中感知與產(chǎn)出研究關(guān)鍵詞聚類(聚類大小>10)
聚類5 和聚類6 的標簽分別為“語言”和“英語”,主要包括音韻編碼(phonological encoding)、音韻相似性(phonological similarity)、音節(jié)重量(syllable weight)、聲學線索(acoustic cue)和音位序列頻率(phonotactic probability)等。
聚類7 標簽為“頻帶擴展”。在此聚類中,語音發(fā)展(speech development)、聲學特征(acoustic characteristics)突出。頻帶擴展在不改變信源編碼和網(wǎng)絡(luò)傳輸?shù)那疤嵯?,在解碼重碼信號中人為添加高頻成分,能有效地增強音頻。隨著對聲學感知研究的深入,人們發(fā)現(xiàn)佩戴具有頻帶擴展屬性的助聽器可以幫助聽障兒童聽到聲音。
語音感知與產(chǎn)出領(lǐng)域跨學科研究趨勢愈加明顯。隨著語言學領(lǐng)域技術(shù)的飛速發(fā)展,越來越多的實驗設(shè)備和實驗方法被引入語音學領(lǐng)域。眼動實驗研究中,眼動儀可以同時追蹤被試的閱讀路徑和朗讀錄音。神經(jīng)語言學領(lǐng)域的實驗設(shè)備如腦電圖(EEG)、腦磁圖(MEG)、功能性磁共振成像(fMRI)、功能性近紅外光譜技術(shù)(fNIRS)等技術(shù)也應(yīng)用于語音感知方面的實驗中。
據(jù)本文分析可得,從2012 到2022 年國外感知與產(chǎn)出領(lǐng)域研究發(fā)展迅速,研究論文數(shù)量呈快速增加趨勢。從研究現(xiàn)狀看,該領(lǐng)域跨學科研究趨勢明顯,語言學、醫(yī)學、心理學、教育學、人工智能等的交叉結(jié)合,在研究方法、研究目的、被試群體上都有明顯體現(xiàn)。在實驗方法上,研究者多結(jié)合EEG、FMRI等神經(jīng)語言學技術(shù)探究人腦對語音習得的神經(jīng)機制。在被試群體上,成人、兒童、單語者、多語者、聽障群體受到更多關(guān)注。目前感知與產(chǎn)出領(lǐng)域研究熱點包括個體差異、語音意識、可理解度、音韻編碼等,主要圍繞語音感知的神經(jīng)機制和語音識別處理。
在感知和產(chǎn)出的研究發(fā)展中,研究者對語音感知和產(chǎn)出之間的關(guān)系仍然存在爭議。肌動理論(Motor Theory)和直接現(xiàn)實主義理論(Direct-Realist Theory) 認為產(chǎn)出先于感知,而一般聽覺理論(General Auditory Theory)和語音學習模型(Speech Learning Model)則認為感知先于產(chǎn)出。總體而言,對語音產(chǎn)出的關(guān)注度不如語音感知高,語音產(chǎn)出方面的研究還有待增加。