董莉
林遠(yuǎn)東從沒(méi)想過(guò)當(dāng)年在劍橋大學(xué)上學(xué)時(shí),當(dāng)中文老師的經(jīng)歷會(huì)在后來(lái)的創(chuàng)業(yè)道路上成為一束激發(fā)頭腦風(fēng)暴的光。
“當(dāng)時(shí),外國(guó)學(xué)生學(xué)習(xí)中文時(shí)有一個(gè)音一直掌握不好,就是ü,經(jīng)常會(huì)發(fā)錯(cuò)音。通過(guò)一位教學(xué)專家傳授經(jīng)驗(yàn),我告訴學(xué)生把發(fā)E的音,嘴形變成U,就可以發(fā)ü。”林遠(yuǎn)東回憶道,“那么,有沒(méi)有辦法讓我知道這個(gè)孩子實(shí)際上錯(cuò)成什么了。有了這個(gè)辦法就可以通過(guò)嘴形和各種各樣的結(jié)構(gòu)圖,指導(dǎo)孩子進(jìn)行正確的發(fā)音練習(xí)。但目前市面上的常有的方式能做到的是評(píng)分,但是我要告訴學(xué)習(xí)者,怎樣去正確發(fā)音?!?/p>
而這個(gè)靈感激發(fā)讓林遠(yuǎn)東在之后的創(chuàng)業(yè)中有了不一樣的思考角度。
馳聲創(chuàng)始人及CEO林遠(yuǎn)東,他的團(tuán)隊(duì)以源于劍橋大學(xué)的智能語(yǔ)音技術(shù)為起點(diǎn),幫助客戶實(shí)現(xiàn)人機(jī)互動(dòng)的智能學(xué)習(xí)
2007年,馳聲在英國(guó)劍橋初步建立團(tuán)隊(duì)的時(shí)候,人工智能還不像現(xiàn)在這么火熱。彼時(shí)林遠(yuǎn)東他們的想法很簡(jiǎn)單——口語(yǔ)練習(xí)在技術(shù)出現(xiàn)之前很難形成閉環(huán),大量的口語(yǔ)練習(xí)在課堂教學(xué)里面很不現(xiàn)實(shí),“結(jié)合自身的經(jīng)歷,我們用智能語(yǔ)音技術(shù)很好的解決了這個(gè)問(wèn)題,我在這個(gè)行業(yè)也堅(jiān)守10多年了,從未離開(kāi)。”馳聲創(chuàng)始人及CEO林遠(yuǎn)東介紹,團(tuán)隊(duì)以源于劍橋大學(xué)的智能語(yǔ)音技術(shù)為起點(diǎn),自主研發(fā)了基于大數(shù)據(jù)、深度學(xué)習(xí)的智能語(yǔ)音系列技術(shù),幫助客戶實(shí)現(xiàn)人機(jī)互動(dòng)的智能學(xué)習(xí)產(chǎn)品。
多年來(lái),圍繞語(yǔ)言教育,馳聲的技術(shù)已經(jīng)發(fā)展為三方面能力的評(píng)估:第一個(gè)為發(fā)音能力評(píng)估,主要解決單詞、句子、段落和篇章朗讀的發(fā)音評(píng)分,單詞可以實(shí)現(xiàn)音素級(jí)發(fā)音檢測(cè)、重讀檢測(cè)等一系列和語(yǔ)言教育相關(guān)的維度;第二個(gè)是語(yǔ)用能力評(píng)估,比如說(shuō)限定場(chǎng)景的選擇題,主要考察學(xué)生在某個(gè)環(huán)境下的語(yǔ)用能力;第三個(gè)是開(kāi)放題型評(píng)估,如口語(yǔ)作文、話題復(fù)述等等,考察的是學(xué)生運(yùn)用已經(jīng)掌握的英語(yǔ)知識(shí),完整表達(dá)意思的能力。
林遠(yuǎn)東認(rèn)為,人工智能在智能語(yǔ)音、口語(yǔ)評(píng)測(cè)的發(fā)展路徑分為三步,第一步是建立標(biāo)準(zhǔn),第二步是個(gè)性診斷,第三步是反饋指導(dǎo)。他認(rèn)為智能技術(shù)在教育領(lǐng)域要向前深入一個(gè)階段,作為技術(shù)人員來(lái)講,就要強(qiáng)迫自己深入到教育行業(yè)?!爱?dāng)你要深入這個(gè)行業(yè)本身,你要去汲取這個(gè)行業(yè)里面的內(nèi)容,這是很難的,更難的是放棄自己原來(lái)的立場(chǎng),深入融合教育的知識(shí)和理論?!?/p>
馳聲從2007年開(kāi)始專注語(yǔ)音評(píng)測(cè)技術(shù),2008年推出了業(yè)內(nèi)第一評(píng)估中文聲調(diào)、評(píng)價(jià)中文發(fā)音能力的SDK;2009年推出了業(yè)內(nèi)第一個(gè)基于網(wǎng)頁(yè)的無(wú)插件英文發(fā)音評(píng)估SDK;2015年推出業(yè)界第一個(gè)支持微信語(yǔ)音的發(fā)音評(píng)估SDK等。
這背后是核心團(tuán)隊(duì)對(duì)于痛點(diǎn)細(xì)致入微的拆分了解。林遠(yuǎn)東曾調(diào)取了線上數(shù)據(jù),下載了五百多條語(yǔ)音,自己一條一條去聽(tīng)。他吃驚地發(fā)現(xiàn):很多用戶發(fā)音的時(shí)候總是在重復(fù)犯錯(cuò),短時(shí)間內(nèi)練同一個(gè)內(nèi)容,第1次錯(cuò)和第10次的錯(cuò)誤是一樣的。馳聲語(yǔ)音評(píng)測(cè)實(shí)驗(yàn)室也做了相關(guān)研究,通過(guò)調(diào)取大量的錄音數(shù)據(jù)發(fā)現(xiàn),85%的語(yǔ)言學(xué)習(xí)者,總是在重復(fù)犯錯(cuò)。
“這是對(duì)我很大的打擊。85%的人在浪費(fèi)他們的時(shí)間,雖然他們?cè)诓粩嗟刈x,但是仍不斷犯同樣的錯(cuò)誤?!绷诌h(yuǎn)東說(shuō),“雖然我們完成了自動(dòng)評(píng)分,告訴他讀得不好,但只是重復(fù)犯錯(cuò),沒(méi)有什么意義?!?blockquote>
每一項(xiàng)技術(shù)的發(fā)展,都是發(fā)揮技術(shù)之所長(zhǎng),去對(duì)老師所不擅長(zhǎng)的工作進(jìn)行填補(bǔ),而不是取代
馳聲提出了一條新的研發(fā)路徑——“評(píng)分-診斷-反饋指導(dǎo)”。目前市場(chǎng)上大多數(shù)語(yǔ)音評(píng)測(cè)公司都處在“建立標(biāo)準(zhǔn)”的階段,為一份口語(yǔ)作業(yè)打分或者評(píng)價(jià)優(yōu)良中差。馳聲率先實(shí)現(xiàn)“個(gè)性診斷”,今年推出了新技術(shù)“診斷糾錯(cuò)內(nèi)核”。針對(duì)單詞發(fā)音評(píng)分,通過(guò)構(gòu)建一個(gè)擴(kuò)展網(wǎng)絡(luò)的形式,可以支持任意單詞的音素級(jí)插入、刪除和替換錯(cuò)誤。以match這個(gè)單詞為例,如果[m?t?]讀成[m?t?],就會(huì)有相應(yīng)的錯(cuò)誤發(fā)音提示,以及正確的發(fā)音指導(dǎo)。直觀呈現(xiàn)學(xué)習(xí)者實(shí)際發(fā)音的音素序列并進(jìn)行錯(cuò)誤標(biāo)注,意義就在于告訴學(xué)生:你錯(cuò)了,錯(cuò)在這里,怎么錯(cuò)的。再結(jié)合最后一步“反饋指導(dǎo)”,用文字、圖片、視頻的方式告訴學(xué)生如何去提升,最終達(dá)到“拒絕重復(fù)犯錯(cuò)”,快速提高語(yǔ)言學(xué)習(xí)效率的目的。
林遠(yuǎn)東表示,2014年,馳聲語(yǔ)音平臺(tái)一天的錄音數(shù)據(jù)超過(guò)千萬(wàn),現(xiàn)在每天的錄音峰值達(dá)到大幾千萬(wàn)的次數(shù),目前用戶使用量還在持續(xù)猛增?!半m然使用量上升內(nèi)心會(huì)感受到無(wú)比幸福,但也許有一天使用量開(kāi)始回落的時(shí)候,你會(huì)感覺(jué)到另外一種幸福,那是行業(yè)的福分。當(dāng)個(gè)性化診斷和反饋指導(dǎo)得到實(shí)踐,一個(gè)孩子不需要練習(xí)100次而在第10次就能得到提升,為什么還要讓他練習(xí)100次,消耗用戶時(shí)間、消耗計(jì)算機(jī)資源、消耗客戶金錢(qián)呢?”
目前,馳聲的語(yǔ)音技術(shù)授權(quán)業(yè)務(wù),主要面向英語(yǔ)培訓(xùn)機(jī)構(gòu)、出版社、教育軟件、在線教育、教育硬件和考試服務(wù)機(jī)構(gòu)等提供口語(yǔ)測(cè)評(píng)技術(shù)支持,服務(wù)的用戶遍及132個(gè)國(guó)家和地區(qū)。于是,馳聲語(yǔ)音評(píng)測(cè)實(shí)驗(yàn)室提出了一個(gè)新課題——AI+K12語(yǔ)言教育,除了口語(yǔ)評(píng)測(cè)還能做什么?
馳聲一直在思考智能語(yǔ)音技術(shù)如何能更好地服務(wù)K12的教學(xué)場(chǎng)景,為此定義了三個(gè)場(chǎng)景:一、正式考試環(huán)境下根據(jù)人工定標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)進(jìn)行自動(dòng)評(píng)分,馳聲提供了一個(gè)AMS,已經(jīng)服務(wù)了多個(gè)地區(qū)的英語(yǔ)聽(tīng)說(shuō)考試;二、考輔分為備考和模考的環(huán)境,馳聲提供CESE平臺(tái),輔助校園聽(tīng)說(shuō)日常測(cè)評(píng)和階段性考試;三、在課外,馳聲也可以為學(xué)生自學(xué)提供一些口語(yǔ)的發(fā)音能力評(píng)估。
在遵循“評(píng)分-診斷-反饋指導(dǎo)”的技術(shù)創(chuàng)新路徑上,除了診斷糾錯(cuò)內(nèi)核,馳聲今年還發(fā)布了另一項(xiàng)創(chuàng)新技術(shù)——開(kāi)放題型多維度評(píng)估。
據(jù)了解,開(kāi)放題型多維度評(píng)估,該技術(shù)與近年來(lái)各省市在中高考中增加英語(yǔ)口語(yǔ)考試的機(jī)緣密不可分。作為中國(guó)真正有中高考英語(yǔ)聽(tīng)說(shuō)人機(jī)對(duì)話考試實(shí)施經(jīng)驗(yàn)的兩家語(yǔ)音廠商之一,馳聲與多省、市教育主管部門(mén)保持密切協(xié)作,共同推動(dòng)語(yǔ)音測(cè)評(píng)技術(shù)在正式考試、考輔、教輔等各個(gè)教學(xué)階段的應(yīng)用。
開(kāi)放題型多維度評(píng)估結(jié)合了詞嵌入技術(shù)、句法解析、GOP算法等技術(shù),可支持口語(yǔ)作文、看圖說(shuō)話、翻譯題等開(kāi)放題型,評(píng)分結(jié)果除總分以外,還加入了內(nèi)容得分、發(fā)音得分、語(yǔ)法得分和流利度得分等四個(gè)維度。
經(jīng)測(cè)試,開(kāi)放題型多維度評(píng)估的評(píng)分性能遠(yuǎn)遠(yuǎn)高于以前的基于特征直接擬合總分的情況。該內(nèi)核更出色的性能特點(diǎn)還在于:自適應(yīng)評(píng)分標(biāo)準(zhǔn),不同的地區(qū)對(duì)這四個(gè)維度有不同的側(cè)重點(diǎn),馳聲可以根據(jù)定標(biāo)數(shù)據(jù)學(xué)習(xí)到該地區(qū)在每個(gè)維度上的特征和權(quán)重,擬合出一個(gè)最為適合該地區(qū)的評(píng)分標(biāo)準(zhǔn)。
新技術(shù)還為后期打下了一個(gè)伏筆——未來(lái),馳聲將在這四個(gè)維度上繼續(xù)往下做,對(duì)應(yīng)著診斷和反饋,比如學(xué)習(xí)者的語(yǔ)法錯(cuò)在什么位置,應(yīng)該糾正成什么樣。
當(dāng)被問(wèn)到馳聲不斷推出新技術(shù),是否會(huì)取代現(xiàn)有老師的功能,林遠(yuǎn)東表示,其實(shí)每一項(xiàng)技術(shù)的發(fā)展,都是發(fā)揮技術(shù)之所長(zhǎng),去對(duì)老師所不擅長(zhǎng)的工作進(jìn)行填補(bǔ),而不是取代。如今,教育行業(yè)正處于技術(shù)和教育融合的階段。這個(gè)階段里面,智能技術(shù)會(huì)使得教師角色得到重新定義。未來(lái)教師將被豐富為兩個(gè)角色,第一個(gè)是講課、專業(yè)的授課者;第二個(gè)是維持課堂秩序,與學(xué)生進(jìn)行近距離的實(shí)時(shí)互動(dòng)。教育者在教育過(guò)程中承擔(dān)更多的功能性,包括數(shù)據(jù)分析的能力,這也是未來(lái)教育行業(yè)的發(fā)展趨勢(shì)。
馳聲也公布了關(guān)于下一步的研發(fā)計(jì)劃,內(nèi)容包括通用聲學(xué)模型升級(jí)、語(yǔ)音自動(dòng)分類、虛擬教室和基于知識(shí)圖譜的自適應(yīng)學(xué)習(xí)等。