李北辰
這個世界上有多少非母語為英語的人在學習英文?
根據德國知名語言學家烏爾里希·阿蒙(Ulrich Ammon)的估計,上述人的數量有15億,他們是學習法語、漢語、西班牙語、德語、意大利語和日語人數總和的10倍左右。
具體到中國,拋開全球互聯(lián)網上80%的信息、60%的廣播節(jié)目、75%的電視節(jié)目都是英文的宏觀背景不談,一代代學生被英文“折磨”的最直接原因是考試,英語早已成為中國數代學生的必修課。
而眾所周知,在“聽說讀寫”這4大英文核心要素中,最考驗英文綜合能力的“寫”,無疑是“折磨”學生最多的環(huán)節(jié)。無論是中小學英語考試、四六級,還是國際標準化測試,那些不易覺察的語法問題,不易調配的“高級”詞匯,都是橫亙在學生與一篇“漂亮”作文面前的絆腳石。
想要踢開絆腳石,除了日趨高昂的私教錢,很多學生都缺少一個貼身的作文老師。而在另一邊,對于在校任教的英文老師而言,考慮到現(xiàn)在學生的課業(yè)負擔,需要逐句批改的作文量也已堪稱卷帙浩繁,這往往會讓老師們苦不堪言。這也是為什么去年年底,當得知微軟亞洲研究院推出微軟“愛寫作”網頁版時,許多學生、家長、老師都倍感欣喜的原因,有了“愛寫作”在語法批改和評估反饋等方面的技術幫襯,他們都感到輕松了許多。
而就在不久前,“愛寫作”手機端也正式上線,大家可以更便捷地寫作與批改,使用者能更好地利用碎片化時間完成學習,且與網頁端一樣,從語法、用詞到文章結構;從中小學、四六級到雅思托福,它能根據不同年級和類型的作文標準,有針對性地匹配反饋建議,幫助不同學習者提升英語寫作水平。
基于微軟亞洲研究院在自然語言處理和OCR(光學字符識別)等領域的研究成果,加之微軟小英多年以來的技術積淀,針對英文寫作的不同痛點,“愛寫作”逐漸顯現(xiàn)出不同亮點。
依我之見,其中應用最廣泛的是語法檢查功能。
人類語言學的一個最經典命題就是:語言限定了人類思維的邊界。就像哲學家維特根斯坦所言,由于每個人都是在語言的邊界內寫作與思辨,很難覺察到語言工具的局限。譬如終身只用漢語寫作的人通常不會意識到,漢語中沒有主賓格和單復數等邏輯信息,所以斯坦福大學教授雷拉·波洛狄特斯基才說:“每種語言都包含著一種獨特的世界觀,反映了使用者數千年來的思想、傾向和認知方式?!?/p>
這種“思想、傾向和認知方式”,許多時候會讓語法成為我們進行英文寫作的最大障礙。例如時態(tài)等語法錯誤,倘若只是日常聊天,出點錯沒關系,但當文字落于紙上,還是嚴謹為妙。
讓學生避免語法錯誤,也是“愛寫作”首先想要解決的課題。它能在快速完成全文語法檢查的同時,將提交作文中的語法問題用紅色下劃線標記出來,學生點擊紅線,就可獲得有針對性的語法講解,以及修改后作為參考的正確表達(圖1)。
在英文寫作中,比“正確”更難的,是“高級”。這就要說到“愛寫作”的另一項重要功能:詞語替換。
有個著名的段子。家長問老師:“我家孩子4歲,英語詞匯量大概只有1500個左右,是不是不太夠?”老師回答:“在美國肯定夠了,在海淀區(qū)肯定不夠?!边@個段子很明顯充滿了中國式家長的焦慮,但你得承認,從英文的角度來說,掌握更多單詞確實能豐富描述同一事物的維度。在日常練習中,老師也確實經常會問:“還有沒有更高級的詞可以用在這里?”因為許多時候,僅僅替換一個單詞,就會生出一種賞心悅目的高級感(看過《綠皮書》的人會對此深有體會),只可惜有些中國學生背了不少單詞,卻不能在最該用的時候信手拈來,這也極大地影響了作文的美感。
針對于此,微軟“愛寫作”的詞語替換功能,可以根據上下文篩選出多個高級詞匯供你選擇使用,譬如讓你不再只會用“good”和“nice”這種簡單詞匯,而是能看到諸如“impressive”和“admirable”這種更高級復雜的詞匯可供替換(圖2)。
作為一個專業(yè)的中文寫作者,我當然知道,有些時候“直抒胸臆”是最好的表達,但也有些時候,“豈曰無衣,與子同袍”會因更具美感而更具力量。
最后,再來簡單了解一下“愛寫作”的分類作文打分和手寫圖片識別功能。
打分功能不僅能對所有文章進行一般性評分,還能測試同一篇作文在不同考試類型中的得分狀況,因為不同的考試在詞匯、語法、文章結構和切題程度等方面有著不同的考量標準,所以“愛寫作”在給出分數的同時,還可有針對性地評價一篇作文在不同方面的表現(xiàn),并給出反饋建議(圖3)。
而手寫圖片識別功能,能讓學生只需用手機給作文拍照上傳,就可將其轉換成可用智能終端編輯的文字,語法檢查、作文打分、詞語替換等批改功能也可全部實現(xiàn)。你可以想見,除了方便學生,老師也可借助此功能,輕松識別學生們各不相同的手寫字體,讓作文批改工作事半功倍。
為了測試上述功能,我找了一篇手寫英文段落,下面就是手寫稿和系統(tǒng)自動識別的對比,不難發(fā)現(xiàn),除了僅有的一個單詞錯誤(your識別成year),以及需要把標題歸到標題欄外,識別結果非常完美,可直接編輯修改(圖4)。
而完成編輯后,點擊“批改”,系統(tǒng)會讓你選擇級別,我選了初中,批改結果如下(圖5):
我選的這篇文章“十分優(yōu)秀”,只有一個語法錯誤,已用紅線標注,建議改為is——但為了錦上添花,系統(tǒng)給出了詞語替換的建議(藍線標注詞語,這點真的很好用)。另外,點擊“詳細報告”,系統(tǒng)還會從文章流暢度和文章內容兩方面提供建議。
值得一提的是,上述功能不但會持續(xù)得到優(yōu)化,且“愛寫作”同一賬號手機端和網頁端數據是打通的,用戶可以在PC端練習寫作,在手機端更方便地查看檢索,完成英文寫作的全場景覆蓋。
不難發(fā)現(xiàn),對于學習者而言,“愛寫作”讓英文寫作訓練變得更簡單、更高效,而在它的背后,蘊含著微軟自身AI技術的深厚積淀。
很多人知道,在AI輔助英語學習領域,微軟亞洲研究院有著多年的經驗:2009年就發(fā)布“英庫詞典”(必應詞典的前身);2016年發(fā)布英語學習助手“微軟小英”;2018年又將“作文打分”功能嵌入微軟小英。而“愛寫作”也經歷了很長的研究階段。如今,研究員在不斷對自然語言處理等AI領域的算法模型進行迭代后,終于讓其成為了一款提升英語寫作能力的利器。
以語法檢查功能為例,它采用了微軟亞洲研究院全新的學習和推斷機制Fluency Boost Learning and Inference(流暢度提升學習與推斷),幫助用戶“找茬”。通過 Fluency Boost Learning(流暢度提升學習)生成的大量糾錯數據,結合seq2seq預訓練技術,語法糾錯模型在CoNLL-2014和JFLEG兩個權威語法糾錯數據集上都率先超越了人類參考水平,并且持續(xù)保持著業(yè)界領先的技術水準。
再比如,在詞語替換功能中,研發(fā)人員提出了基于預訓練語言模型的詞替換方法,并結合微軟原創(chuàng)的預訓練語言模型——UniLM作為詞替換的解決方案。該方法通過半遮蓋(partial masking)等策略讓預訓練語言模型能夠同時考慮原目標詞詞義以及上下文語境,從而選出合適的替換詞。
我知道,普通讀者很難理解這些復雜的技術名詞,無所謂,你只需要知道,正是這些“復雜”,醞釀出用戶練習英文寫作時的簡單。
另外你要知道的是,微軟亞洲研究院是一個計算機技術的研究機構,而非一個“教育機構”,這也意味著,他們打造“愛寫作”的目的,不是向市場推出一個“教育產品”去賺錢(順便一提,“微軟小英”自2016年推出至今都是免費的),而是通過與不同領域機構(尤其教育領域)的充分合作,更好地理解教育行業(yè)和用戶痛點,探尋AI技術在教育行業(yè)的廣泛應用。
其核心就是兩個字:賦能。“愛寫作”是在以技術為長板,以場景為核心,賦能合作伙伴,讓其掌握最新的技術工具,在AI時代發(fā)現(xiàn)新機遇,最終雙方再共同賦能用戶,解決中國英語寫作學習者在移動和AI時代的需求。
事實上,“愛寫作”的這種角色,很容易令人想到微軟賦予自身的使命:通過提供平臺和生產力工具,賦能地球上的每個人和每家組織,幫助他們取得更多成就。
判斷一款產品優(yōu)良的方法從來不拘一格,但有種方法深得我心,即它是否具備“若我年輕時就有它,該有多好”的屬性,這種產品通常出現(xiàn)在教育領域。
包括我在內,無數中國學生經歷過學習英語的煎熬,每個人學習英文寫作的過程,都像是一部“血淚史”,因為事實就像海明威說的那樣:“寫作沒什么秘訣,你要做的只是在打字機前流血?!?/p>
對于中國的英文寫作學習者來說,這句話仍然是對的,提高寫作能力沒有捷徑,沒人能繞開平日枯燥的大量練習。但如今,有了新技術的加持,至少可以在你“流血”時,少一些痛苦,多一些回報。
“若我年輕時就有它,該有多好”。