郭書諫 沈騎
提 要 智慧城市是當前城市建設(shè)和發(fā)展的重要趨勢。當前智慧城市語言服務(wù)具有語言服務(wù)數(shù)據(jù)化、計算機中介交流普遍化和人機耦合三大特征。語言數(shù)據(jù)對智慧城市建設(shè)具有重要作用,但受限于政府重視程度不夠、人才培養(yǎng)、行業(yè)標準和立法限制等問題,仍然是城市大數(shù)據(jù)的孤島。故需創(chuàng)新人才培養(yǎng)模式,增強語言數(shù)據(jù)收集、研究、使用的制度設(shè)計,鼓勵語言數(shù)據(jù)在智慧城市建設(shè)中的研究和應用。同時,語言產(chǎn)業(yè)的一系列轉(zhuǎn)型,要求進一步關(guān)注、研究這一過程中數(shù)字化鴻溝、壟斷、機會不公平等可能存在的問題。應重視語言服務(wù)“技術(shù)化”,同時堅守價值評判的“人文性”,關(guān)注城市市民特別是弱勢人群的數(shù)字化生存處境。
關(guān)鍵詞 智慧城市;語言數(shù)據(jù);語言產(chǎn)業(yè);語言規(guī)劃;語言服務(wù)
中圖分類號 H002 文獻標識碼 A 文章編號 2096-1014(2021)03-0045-10
DOI 10.19689/j.cnki.cn10-1361/h.20210304
Language Services in the Process of Building Smart Cities
Guo Shujian and Shen Qi
Abstract Building Smart City is an important project in the current urban construction and development. This paper outlines the research and development of language services and proposes that current language services in smart cities feature three major aspects: digitized service, computer-mediated communication, and human-computer coupling. Although language data is playing an important role in the construction of smart cities, the restrictions in government investment, professional training, industry standards, and legislation have made language data an isolated island in the sea of big data in smart cities. In order to solve these problems, it is necessary to innovate talent training mode and enhance the institutional design of language data collection. On the other hand, it is also very key to encourage the research and application of language data in the construction of smart cities. At the same time, the digital transformation of language service has brought about a series of changes in the language industry, some possible problems such as the digital divide, monopoly, and inequitable opportunities in this process required more attention and examination. Our study of language services in smart cities needs to focus not only on the technical aspects but also on the humanistic concerns, especially the current state of digital living of the vulnerable population in the community.
Key words smart city; language data; language industry; language planning; language service
一、引 言
智慧城市(Smart City)最早由國際商業(yè)機器公司(IBM)提出,旨在應用技術(shù)手段讓城市更加高效地運行,節(jié)約資源并改善市民生活質(zhì)量(許曄,郭鐵成2014)。近10年來,智慧城市在中國的發(fā)展方興未艾,日益成為未來城市建設(shè)的重要方向。習近平總書記指出:“我們要深刻認識互聯(lián)網(wǎng)在國家管理和社會治理中的作用,以推行電子政務(wù)、建設(shè)新型智慧城市等為抓手,以數(shù)據(jù)集中和共享為途徑,建設(shè)全國一體化的國家大數(shù)據(jù)中心,推進技術(shù)融合、業(yè)務(wù)融合、數(shù)據(jù)融合,實現(xiàn)跨層級、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù)的協(xié)同管理和服務(wù)?!苯ㄔO(shè)新型智慧城市成為新時期城市建設(shè)和社會治理的戰(zhàn)略方向。
數(shù)據(jù)是智慧城市建設(shè)的核心要素。王靜遠等(2014)認為建設(shè)智慧城市是未來現(xiàn)代化城市的發(fā)展方向,以數(shù)據(jù)為中心的技術(shù)是支撐智慧城市建設(shè)的技術(shù)基礎(chǔ)。然而較為遺憾的是,無論在以《河北雄安新區(qū)規(guī)劃綱要》為代表的政府規(guī)劃文件中,還是在互聯(lián)網(wǎng)技術(shù)公司的智慧城市建設(shè)方案中,智慧化的語言服務(wù)都未能納入智慧城市建設(shè)。從華為技術(shù)有限公司和京東數(shù)字科技集團等機構(gòu)提供的最新資料看,語言數(shù)據(jù)并沒有得到充分重視。鑒于此,作為一項探索性研究,本文主要關(guān)注以下幾個問題:在智慧城市建設(shè)過程中,語言服務(wù)的發(fā)展現(xiàn)狀如何?存在哪些困境和問題?可以采取哪些措施加以改善?未來研究需要關(guān)注哪些方面?
二、智慧城市語言服務(wù)的基本內(nèi)涵
語言服務(wù)是“利用語言(包括文字)、語言知識、語言技術(shù)及語言的所有衍生品來滿足語言生活的各種需要”(李宇明2014,2016)。近年來語言服務(wù)的相關(guān)研究日益受到關(guān)注,大致可分為應用語言學和翻譯研究兩大流派,但內(nèi)容相對零散,實證研究較少(仲偉合,許勉君2016)。有學者將語言服務(wù)細分為語言翻譯服務(wù)、語言教育服務(wù)、語言支持服務(wù)以及特殊行業(yè)領(lǐng)域的語言服務(wù),認為其基本屬性包括“服務(wù)性、規(guī)約性與主導性”(屈哨兵2007)。王海蘭(2018:60)進一步認為語言服務(wù)涵蓋了語言規(guī)劃服務(wù)、語言咨詢服務(wù)、語言教育和培訓服務(wù)等十大內(nèi)容,提出新形勢下城市公共語言服務(wù)面臨的五大問題和十大任務(wù),當前“農(nóng)民涌入城市,西部人口流入東部,國外人員來到中國,城市成為一個城鄉(xiāng)文化、中外文化混合的區(qū)域”。城市的語言服務(wù)既是一項需要滿足不同人群生活需求的公共服務(wù),同時也是城市和社會治理中需要關(guān)注的問題。
近20年來,“語言服務(wù)”的定義經(jīng)歷了由狹義到廣義的發(fā)展。早期的“語言服務(wù)”多指語言標識、翻譯等以信息轉(zhuǎn)換為基本任務(wù)的狹義范疇(張偉,鄭中原2004)。而后“語言翻譯服務(wù)、語言教育服務(wù)、語言支持服務(wù)、特殊行業(yè)領(lǐng)域的語言服務(wù)”等被納入研究范圍(屈哨兵2010)。陳鵬(2016)認為語言服務(wù)包含“語言教學、筆譯、口譯、語言技術(shù)工具、字幕翻譯和配音、軟件本地化和網(wǎng)站全球化、會議組織及咨詢等”。新冠疫情暴發(fā)以來,應急語言服務(wù)也被納入語言服務(wù)的研究范疇之中,得到普遍關(guān)注(王輝2020)。
本文論述基于較為廣義的語言服務(wù)定義,既包括狹義的以信息轉(zhuǎn)化為主要目標的翻譯等內(nèi)容,也包含語言教育服務(wù),以及普通話推廣、地方語言保護等政府語言規(guī)劃等項目。與過去的城市語言服務(wù)不同,智慧城市的語言服務(wù)更加依靠新技術(shù)解決城市語言管理中的問題,以實現(xiàn)相應目標。智慧城市建設(shè)對城市語言服務(wù)和規(guī)劃提出了新的要求。語言服務(wù)效率的高低、覆蓋面的大小、技術(shù)和智慧化水平的高低,影響著城市居民生活的便捷度和服務(wù)的可得性。近10年來智慧城市的發(fā)展,使得政務(wù)、金融、醫(yī)療等各項城市服務(wù)數(shù)據(jù)互通,基本實現(xiàn)了可共享的城市大數(shù)據(jù)底座。但在城市大數(shù)據(jù)中,語言數(shù)據(jù)的應用仍然受到局限。本文探討的語言數(shù)據(jù)界定為3類:個人的語言使用和語言能力情況調(diào)查數(shù)據(jù)(包括普通話、方言、外語的使用能力和學習年限)、文字化的語料(比如社交網(wǎng)絡(luò)中每個人的語料、學術(shù)研究收集的特定任務(wù)語料等)、語音語料(比如智能客服語料、語音導航語料等)。有學者認為,語言數(shù)據(jù)是數(shù)據(jù)這一生產(chǎn)要素的組成部分,也與其他一些生產(chǎn)要素發(fā)生各種各樣的關(guān)系(李宇明2020)。在大數(shù)據(jù)時代,數(shù)據(jù)為語言學家提供了新的研究范式(劉海濤,林燕妮2018),研究者應該重視語言作為數(shù)據(jù)如何從理論到實踐層面參與智慧城市建設(shè)。
三、智慧城市語言服務(wù)發(fā)展現(xiàn)狀
相較于傳統(tǒng)的城市語言服務(wù),智慧城市的語言服務(wù)具備以下新的特征。
第一,語言數(shù)據(jù)的重要性凸顯。在智慧城市中,由于算力和數(shù)據(jù)的大規(guī)模增長,語言不僅是傳統(tǒng)意義上個人發(fā)出的聲音或者文字符號,還可以以語料數(shù)據(jù)的形式存在(Agerri et al. 2015)。語料數(shù)據(jù)顯示出大數(shù)據(jù)的4V特征(Katal et al. 2013):規(guī)模性(volume),多樣性(variety),價值性(value),變化性(velocity)。以智能客服為例,通過計算機技術(shù),大量的人工客服語料得以被機器學習,形成語言模型,實現(xiàn)數(shù)據(jù)化和行業(yè)應用。以信息導覽服務(wù)為例,不再依靠人以自然語言介紹的方式進行,而是將數(shù)據(jù)存儲在服務(wù)器中,借助智能手機等終端作為入口,通過二維碼掃碼、圖像識別等方式與人進行交互。而過去為了滿足國外游客獲取交通、地名等信息的需求,城市必須借助標牌上的語言翻譯為國際旅客提供必要的導覽服務(wù)。
第二,計算機中介交流的普遍化。由于機器和人同時成為了語言生產(chǎn)和傳播的主體,計算機扮演了人與人交流的中介(Kerr & Hiltz 2013)。以電子商務(wù)企業(yè)的語言服務(wù)為例,過去許多由人工承擔的信息導覽、會務(wù)等服務(wù),被計算機和機器人取代。在部分場景中,盡管客戶仍然是與人工客服進行溝通,但也是借助電腦、智能手機等終端進行。與過去面對面的語言服務(wù)相比,現(xiàn)在的語言服務(wù)人員通常集中于客戶服務(wù)中心,集中管理培訓,通過計算機與不同地區(qū)的客戶進行交流。
第三,語言服務(wù)全過程由計算機和人共同參與配合,具有“人機耦合”的特征(劉慶峰2018;余玉秀2019)。隨著技術(shù)進步,機器通過算法和數(shù)據(jù)加工,處理、運算語言數(shù)據(jù)生成的自然語言成為人機交互的界面(Gorecky et al. 2014)。以口譯為例,傳統(tǒng)意義的口譯員基于自身的專業(yè)素質(zhì)和經(jīng)驗進行翻譯。隨著科大訊飛等一系列基于自然語言處理和人工智能的口譯服務(wù)產(chǎn)品推出,口譯員與計算機協(xié)同配合,共同完成口譯任務(wù)。以景區(qū)導覽為例,過去游客只能尋求多語導游的幫助以實現(xiàn)信息獲取,現(xiàn)在借助技術(shù)手段,人們可以通過掃描二維碼,獲取不同語言的導覽語音,結(jié)合位置數(shù)據(jù)甚至能夠自動獲取對應的內(nèi)容。人只需在產(chǎn)品開發(fā)、項目部署、管理、運營和維護中發(fā)揮作用,而具體的語言服務(wù)則由機器開展。
在移動互聯(lián)網(wǎng)、智能手機、云計算和自然語言處理等新技術(shù)的加持下,智慧城市的語言服務(wù)在過去10年間誕生了不少服務(wù)商,催生了語言服務(wù)產(chǎn)業(yè)的智慧化業(yè)態(tài)轉(zhuǎn)型。我們選取了其中3個較為具有代表性的案例加以研究。
案例一:驢跡科技為代表的智慧導覽。借助“驢跡導游”移動應用程序(APP),用戶通過智能手機掃描二維碼可獲取不同語言的電子導覽服務(wù),此舉可以替代人工導覽和景區(qū)信息介紹。同時,在數(shù)據(jù)后臺,政府和主管部門可以通過用戶掃碼后的各種選項和操作、瀏覽順序、點擊量等數(shù)據(jù),了解人流趨勢、興趣熱點和行動軌跡,從而更加科學地規(guī)劃城市、建設(shè)景區(qū)、設(shè)置線路和調(diào)度交通工具。以信息導覽為代表的語言服務(wù)具有高度的重復性和相似性,機器完成這些任務(wù)更加高效。導覽服務(wù)即時記錄和匯總相關(guān)數(shù)據(jù),可為城市和景區(qū)管理者決策提供依據(jù)。
案例二:語言服務(wù)機器人。語言服務(wù)機器人能夠提供翻譯、導覽、咨詢、引導等多種服務(wù)和保障。在第二屆中國國際進口博覽會中,除了傳統(tǒng)的翻譯員,場館內(nèi)增設(shè)了中英雙語的“進寶”機器人為參觀人員和參展商提供翻譯服務(wù)(鄒娟2019)。與人工譯員相比,盡管機器人目前在復雜翻譯任務(wù)的譯文準確性上仍然不及人工翻譯,但對于常規(guī)翻譯任務(wù),機器人能夠全天候、無休息地提供服務(wù),滿足日常語言翻譯和信息呈現(xiàn)需求。
案例三:云翻譯。以翻易通、365翻譯、譯云、Trycan和金譯通為代表的云翻譯服務(wù)商是智慧城市中新的語言服務(wù)提供者。與傳統(tǒng)的翻譯公司相比,云翻譯提供商能夠通過人機協(xié)同的方式提供更加高效、精準和更具價格優(yōu)勢的翻譯服務(wù)。個人或者企業(yè)客戶通過網(wǎng)絡(luò)下單,提出相應的需求,由服務(wù)商的譯員和機器協(xié)作共同滿足客戶的翻譯需求。
通過上述案例可以發(fā)現(xiàn),智慧城市的語言服務(wù)具有“人機耦合”的特征:傳統(tǒng)由人進行的語言服務(wù),向著人機交互的方式轉(zhuǎn)變。信息導覽、客服、翻譯等大規(guī)模、重復性的服務(wù)內(nèi)容,逐步通過訓練語言數(shù)據(jù)和機器學習實現(xiàn),但是語言機器模型的研發(fā)、部署、管理、執(zhí)行、監(jiān)督、維護等過程仍然需要人的主導。以智慧導覽為例,系統(tǒng)的搭建、二維碼的生成和導覽語音數(shù)據(jù)的準備處理,都需要人工研發(fā)、部署和管理,后期系統(tǒng)產(chǎn)生的游覽量、行程線路等相關(guān)數(shù)據(jù)也都需要人的分析和決策。語言服務(wù)機器人雖然部分替代了重復性的服務(wù),但是許多復雜服務(wù)仍然需要人的協(xié)作,同時機器人的研發(fā)、迭代、部署和管理都需要人的參與。由于計算機并不能直接參與處理自然語言,因此各種語言服務(wù)中所用到的自然語言必須加以數(shù)字化,語言數(shù)據(jù)的重要性凸顯。以表2為例,相較于傳統(tǒng)服務(wù),數(shù)字化方案需要人工將傳統(tǒng)服務(wù)流程化和數(shù)字化,為計算機準備足夠的專用語料,通過機器學習、算法訓練等過程,逐步實現(xiàn)數(shù)字化。
在智慧城市的語言服務(wù)過程中,人的角色和知識結(jié)構(gòu)發(fā)生了轉(zhuǎn)變,未來高度重復性的語言服務(wù)勞動可能由機器提供。人只需要承擔產(chǎn)品研發(fā)和部署、數(shù)據(jù)收集和分析、項目決策和管理等需要創(chuàng)新和創(chuàng)造力的職責。人和機器相互協(xié)同配合,從而更好地實現(xiàn)語言服務(wù)的智慧化。語言服務(wù)業(yè)將從勞動密集型,逐步向科技密集型產(chǎn)業(yè)轉(zhuǎn)變。以導覽為例,過去需要百人團隊才能服務(wù)的景區(qū)和街區(qū),隨著智慧城市建設(shè)的發(fā)展,未來可能僅需10余位人員負責系統(tǒng)的部署和維護。智慧城市和信息化建設(shè)的迅速發(fā)展,對語言類專業(yè)人才的知識結(jié)構(gòu)和能力素質(zhì)提出了許多新的要求。未來,城市語言專業(yè)人才不僅需要有扎實的語言基礎(chǔ),也需要具備一定的數(shù)據(jù)知識和運用技術(shù)工具解決實際問題的能力。
相較傳統(tǒng)的語言服務(wù),上述智慧化的解決方案,在服務(wù)部署、管理和效率上具有一定的優(yōu)勢。自然語言作為交互界面的重要性逐步減弱,正在被二維碼、智慧終端等取代。不過智慧城市中不少公共服務(wù)的“智慧化”程度還遠遠不夠。新冠疫情暴發(fā)以來,城市健康衛(wèi)生公共服務(wù)的智慧化得到了廣泛重視,以健康碼為代表的健康衛(wèi)生服務(wù)在全國范圍內(nèi)廣泛推行。由于語言服務(wù)的欠缺,以健康碼為代表的健康衛(wèi)生智慧服務(wù)缺乏相應的導覽和說明,客觀上形成了眾多老年人城市生活的“數(shù)字化鴻溝”(彭蘭2020)。當前城市的各項服務(wù)都在以前所未有的速度實現(xiàn)信息化和升級更新,智慧金融、智慧交通、智慧醫(yī)院等城市服務(wù)都面臨著交互過程中語言服務(wù)的欠缺。目前語言服務(wù)的智慧化解決方案主要體現(xiàn)在文化、旅游、翻譯、交通等領(lǐng)域,對于金融、醫(yī)療、政務(wù)等場景,更高程度的智慧服務(wù)依然缺少相應的解決方案。
四、智慧城市語言服務(wù)建設(shè)的困境
盡管智慧城市語言服務(wù)近年來發(fā)展迅猛,但也存在著不少局限。主要體現(xiàn)在語言數(shù)據(jù)的孤島問題、語言人才的知識結(jié)構(gòu)問題和語料數(shù)據(jù)的法律限制三大方面。
第一,語言數(shù)據(jù)的孤島問題。盡管近年來智慧城市的大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)不斷深化,與其他類型的數(shù)據(jù)如交通、人流、物流、資金流等數(shù)據(jù)相比,城市人口的語言類調(diào)研數(shù)據(jù)仍然屬于數(shù)據(jù)孤島(高豐2015),尚未納入城市管理大數(shù)據(jù)平臺。例如,中國家庭追蹤調(diào)查(CFPS)中具有語言相關(guān)的數(shù)據(jù)和字段,但在一網(wǎng)通辦等智慧城市的大數(shù)據(jù)平臺中,卻很少包含個人的普通話能力、外語能力、方言類型等數(shù)據(jù)。這些個人的語言能力數(shù)據(jù)對于城市語言管理具有重要作用,不僅應該在人口普查等各類調(diào)查中進行數(shù)據(jù)收集,也應該將其納入智慧城市建設(shè)的數(shù)據(jù)庫之中。
第二,語言人才的知識結(jié)構(gòu)問題。智慧城市語言服務(wù)存在人才供需的結(jié)構(gòu)性失衡,現(xiàn)有語言人才的培養(yǎng)模式難以適應智慧城市的語言服務(wù)需求。長期以來由于語言類學科傳統(tǒng)上被定義為文科,語言學科注重語言能力和人文素養(yǎng),對于數(shù)學思維和技術(shù)能力等方面的培養(yǎng)顯得不足。由于語言服務(wù)的智慧化轉(zhuǎn)型,許多重復性的勞動都由機器替代人工。以景區(qū)為例,在數(shù)字化的信息導覽服務(wù)部署之后,已不需要安排專職的外語導游,而是需要能夠熟練應用相關(guān)信息系統(tǒng),同時兼具一定語言服務(wù)能力的人才。
第三,基于特定任務(wù)的大規(guī)模高質(zhì)量語料相對缺乏。相比于其他類型的大數(shù)據(jù)(如人臉、交通、物流、訂單等),由于存在保護用戶隱私方面的限制,語音語料數(shù)據(jù)的收集受到了更加嚴格的監(jiān)督。許多智慧化語言服務(wù)的不斷迭代優(yōu)化,如智能客服、機器翻譯、人工導覽等都需要大規(guī)模、高質(zhì)量的語料和不斷強化的算法,但受限于語料數(shù)據(jù),不少課題研究面臨著“巧婦難為無米之炊”的困境。此外,由于學科定位、研究傳統(tǒng)的差異,語言學科和計算機學科之間的數(shù)據(jù)難以共享互通。語言類學科語料庫研究是“在數(shù)字化時代對(美國)結(jié)構(gòu)主義語言學的續(xù)寫,以及對功能語言學的發(fā)揚”(許家金2017),主要目的在于發(fā)現(xiàn)語言的結(jié)構(gòu)性、功能性特征。而自然語言處理、計算語言學所謂語料庫更多出于具體問題和任務(wù)的目的,收集特定語料(宗成慶2008)。不同學科產(chǎn)生的語料之間難以實現(xiàn)跨學科共享和協(xié)同。
上述問題,一方面凸顯出政府和企業(yè)在智慧城市建設(shè)的決策過程中,不太重視語言數(shù)據(jù)的收集和應用;另一方面,語言數(shù)據(jù)自身也存在結(jié)構(gòu)化程度不足、應用范圍窄、收集困難等現(xiàn)實困境。如何更好地應用語言數(shù)據(jù),運用新技術(shù),推動語言服務(wù)的智能化、產(chǎn)業(yè)化、規(guī)?;岣叱鞘姓Z言管理和服務(wù)水平,成為當前需要研究的重點。
五、智慧城市語言服務(wù)建設(shè)的對策
面對上述難題,我們認為應該從如下3個方面予以應對。
第一,政策制定者、研究者和建設(shè)者應該重視個人語言調(diào)查數(shù)據(jù)在城市管理中的重要作用。重視語言的習得、使用、能力等情況,不僅是對語言本身的關(guān)注,更是對與語言密切聯(lián)系的身份認同、文化資源的管理。不僅應該在人口調(diào)查和家庭情況調(diào)查中增加與語言相關(guān)的統(tǒng)計字段(如普通話水平、方言使用情況、外語習得水平和年齡等),而且要將調(diào)查數(shù)據(jù)納入城市市民的數(shù)據(jù)集合中。城市語言規(guī)劃應該向著數(shù)據(jù)化、動態(tài)化方向發(fā)展,根據(jù)城市市民語言大數(shù)據(jù),更加科學有效地制定政策,改變當前個體語言使用和能力數(shù)據(jù)作為數(shù)據(jù)孤島或者數(shù)據(jù)缺失的現(xiàn)狀。
第二,推進智慧城市建設(shè),培養(yǎng)適應智慧時代發(fā)展的語言人才,需要打破學科壁壘,推動融合發(fā)展(戴煒棟,等2020)。應以新文科的發(fā)展趨勢和要求,用AI賦能語言學科知識體系(蔡三發(fā),等2020)。在新文科建設(shè)的背景下,融合發(fā)展并非簡單的過去“外語+專業(yè)”的復合型人才培養(yǎng)方式,而是在培養(yǎng)過程中強調(diào)技術(shù)意識、工具意識和數(shù)據(jù)意識。在掌握語言技能和知識的大前提下,能夠具備運用技術(shù)工具、處理語言數(shù)據(jù)、創(chuàng)造性地解決理論和現(xiàn)實問題的能力(劉海濤,林燕妮2018),這符合新文科的發(fā)展趨勢和要求。圖1顯示了智慧城市語言服務(wù)對人才的具體需求。
智慧化的語言服務(wù)人才體現(xiàn)了跨學科、多學科交叉協(xié)同解決問題的特點。圖1顯示:(1)具備高水平語言交際能力的人才能夠發(fā)揮自己的特長,在語言交際、需求溝通等方面發(fā)揮作用;(2)人才應該了解數(shù)據(jù)科學,具備一定的數(shù)據(jù)處理能力,適應語言建模、數(shù)據(jù)分析和語料庫建設(shè)與維護的工作;(3)人才應該具有項目管理能力,在項目流程、人員管理和決策部署方面能夠推進相應建設(shè);(4)人才應該具備產(chǎn)品開發(fā)能力,這種能力當前主要是由計算機科學學科來培養(yǎng)。如圖2所示,整個智慧化語言服務(wù)項目從用戶需求分析到流程梳理、原型開發(fā)、調(diào)試修改、部署測試以及最終服務(wù)推廣,需要不同學科知識、不同能力和素質(zhì)的團隊合作。除了產(chǎn)品開發(fā)、測試、部署等環(huán)節(jié)需要專業(yè)技術(shù)人才的參與,其他環(huán)節(jié)語言人才都能夠參與其中。適應智慧城市乃至智慧時代發(fā)展的語言人才,應該在具備良好語言交際能力的基礎(chǔ)之上,具備相應的技術(shù)思維和實踐經(jīng)驗,從而增強適應性,提高解決問題的能力。這一響應技術(shù)變革的學科訴求并非要求語言類專業(yè)人才放棄語言能力的本位,而是在滿足語言技能學習之外提升技術(shù)思維、工具技能和數(shù)據(jù)處理能力,從而使得語言專業(yè)學生不再局限于語言技能,而是具有一定的數(shù)據(jù)思維、技術(shù)能力和實踐方法,能夠適應新的包括智慧城市建設(shè)在內(nèi)的各項新時代建設(shè)需求。
第三,語言數(shù)據(jù)乃至智慧語言服務(wù)的發(fā)展,需要有更加系統(tǒng)化、制度化的頂層設(shè)計和創(chuàng)新。語言服務(wù)的智慧化依賴自然語言處理技術(shù)的進步,而算法的創(chuàng)新需要有足夠多的數(shù)據(jù)支持。在缺乏語料數(shù)據(jù)的情況下,許多研究和應用都難以展開。在數(shù)據(jù)收集和處理方面,需要改變當前語料數(shù)據(jù)的零散化和局限性,建立和完善語料數(shù)據(jù)的國家標準或者行業(yè)標準,開發(fā)具有自主知識產(chǎn)權(quán)的大規(guī)模多語種平行語料庫建設(shè)、管理、維護工具,建設(shè)標準化的語料研究的托管中心。應減少重復勞動,促進學術(shù)研究對接產(chǎn)業(yè)需求,讓語言數(shù)據(jù)向著標準化、大規(guī)模、可移植、可復用的方向發(fā)展,轉(zhuǎn)變現(xiàn)有分散化、難應用、功能單一的現(xiàn)狀。
六、智慧城市的語言服務(wù)發(fā)展前景
隨著新技術(shù)的不斷發(fā)展,語言服務(wù)未來會向著更加智能化和集中化的方向發(fā)展。“智能化”指的是科技在語言服務(wù)中所起的作用將更加顯著,以信息技術(shù)為驅(qū)動,機器和人員共同為城市市民提供語言服務(wù)。“集中化”指的是語言服務(wù)產(chǎn)業(yè)集中度增強,由于技術(shù)和資本的集中化,少數(shù)科技企業(yè)有能力重構(gòu)產(chǎn)業(yè)鏈,為全國乃至全球提供特定類型的語言服務(wù)。
以翻譯產(chǎn)業(yè)為例,近年來越來越多的大型信息技術(shù)服務(wù)商進入翻譯市場,提供機器翻譯和人工翻譯等服務(wù)。與過去的中小型翻譯公司、個人工作室相比,大型IT企業(yè)運用項目管理、語音識別、計算機輔助翻譯、機器翻譯等技術(shù),不斷優(yōu)化業(yè)務(wù)流程,提高業(yè)務(wù)效率。未來的翻譯服務(wù)將是在科技公司組織下,依靠少數(shù)精通專門語言的翻譯服務(wù)人員,在計算機翻譯系統(tǒng)的支持下,滿足市場需求。以景區(qū)導覽為例,近年來一些科技企業(yè)以手機應用的形式為千萬用戶提供全國2萬余個景區(qū)的導覽服務(wù)。在語言教育領(lǐng)域,部分科技公司的產(chǎn)品能夠為全國的兒童語言學習提供相應服務(wù)。
通過上述案例可以發(fā)現(xiàn),過去的語言產(chǎn)業(yè)從業(yè)者如翻譯、導游、教師等,在新技術(shù)和智慧化的變革之下,不再以分散的個人的方式提供服務(wù),而是成為科技企業(yè)重構(gòu)的語言服務(wù)產(chǎn)業(yè)鏈的一部分。相較于過去的語言服務(wù),這一變革從宏觀視角具有經(jīng)濟和技術(shù)層面的巨大優(yōu)勢。在云計算、大數(shù)據(jù)等新技術(shù)加持下,語言服務(wù)從未有像今天這樣輕松易得,便宜高效。但是轉(zhuǎn)型也帶來了資源機會的不平衡、壟斷、失業(yè)等一系列問題。在某些領(lǐng)域,對技術(shù)的差別化利用在不同人群之間劃出了“數(shù)字化鴻溝”:年輕群體、中產(chǎn)群體等能夠更好地學習和掌握技術(shù)服務(wù)的人群能夠獲得相應服務(wù),而老年人、貧困群體難以獲得相應服務(wù)。由于技術(shù)發(fā)展帶來的產(chǎn)業(yè)和服務(wù)轉(zhuǎn)型引起的社會公平問題,值得做進一步的實證調(diào)查和研究。
在智慧化、技術(shù)化程度日益加深的時代,城市語言服務(wù)的智慧化轉(zhuǎn)型不僅是一個技術(shù)問題,也是一個具有人文性的課題。語言學科對于智慧城市的研究不僅應該從計算語言學、語料庫等“技術(shù)視角”切入(馮志偉2018),還應該從社會語言學和語言規(guī)劃等“人文視角”,研究語言智能對不同人群的影響。在智慧化轉(zhuǎn)型的過程中如果只關(guān)注技術(shù)指標和經(jīng)濟效益,可能造成只重視通用語和強勢語言的數(shù)字化,導致語言服務(wù)逐步向著標準化、單語化發(fā)展,引起城市語言生態(tài)的單一化。同時,人群對于技術(shù)變革的接受度和可得性存在差異,人文研究應該特別關(guān)注人在智慧化時代的生存狀態(tài)和處境。應警惕工具理性和技術(shù)思維的單向度價值體系,保持人文精神的批判性,為政府決策和城市建設(shè)提供多元化的視角和聲音。
七、結(jié) 語
智慧城市建設(shè)的開展向語言服務(wù)、語言數(shù)據(jù)、語言管理等領(lǐng)域的理論和實踐提出了新的要求,展現(xiàn)了新的機遇。隨著智慧城市建設(shè)的深入,語言服務(wù)的數(shù)字化轉(zhuǎn)型不斷發(fā)展,智慧導覽、云翻譯、語言服務(wù)機器人等領(lǐng)域已經(jīng)產(chǎn)生一系列相應的產(chǎn)品和成果,語言數(shù)據(jù)對于智慧城市建設(shè)的重要意義逐步顯現(xiàn)。但是,受限于語言人才、行業(yè)標準、立法規(guī)范等難點,智慧城市的語言服務(wù)仍然面臨著不少困難。推進智慧城市建設(shè),培養(yǎng)適應智慧城市發(fā)展的語言人才,需要強調(diào)打破學科壁壘,推動融合發(fā)展;創(chuàng)新人才培養(yǎng)方式;建立和完善語料的國家標準或者行業(yè)標準;開發(fā)具有自主知識產(chǎn)權(quán)的工具,出臺相應的法律意見。與此同時,應該關(guān)注和研究語言服務(wù)智慧化過程中的產(chǎn)業(yè)轉(zhuǎn)型和由此帶來的數(shù)字化鴻溝、資源機會不公平、壟斷等問題。智慧城市的語言服務(wù)研究在重視語言服務(wù)技術(shù)化的同時,也應該堅守價值評判的人文性,關(guān)注城市市民特別是弱勢群體的數(shù)字化生存處境。
參考文獻
蔡三發(fā),王 倩,沈 陽 2020 《人工智能賦能:高校學科建設(shè)的創(chuàng)新與發(fā)展——訪中國工程院院士陳杰教授》,《電化教育研究》第2期。
陳 鵬 2016 《語言產(chǎn)業(yè)經(jīng)濟貢獻度研究的若干問題》,《語言文字應用》第3期。
戴煒棟,胡壯麟,王初明,等 2020 《新文科背景下的語言學跨學科發(fā)展》,《外語界》第4期。
馮志偉 2018 《機器翻譯與人工智能的平行發(fā)展》,《外國語(上海外國語大學學報)》第6期。
高 豐 2015 《開放數(shù)據(jù):概念、現(xiàn)狀與機遇》,《大數(shù)據(jù)》第2期。
李宇明 2014 《語言服務(wù)與語言消費》,《教育導刊》第7期。
李宇明 2016 《語言服務(wù)與語言產(chǎn)業(yè)》,《東方翻譯》第4期。
李宇明 2020 《數(shù)據(jù)時代與語言產(chǎn)業(yè)》,《山東師范大學學報(社會科學版)》第5期。
劉海濤,林燕妮 2018 《大數(shù)據(jù)時代語言研究的方法和趨向》,《新疆師范大學學報(哲學社會科學版)》第
1期。
劉慶峰 2018 《“AI的未來:算法突破、腦智同飛、人機耦合”》,《上海信息化》第10期。
彭 蘭 2020 《“健康碼”與老年人的數(shù)字化生存》,《現(xiàn)代視聽》第6期。
屈哨兵 2007 《語言服務(wù)研究論綱》,《江漢大學學報(人文科學版)》第6期。
屈哨兵 2010 《關(guān)于〈中國語言生活狀況報告〉中語言服務(wù)問題的觀察與思考》,《云南師范大學學報(哲學社會科學版)》第5期。
王海蘭 2018 《城市公共語言服務(wù)的內(nèi)涵與評估框架構(gòu)建》,《云南師范大學學報(哲學社會科學版)》第2期。
王 輝 2020 《國家治理視野下的應急語言能力建設(shè)》,《語言戰(zhàn)略研究》第5期。
王靜遠,李 超,熊 璋,等 2014 《以數(shù)據(jù)為中心的智慧城市研究綜述》,《計算機研究與發(fā)展》第2期。
許家金 2017 《語料庫研究學術(shù)源流考》,《外語教學與研究》第1期。
許 曄,郭鐵成 2014 《IBM“智慧地球”戰(zhàn)略的實施及對我國的影響》,《中國科技論壇》第3期。
余玉秀 2019 《AI +翻譯:人工智能與語言行為人機耦合應用研究》,《傳媒》第8期。
張 偉,鄭中原 2004 《國際化城市的語言服務(wù)環(huán)境建設(shè)思路》,《重慶工商大學學報(社會科學版)》第6期。
仲偉合,許勉君 2016 《國內(nèi)語言服務(wù)研究的現(xiàn)狀、問題和未來》,《上海翻譯》第6期。
宗成慶 2008 《統(tǒng)計自然語言處理》,北京:清華大學出版社。
鄒 娟 2019 《“進寶”機器人將亮相第二屆進博會,提供雙語問答咨詢等服務(wù)》,https://www.thepaper.cn/newsDetail_forward_4002867。
Agerri, R., X. Artola, Z. Beloki, et al. 2015. Big data for Natural Language Processing: A streaming approach. Knowledge-Based Systems 79, 36–42.
Gorecky, D., M. Schmitt, M. Loskyll, et al. 2014. Human-machine-interaction in the industry 4.0 era. Paper presented at the 2014 12th IEEE international conference on industrial informatics (INDIN).
Katal, A., M. Wazid & R. H. Goudar. 2013. Big data: Issues, challenges, tools and good practices. Paper presented at the 2013 Sixth international conference on contemporary computing (IC3).
Kerr, E. B. & S. R. Hiltz. 2013. Computer-Mediated Communication Systems: Status and Evaluation. Pittsburgh: Academic Press.
責任編輯:魏曉明