国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語音合成技術(shù)在廣播尋人系統(tǒng)中的應(yīng)用與開發(fā)

2015-01-08 02:16朱文元
中國科技縱橫 2014年12期

朱文元

【摘 要】 本文以案例的形式,以北京故宮博物院廣播尋人系統(tǒng)為基礎(chǔ),結(jié)合筆者所在單位的需求,闡述當前語音技術(shù)在智能公共廣播尋人系統(tǒng)中的應(yīng)用以及軟件的設(shè)計開發(fā),包括設(shè)計特點、要求、思路、架構(gòu)、效果等。

【關(guān)鍵詞】 語音技術(shù) 智能廣播 廣播尋人

近年來,隨著科技的不斷進步,用戶對新技術(shù)應(yīng)用的要求也日益增強。傳統(tǒng)意義下的公共廣播系統(tǒng)在很多方面都不能滿足當今用戶的實際需求。語音合成、語音識別和手寫識別作為智能人機交互的三項核心技術(shù),正在悄悄地影響和改變著人們的生活,讓人們的工作生活更加便捷與輕松。語音合成技術(shù)可以讓各種設(shè)備“開口講話”,把各種文本信息以語音的方式播報;語音識別技術(shù)可以讓各種設(shè)備“聽懂”我們的話;手寫識別技術(shù)可以幫助人們從各種設(shè)備中繁瑣的按鍵操作中解脫出來,輕松輸入文字。伴隨著新技術(shù)的不斷進步和成熟,其應(yīng)用也涉及到了人們工作和生活的方方面面。

尋人廣播屬于公共廣播系統(tǒng)服務(wù)性廣播分類。廣泛應(yīng)用于賓館、旅館、商場娛樂設(shè)施及大型公共活動場所等。窗口廣播尋人服務(wù)一直是故宮博物院廣播室的主要工作之一,多年來,一直是通過人工話筒播放尋人信息,近年來隨著參觀人數(shù)的不斷上升,服務(wù)對象也擴展到了來自全球的朋友們,在日常的工作中也發(fā)現(xiàn)了許多需要改進的地方,如語言問題,導致交流不便;發(fā)音質(zhì)量無法保證;不允許外國友人自己廣播等問題。為此故宮博物院設(shè)計開發(fā)了智能語音廣播尋人系統(tǒng),通過手寫識別,文字轉(zhuǎn)語音的智能人機交互模式,經(jīng)過廣播內(nèi)容確認的步驟,實現(xiàn)中英文以及多國語言的自動播放,這樣就能保證規(guī)范的發(fā)音,以及語言不通等問題,也有利于更好的服務(wù)大眾,提升故宮的服務(wù)質(zhì)量。

1 廣播尋人系統(tǒng)設(shè)計思想和原則

廣播尋人系統(tǒng)設(shè)計本著技術(shù)先進性、實用性、靈活性和可擴展性的思想和原則,根據(jù)故宮博物院本身的特點設(shè)計開發(fā)。采用現(xiàn)代最新語音合成、語音識別及手寫識別等比較成熟和完善的技術(shù),滿足操作方便,維護簡單,便于管理的要求。系統(tǒng)設(shè)計中充分考慮尋人系統(tǒng)與其它廣播系統(tǒng)的集成性,確保系統(tǒng)總體結(jié)構(gòu)的先進性、合理性、可擴展性和兼容性,使整個系統(tǒng)可以隨著技術(shù)的發(fā)展和進步,不斷得到充實和提高。

2 廣播尋人系統(tǒng)設(shè)計要求

故宮博物院每天都接待大量的來自國內(nèi)外的觀眾參觀,作為一個公共機構(gòu)場合,保證廣播內(nèi)容的準確性、安全性尤為重要。為此廣播尋人內(nèi)容的格式要求相對固定,通過觸屏觀眾只能輸入姓名、地點及聯(lián)系方式。語音合成要求支持多國語言,對觀眾輸入的內(nèi)容,要求播放聲音連貫自然。另外應(yīng)用軟件的易用性已經(jīng)成為用戶體驗的一個關(guān)鍵因素,是不可或缺的一部分,直接影響工作的質(zhì)量和效率。要求設(shè)計時在視覺、交互流程的感覺上,簡單易操作,根據(jù)使用者的特點,高效適應(yīng)用戶的使用需求和習慣。

3 廣播尋人系統(tǒng)架構(gòu)

整個系統(tǒng)分為兩個部分,簽批端和播報端。簽批端用來讓游客填寫信息,并將信息發(fā)送給播報端,播報將用戶播報的信息進行語音播報,并將播報的信息保存到數(shù)據(jù)庫中,播報端支持工作人員手動對要播報的信息進行修改,同時也支持臨時播報的功能。

簽批端讓用戶通過手寫屏完成輸入文字,修改等功能,將被尋人的姓名、所屬國家/旅行團、尋找人姓名及聯(lián)系方式等信息。當用戶在填寫廣播尋人的具體信息時,手寫屏界面應(yīng)該包括下列內(nèi)容:(1)客戶幫助信息:提示客戶此系統(tǒng)如何使用,使得使用者對于廣播內(nèi)容一目了然。(2)手寫輸入模塊:游客使用手寫筆,在屏幕上的米字格中填寫相關(guān)內(nèi)容。其中,當游客使用的手寫筆懸浮在米字格上方的時候,格子會自動放大,方便客戶填寫。如果需要修正輸入內(nèi)容,在原位置上重新書寫該文字即可。(3)語種選擇:正常情況下,語種選擇按鈕默認為灰色。當工作人員確認需要觀眾用其他語言輸入的時候,在審批翻譯界面激活該按鈕,于是手寫輸入界面的語種選擇按鈕變?yōu)榭蛇x。播報端主要用來處理需要播報的數(shù)據(jù),工作人員在此模塊完成審批、校對、審查翻譯結(jié)果,查詢歷史記錄和合成語音廣播等功能。播報端界面應(yīng)包括以下內(nèi)容:①實時顯示觀眾輸入的內(nèi)容。②工作人員看到外國游客,激活手寫輸入模塊的語言選擇按鈕。“激活”按鈕可以控制“簽批端首界面”中語言選擇的按鈕能否使用,只有在簽批端顯示“首界面”,并且語言按鈕不可用的時候,“激活”按鈕才能使用。③翻譯客戶輸入的語言到漢字。④語音合成廣播模塊,單獨界面合成廣播的錄音文件。⑤當收到新的要播報的信息時,“新信息”按鈕顯示需要播報的消息的個數(shù)。⑥歷史廣播尋人記錄查詢、統(tǒng)計功能。播報端提供對已存儲數(shù)據(jù)的搜索功能,用戶可以按照“姓名”、“城市和團體”、“日期”來進行搜索。在搜索輸入框中沒有數(shù)據(jù)時,搜索按鈕不能使用,當有數(shù)據(jù)時,搜索按鈕能夠使用,并且該按鈕有黃色背景,點擊該按鈕可以進行搜索。播報端提供了對已經(jīng)播報的信息進行統(tǒng)計的功能,統(tǒng)計時可以選擇統(tǒng)計的單位“年”、“月”、“日”。然后可以在日期的編輯框中選擇日期。點擊“統(tǒng)計”按鈕會生成一個餅狀圖,每一塊餅狀圖的項在右側(cè)的區(qū)域進行詳細的說明。以“年”為單位時,可以最多統(tǒng)計10年的數(shù)據(jù),以“月”為單位時,可以最多統(tǒng)計36個月的數(shù)據(jù),以“日”為單位時,可以最多統(tǒng)計93天的數(shù)據(jù)。

4 系統(tǒng)運行環(huán)境

Windows XP Professional SP2。

4.1 硬件配置

Wacom 14/15寸手寫輸入屏一個;

INTEL凌動芯片主機一臺;

工作站一臺。

4.2 非功能性參數(shù)要求

對于手寫筆跡顯示響應(yīng)速度應(yīng)該小于1s。其他各關(guān)鍵步驟相應(yīng)時間不得長于3s;系統(tǒng)至少應(yīng)該可以連續(xù)無故障運行10天以上,不能經(jīng)常出現(xiàn)導致系統(tǒng)崩潰,死機的嚴重BUG;對于第一次接觸本系統(tǒng)的游客,應(yīng)該不用工作人員介紹即可了解如何使用;系統(tǒng)應(yīng)該有用戶名、口令登錄機制,不得包含任何后門,和潛在的安全性問題。

5 結(jié)語

語音合成技術(shù)在故宮博物院智能廣播尋人系統(tǒng)中的應(yīng)用,改變了以往工作中遇到的語言不通、語言發(fā)音不標準等問題,提高了工作質(zhì)量,加強了工作效率,使得工作更加標準化,在更好的服務(wù)公眾,提升故宮博物院窗口服務(wù)形象方面發(fā)揮了重要作用,反應(yīng)出了良好的效果。endprint