涂君軍
阿里和小米智能音箱背后的語音交互解決方案提供商
“你們這個技術,先封閉一段時間,等我們的產品發(fā)布了,再開放給別的客戶?!饼垑糁裨谒急伛Y負責市場的這些年里,總能聽到客戶類似的要求。而作為一家技術公司的CMO,她也很清楚公司的技術不能等。
今年7月,阿里和小米先后發(fā)布了各自的智能音箱“天貓精靈”和小米“AI音箱”,其背后的語音交互解決方案提供商正是思必馳。
思必馳創(chuàng)立于2007年,當時人工智能的概念還沒普及,做語音交互的思必馳已經(jīng)把自己定義為一家人工智能公司。隨著公司業(yè)務的發(fā)展,人工智能熱度逐漸攀升,尤其是亞馬遜Echo智能音箱在國外大獲成功,這讓思必馳開始考慮:能不能把語音交互的能力完全開放給客戶?
內置在Echo中的Alexa可以被看成是亞馬遜版的Siri語音助手。同時,“Alexa”也是Echo的喚醒詞。2015年6月,亞馬遜宣布第三方開發(fā)者可以在Alexa平臺上開發(fā)基于語音的技能(Skill),而這些技能可以通過Echo智能音箱被用戶使用。
簡單來說,開發(fā)者在Alexa平臺上為音箱編寫提醒、天氣、查詢、日歷等功能供用戶使用,而Alexa平臺就像是“音箱的App Store”。
“現(xiàn)在Alexa平臺上面有15000多個技能,但是活躍的技能不到1%?!饼垑糁駥?chuàng)業(yè)邦(微信搜索:ichuangyebang)談道,“關聯(lián)信用卡、配置語音賬號已經(jīng)是一個不小的門檻?!?/p>
技能開發(fā)這一塊會耗費廠商大量的精力、人力和財力,所以國內廠商都紛紛發(fā)布了自己的技能開放平臺:騰訊發(fā)布了小微,百度做了DuerOS,科大訊飛有AIUI,Rokid在推全棧語音開放平臺,出門問問也發(fā)布了自己的AI開放平臺。據(jù)不完全統(tǒng)計,目前國內約有40余家企業(yè)開放了“語音平臺”。
小微Skill開放平臺開放語義分析能力給第三方,由小微提供設備控制、內容資源、服務能力,其內置Skill以QQ音樂、騰訊視頻等騰訊系產品為主。百度的DuerOS已經(jīng)與國內外百余家家電、芯片和服務提供商建立了生態(tài)合作關系,并聯(lián)合小魚在家推出了視頻通話機器人“分身魚”。小米也為AI音箱發(fā)布了開放平臺,呼吁開發(fā)者為“小愛同學”開發(fā)更多技能。
思必馳在推出開放平臺上錯過了最佳時機,但勝在走了一條“接地氣”的路線。
9月初思必馳正式發(fā)布DUI開放平臺,而在這之前,思必馳已經(jīng)針對開發(fā)者舉辦過多次開發(fā)者沙龍。
思必馳VP、DUI負責人趙恒藝在和合作伙伴打磨產品的過程中發(fā)現(xiàn)了很多痛點需求,比如:“客戶希望自行定義喚醒詞,實時在線更新,而有些熱詞識別錯誤或語義解析錯誤在當前需要重新訓練模型(才能解決),效率很低。還有一些客戶想做出有更大差異化的產品,對交互流程的各個環(huán)節(jié)也都有自己的想法?!?/p>
基于對痛點需求的分析,思必馳團隊將DUI平臺的可定制化范圍擴及全鏈路,平臺的每個功能模塊均可自定義,包括喚醒詞定制及參數(shù)設置、語音識別、語言模型、語義解析、多輪對話、自然語言生成和語音合成等。
相對Alexa的門檻,開發(fā)者在思必馳DUI平臺一經(jīng)注冊即可體驗可視化組件操作、網(wǎng)頁在線編輯、快速生成Demo等功能。
每個客戶都需要自己個性化的東西,而在針對客戶需求進行定制化適配的過程中,思必馳也有了自己的思考,比如如何回復回話、對話的邏輯、圖形用戶界面等同樣可以定制。此外,聲音在DUI平臺也可以定制,用戶可以自己上傳自己的聲音,生成一個專屬于自己的TTS個性合成音。也就是說,在取得授權的情況下,用戶可以聽到吳亦凡的Freestyle、鹿晗的“大家好,介紹一下……”這種個性化的語音。
在此前,客戶使用思必馳的平臺實現(xiàn)落地需要花費兩三個月,而在DUI平臺上,通過縮減客戶在前端設備的調試時間,只需要一周即可。
除了提供智能語音語言交互技術以外,思必馳DUI開放平臺還具有多種優(yōu)秀特性以幫助減輕開發(fā)者的運營壓力,例如:多版本管理,不同產品可對接不同分支;增量熱更新,在線秒級更新,用戶無感知;可視化大數(shù)據(jù),提供用戶畫像和運營數(shù)據(jù)支持,更可自定義數(shù)據(jù)維度,讓開發(fā)者快速優(yōu)化產品體驗。
趙恒藝總結,DUI平臺是一整套技術模塊,而他們則將這些技術模塊全部轉化成了產品側的解決方案。比如針對車載解決方案、故事機、機器人等家居解決方案,DUI平臺都匹配了不同的場景。而思必馳會在實現(xiàn)交互的整個過程中把這些鏈條都打散,使其變得更加靈活,因而能讓客戶更好地實現(xiàn)定制。平臺上集成了百度地圖、高德地圖、騰訊音樂、酷愛音樂、大眾點評、美團等,匹配后端的資源后,平臺可以做到用戶級的自適應。
據(jù)悉,思必馳為DUI平臺專設了2億人民幣基金,用以扶持平臺上優(yōu)秀的開發(fā)者、應用案例和創(chuàng)業(yè)項目。
從亞馬遜的Echo,谷歌的Google Home,到蘋果的Home Pod,再到Rokid、天貓精靈、小米AI音箱,在人工智能的火熱之下,智能音箱“百箱大戰(zhàn)”中比拼的除了硬件和工業(yè)設計層面的差異性,更重要的是各廠商提供資源和服務的能力。
訊飛、思必馳、出門問問等公司在提供語音交互解決方案的同時也會與內容提供商進行資源合作,把內容商的資源打包輸出給中小型廠商。
以有聲讀物為例,喜馬拉雅和凱叔講故事兩者的體量、定位并不相同,為兒童、早教打造的智能家居產品更偏向與凱叔講故事合作,因為其受眾更加匹配和精準。
而在“百箱大戰(zhàn)”的背后,廠商、技術提供方、內容商的競合關系對產品的體驗有著不可忽視的影響。