“雙十一”來到第11年,直播風頭正勁?!八信边@句來自主播李佳琦的口頭禪,成為直播時代的宣言,無數(shù)人為之掏空口袋。
為了更好地觀看體驗,淘寶自主研發(fā)了全新的音視頻實時通信架構(gòu),實現(xiàn)了大規(guī)模低延時直播,從原先5秒~7秒的延時降低至2秒以內(nèi),提升了用戶和主播的互動效率,此外,人工智能技術(shù)還可以實時識別主播正在講解的商品,陳列在直播頁面中。
沒錯,時代的風吹到哪,技術(shù)先行抵達。直播、短視頻當?shù)?,這類“雙十一”新玩法的背后,也有不斷進步的AI。
進出直播間的剁手黨成千上萬,分分鐘形成刷屏之勢,主播分身乏術(shù)。這時候,他的AI秘書就登場了。給主播打下手,提供主播問答、商品問答、優(yōu)惠券問答等服務(wù)都不在話下,也就是說,你在直播間問的問題,大多都是AI助手在解答。
據(jù)阿里巴巴達摩院資深總監(jiān)、阿里巴巴集團智能服務(wù)事業(yè)部總經(jīng)理趙昆介紹,AI秘書使用了自然語言理解和基于知識圖譜問答等技術(shù),能夠精確解析直播間觀眾對于商品和主播的多種復雜表達和問法,在直播場中實現(xiàn)多對一溝通的高效快速響應,大比例提高直播間的客戶問題的回復率、解決率。除了基于文字,AI客服還可以進行基于圖片的智能問答。
方便了剁手黨,賣家同樣受惠于AI?!半p十一”期間,賣家需要在短時間內(nèi)制造大量宣傳圖、海報圖等,圖像智能生成技術(shù)就派上了用場?;趫D像智能生成技術(shù),AI設(shè)計師可以改變傳統(tǒng)的設(shè)計模式,在短時間內(nèi)完成大量橫幅廣告、海報圖和會場圖的設(shè)計。賣家只需要任意輸入想達成的風格、尺寸,系統(tǒng)就能代替人工完成素材分析、摳圖、配色等耗時耗力的設(shè)計項目,實時生成多套符合要求的設(shè)計解決方案。
據(jù)阿里巴巴達摩院資深算法專家謝宣松介紹,目前該系統(tǒng)已經(jīng)達到了高級設(shè)計師的水準,每秒可以提供幾十種方案、可以設(shè)計8000張不同的海報。
圖片之外,短視頻也成了標配。謝宣松介紹,短視頻智能設(shè)計產(chǎn)品基于圖像智能識別技術(shù)和視頻智能生成技術(shù),幫助用戶在極短時間內(nèi)完成大量的商品營銷類短視頻的設(shè)計和制作。
賣貨到全世界,語言不通怎么辦?“雙十一”之前,機器翻譯技術(shù)已經(jīng)經(jīng)歷了升級,對話機器人可以幫助全世界中小賣家將產(chǎn)品詳情與評論自動翻譯成當?shù)卣Z言,還實現(xiàn)了實時AI語言翻譯的客戶服務(wù)與業(yè)務(wù)咨詢,涵蓋64種語言方向。當然,獲取商品信息光靠看商家網(wǎng)頁還不夠,有問題找客服,海外消費者也不例外。在國內(nèi),承擔客服職責的是對話機器人,這兩年,它還有了國際版,專門服務(wù)海外業(yè)務(wù)平臺。
據(jù)趙昆介紹,對話機器人精通英語、法語、泰語、西班牙語、阿拉伯語等11種語言,兩周就能學一門新外語。
不過,它使用的并不是機器翻譯技術(shù),而是一種自然語言處理技術(shù)跨語言學習(Cross-lingual Learning)?!靶≌Z種缺乏大規(guī)模訓練語料,很難通過過去的機器學習技術(shù)習得,跨語言學習能夠克服資源匱乏的瓶頸。”趙昆解釋說,跨語言學習是一種多語言的自然語言處理技術(shù),它通過語言之間的知識遷移,借助中文、英文等語料資源充足的語言,幫助算法模型提升理解小語種的能力,從而快速拓展機器人的多語種支持功能。借助跨語言學習技術(shù),對話機器人還能掌握更多語言,甚至包括土耳其語、烏爾都語等小語種。
他表示,基于語言之間的交叉映射關(guān)系,對機器來說,在資源匱乏的情況下,通過將多種語言混合,學習語言間的共性,反而能比學習單一語言效果更好。
今年“雙十一”,語音購物千呼萬喚始出來:消費者只要對天貓精靈說出想要購買的商品,就能直接下單;如果開通了“聲紋支付”功能,還可以直接語音付款。
“語音購元年”,聽起來科技感十足,據(jù)報道,已有數(shù)百萬人體驗了語音購物,其中超過半數(shù)的用戶是首次嘗試。聲紋識別技術(shù)采用基于深度網(wǎng)絡(luò)的注意力嵌入式模型,通過網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)設(shè)計,模擬了基于人耳感知的頻譜特征,可以在一定程度上消除同一人在不同場景發(fā)音下的頻譜特征差異干擾,顯著提升遠場交互下的聲紋識別性能。
說話就能付錢,如何確保安全?阿里巴巴人工智能實驗室語音技術(shù)首席科學家聶再清介紹,作為首個達到商用級別的聲紋識別技術(shù)智能音箱,天貓精靈的聲紋識別率已達99%,這是它支持聲紋支付功能的基礎(chǔ),在支付級應用下,用戶只要通過3次不超過10秒的交互語音,聲紋識別技術(shù)就可以準確刻畫用戶的魯棒性聲紋特征,實現(xiàn)超過99%的識別準確度。
不僅如此,運用中文識別的自然語言理解算法,語音設(shè)備可以準確定位消費者需要購買的商品,以平臺大數(shù)據(jù)為基礎(chǔ),依托聲紋推薦能力,為消費者進行個性化推薦。
此外,今年“雙十一”,消費者還可以體驗AR試妝產(chǎn)品,AR試妝通過標準化工具拿到彩妝色號、材質(zhì)等數(shù)字信息,通過AI+AR技術(shù)讓用戶看到同樣商品在自己臉上呈現(xiàn)出的不同效果。