印度《經(jīng)濟(jì)時(shí)報(bào)》網(wǎng)站2023年3月7日消息,谷歌已經(jīng)分享了更多關(guān)于通用語音模型(USM)的信息,該公司將這個(gè)系統(tǒng)描述為實(shí)現(xiàn)其目標(biāo)的“關(guān)鍵的第一步”。2022年11月,該公司宣布計(jì)劃創(chuàng)建一個(gè)支持世界上1000種最常用語言的語言模型以擊敗ChatGPT,同時(shí)也公布了USM模型,現(xiàn)在距離其目標(biāo)更近了一步。
谷歌聲稱,目前USM支持100多種語言,并將作為一個(gè)更大系統(tǒng)的“基礎(chǔ)”。谷歌公司將USM描述為一組最先進(jìn)的語音模型,具有20億個(gè)參數(shù),訓(xùn)練了1200萬小時(shí)的語音和280億個(gè)文本句子,涵蓋了300多種語言。谷歌在一篇博客文章中表示,USM用于優(yōu)兔時(shí),不僅可以對英語和普通話等廣泛使用的語言進(jìn)行自動(dòng)語音識別(ASR),還可以對像阿姆哈拉語、宿務(wù)語、阿薩姆語和阿塞拜疆語等資源匱乏的語言進(jìn)行識別。與此同時(shí),谷歌預(yù)計(jì)將在不久的將來為其產(chǎn)品引入一系列人工智能功能。