shoot
晚上10點至早晨6點是直播行業(yè)公認的閑置時段,這個時候打開抖音、淘寶等直播平臺,仍可以看到有“主播”妝容精致,十分有耐心地在直播間推銷著各類美食、酒旅團購,不過大多都是在進行單純的講解,涉及的品類也不多,除了本地生活團購就是百貨和快消品。而創(chuàng)造出這些“日不落”直播間的主播們,有幾個是真人?
“高效不知疲倦”的數(shù)字虛擬人一直被期待成為未來最強“打工人”,這也是互聯(lián)網(wǎng)大廠們熱衷于“造人”的原始動力。而虛擬人的誕生速度在資本和技術的裹挾下的確越來越快。
近日,騰訊云發(fā)布了智能小樣本數(shù)智人生產(chǎn)平臺,在官方介紹中,這一平臺只需三分鐘的視頻素材就可以完成建模并生成高清人像,24小時內(nèi)就能制作出與真人近似的所謂“數(shù)智人”。最重要的是,騰訊云個人版“造人”成本已經(jīng)從百萬級別降到了數(shù)千元,需要高精定制的企業(yè)版也降至萬元左右,大幅降低了虛擬人的使用門檻。
不過,騰訊云還不是這個領域最激進的玩家。2021年開始,國內(nèi)外虛擬人就乘著元宇宙的東風扎堆出生:游戲廠商EpicGames在2021年3月推出虛擬人創(chuàng)作平臺,號稱可以在幾分鐘內(nèi)創(chuàng)建接近真人的虛擬人(Metahuman);華為云2021年9月推出首個虛擬人員工“云笙”,可以進行簡單的對話交流和手語翻譯;阿里則在2022年1月推出虛擬人東東,進入直播間宣傳冬奧會;前身為微軟人工智能團隊的小冰更是早已在商業(yè)化上“先行一步”,推出眾多細分行業(yè)虛擬人,如紅杉中國虛擬分析師“Hóng”、虛擬歌手“洛天依”、萬科集團數(shù)字員工“崔筱盼”、虛擬主播“小堂妹”等。
這一階段,虛擬人大多有著“神態(tài)僵硬、對話交互性弱、視頻效果的粗糙感顯而易見”的缺陷,其“個性”更多是由人為賦予,而非AI創(chuàng)造,宣傳意義大于實踐。直到AI技術躍進到能大規(guī)模產(chǎn)出商用水平的產(chǎn)品。
去年12月末至今,文本、圖像等領域的大模型應用快速落地,使得AIGC產(chǎn)品如雨后春筍般出現(xiàn),虛擬人也開始加速在各行各業(yè)推進,頭部大廠的競爭也在“卷”向同質化。
商湯先于騰訊云發(fā)布的“日日新”大模型體系,僅需一段5分鐘真人視頻素材就能生成虛擬人;百度也發(fā)布了基于文心大模型制作的數(shù)字人,稱公司已具備大模型低成本制作虛擬人的能力;此外,小冰也公布了AI數(shù)字員工SaaS產(chǎn)品大模型小樣本技術。
總的來看,在人像驅動、智能對話和語音交互等技術領域,國內(nèi)頭部企業(yè)已經(jīng)幾無差距,唯一的差異就是對細分行業(yè)的把握,即誰能創(chuàng)造出更符合行業(yè)需求的最終產(chǎn)品。
虛擬人想要真正實現(xiàn)商業(yè)化落地,需要更多有付費意愿的應用場景,這是虛擬人企業(yè)打磨各細分行業(yè)知識圖譜的主要動力,而直播行業(yè)顯然是虛擬人最易應用的場景之一。
艾媒咨詢CEO張毅曾提到,從應用層面分類,虛擬人可以分為服務型虛擬人和身份型虛擬人。“服務型虛擬人具有功能性,能夠替代真人服務,完成內(nèi)容生產(chǎn)以及一些簡單的工作,降低已有服務型產(chǎn)業(yè)的成本。身份型虛擬人具有身份性,多以虛擬IP或偶像呈現(xiàn),能夠為未來的虛擬世界提供人的核心交互中介?!?p>
在一位從事數(shù)字分身產(chǎn)品業(yè)務的人士看來,身份型虛擬人商業(yè)化運營的難度較高,哪怕制作技術能夠追趕上來,也要面臨人設打造、內(nèi)容豐富度、吸粉等IP運營難題。相比之下,服務型虛擬人的落地則快得多,利用虛擬人替代消耗大量時間又不需要多少創(chuàng)意的場景正是這場技術競逐中“比較低的果子”。
他認為,如今虛擬人小樣本訓練技術的成本已經(jīng)快到民用的臨界點,后續(xù)基于云廠商推出的PaaS(平臺即服務)接口服務,會有更多的商家店鋪、知名IP選擇虛擬人產(chǎn)品,“最終很有可能取代目前超過70%的主播”。
不過現(xiàn)階段,虛擬主播的缺點也很突出。盡管能降低勞動成本、全天無休地工作提升效率,但虛擬主播解決具體問題的能力實在有限,且過程相對僵化。
打開直播平臺就能發(fā)現(xiàn),虛擬主播最適合的要么是前述那類“重講解,輕展示”的零食、百貨等標品直播間,要么就是“用戶就沖著品牌團購優(yōu)惠來”有品牌信任基礎的直播間,比如新茶飲品牌、連鎖快餐店等,真人講解或是AI都無所謂,用戶主要目的是購買低價團購券。
虛擬主播在實際應用中更像是一個背景板或單純的引流工具,差不多的皮囊翻來覆去總是那幾句商品介紹和優(yōu)惠,消費者想要了解更多優(yōu)惠券核銷、物流和售后問題,只能等到人工客服上班時間或真人主播上線才能得到解答。
AI能否支持虛擬主播的各種表達?能不能像真人一樣智能,與直播間的觀眾互動應答?這些都是這一階段推廣虛擬主播的瓶頸。ChatGPT雖然打開了市場想象,但虛擬人廠商們依靠多模態(tài)預訓練大模型支持小樣本快速定制虛擬人的產(chǎn)品策略,首要目標是降本增效,并非制作一款傳統(tǒng)高精度虛擬人,應用效果如何還需要落地觀察。
“重復性的勞動會被AI取代”是這一波AI浪潮下的共識,腰尾部素人主播已經(jīng)感受到寒意,但虛擬人能創(chuàng)造出一個全新的頭部主播嗎?現(xiàn)階段看可能性不大。想要打造一個類“李佳琦”的虛擬主播,需要的是一支專業(yè)的運營、技術維護團隊,帶貨的同時要打造相應“人設”,為粉絲提供情緒價值,所需成本不比真人頭部主播少。
目前頭部虛擬主播在直播打賞規(guī)模和粉絲體量方面,很少有能與頭部真人主播比擬的,三年耗費三千萬元的虛擬偶像洛天依,其帶貨坑位費也僅僅與絕大多數(shù)中腰部主播持平。
曾有虛擬人服務商透露,許多抖音等平臺一度火爆的虛擬主播背后,并不是AI驅動的互動平臺而是真人,“用戶還是喜歡和真人互動,講些段子也好,AI太無趣了”。
另一方面,直播平臺對虛擬主播的態(tài)度并不積極。抖音等短視頻平臺要追求商業(yè)化目標,也要平衡用戶體驗,而現(xiàn)階段虛擬主播不擅長互動,呆板的程序化直播吸引一些閑時流量可以,追求用戶留存數(shù)據(jù)并不現(xiàn)實,抖音官方的推薦機制自然也不會給太多流量。
“虛擬主播很容易被判定為經(jīng)過了包裝的錄播和無人直播,我們在測試的時候,一半以上的號都會因為非真人主播而被封掉。平臺算法每天都在升級,我們也只能想辦法去規(guī)避,比如插入真人主播視頻作為背景等?!痹摲丈瘫硎?。
還有一個值得注意的隱患是,虛擬人目前還在粗放發(fā)展階段,未來注定還要面臨法律和倫理層面的考驗,例如肖像權管控風險和深度合成技術帶來的虛假信息風險。仍處在野蠻生長期的虛擬人還沒有準備好去完全替代一個行業(yè)。