沈玉姍
5月27日,烏鎮(zhèn)人機大戰(zhàn),柯潔不敵AlphaGo,0:3戰(zhàn)敗,卻讓毫不意外。無論是職業(yè)棋手,還是人工智能的業(yè)界專家,大都在賽前給出了一邊倒的預測,大家也已坦然接受機器超越人類的事實。
僅在一年前,被譽為“世紀之戰(zhàn)”的李世石對戰(zhàn)AlphaGo令人工智能(AI)進入公眾視野。彼時,VR市場頹勢已現(xiàn),漸入谷底。AI概念的及時出現(xiàn)拯救了寥落許久的資本市場,凜冽的“資本寒冬”一度回暖。根據(jù)CBInsights的數(shù)據(jù),2016年,全球人工智能領域的投資數(shù)量達到698筆,是2012年的近5倍。而在國內,BAT帶頭布局,創(chuàng)業(yè)項目四起,一時間全民AI,2016年也因此被稱為“人工智能元年”。
潮水退去,才展現(xiàn)出行業(yè)的本來面目?!坝幸恍┡菽?,但沒有‘百團大戰(zhàn)、O2O那會兒那么多?!眲?chuàng)新工場技術副總裁、人工智能工程院副院長王詠剛告訴《21CBR》記者。
“扎實”、“踏實”是眾多投資人談及人工智能時提到的關鍵詞。對創(chuàng)業(yè)者而言,技術的重大突破、龐大的用戶市場以及多方政策的利好,似乎預示著人工智能的商業(yè)春天才剛剛開始。然而,要想站在下一波浪潮的潮頭,成為這場堪比工業(yè)革命的時代獲益者,既要比拼硬實力的突破,也依仗對行業(yè)的理解,二者缺一不可。在人工智能的商業(yè)化進程中,脆弱的科學家式創(chuàng)業(yè)將難以沖破重重阻礙。
李開復重倉
當下提及人工智能,不能不關聯(lián)至創(chuàng)新工場。2016年,這家專注于Pre-A到C輪的早期投資機構重倉人工智能,投資相關領域創(chuàng)業(yè)公司超過30家。早年研究語音識別的創(chuàng)始人李開復身體力行,一舉一動不離人工智能:演講、出書、為投資公司站臺、成立人工智能工程院。直到今年初,李開復公開表示:“能投的已經(jīng)不多了。”
王詠剛告訴《21CBR》記者,人工智能尚處在行業(yè)發(fā)展的早期階段,“我們看好整體的發(fā)展趨勢,但現(xiàn)階段項目的絕對數(shù)量是少的,找好項目相對來說也就困難一些。”對創(chuàng)新工場而言,好項目各有各的好,不投的項目歸結起來則離不開三個方面:技術、團隊和模式。
第一類是技術令人難以信服的概念炒作式項目?!伴_復就是搞人工智能出身的,我之前在谷歌工作,接觸的項目比較多。有的創(chuàng)業(yè)公司說得天花亂墜,實際技術上是做不到的?!睂τ诩夹g本身的發(fā)展趨勢、在哪個領域能夠解決哪些問題,創(chuàng)新工場自信在國內VC界的判斷是較為準確的。
其次,對于純科學家團隊創(chuàng)業(yè),由于不具備足夠的商務落地渠道,“我們也會非常謹慎。當然不排除有的科學家確實技術很好,我們就幫他做孵化”。至于商業(yè)模式,在當下的國內互聯(lián)網(wǎng)企業(yè)中,阿里、騰訊紛紛成立人工智能實驗室,百度索性稱自己是一家“人工智能公司”。那些巧妙避開了巨頭現(xiàn)有業(yè)務沖擊,自身具備不可復制和可持續(xù)性的創(chuàng)業(yè)項目,成功幾率自然更高。
元璟資本合伙人陳洪亮認為,在人工智能這一強技術領域,圖像和語音是已被驗證的兩個賽道。過去10年間,得益于深度學習算法和GPU等計算設備的發(fā)展,計算機視覺技術快速落地金融、安防、醫(yī)療等B2B領域。相比之下,語音技術偏重在客服、車載、智能家居等消費端領域,背后也有賴于語音識別、聲紋識別等工業(yè)級算法的日趨成熟,“未來在這兩塊,將會出來一批比較扎實的成果?!?/p>
2014年底創(chuàng)立的Rokid(若琪)是元璟資本在語音賽道的代表項目,從天使輪到B輪一路跟進。5月15日,Rokid旗下第二款產(chǎn)品、名為Pebble(月石)的智能音箱在天貓開售。用戶運用語音指令可以操控音箱播放音樂、報告天氣,甚至控制家中的照明、電視等智能家居設備。Pebble意在通過日復一日的“自我學習”,無限趨近用戶的偏好習慣。
相比用智能家居APP開關燈,一條語音指令顯然要簡單得多。無論是手機還是PC,都需要人去適應機器,聲音似乎是人與機器更自然的交流方式。從天氣到音樂,從新聞播報到童話朗讀,元璟資本相信,聲音將作為一種人機交互的無形界面,成為下一個平臺級入口。而新入口的誕生,將帶來變革性的機會。
不過,在陳洪亮眼中,對領域知識的依附使得創(chuàng)業(yè)初期的技術優(yōu)勢正在減弱,“行業(yè)細分,客戶分散,即便有強悍的技術背景,過了一年左右的時間窗口,最后比拼的還是對商業(yè)的理解?!睆倪@個角度而言,人工智能更以行業(yè)為導向,而非純技術項目?!笆切袠I(yè)+,不是AI+?!标惡榱练Q。
這也是創(chuàng)新工場成立人工智能工程院的目的之一:源源不斷向創(chuàng)業(yè)者推送產(chǎn)業(yè)項目,挖掘適合團隊技術的商業(yè)模式并加以驗證,為創(chuàng)業(yè)科學家尋覓商業(yè)合伙人,從而幫助團隊盡快步入創(chuàng)業(yè)正軌。王詠剛表示,“商業(yè)合伙人具備的行業(yè)經(jīng)驗,必須令其懂得如何在行業(yè)里面拿到項目,純科學家式的B2B創(chuàng)業(yè)很難?!?/p>
4月,在一次企業(yè)家公開活動上,北極光創(chuàng)投創(chuàng)始人鄧鋒面對兩位業(yè)界人士發(fā)問:“講究強關系的B2B行業(yè)會否影響人工智能的游戲規(guī)則?”依圖科技CEO朱瓏當時回應:“(關系)是現(xiàn)狀,但產(chǎn)品真的能打動人?!被蛟S可以這么理解,“關系”在某種程度上也代表著,你比別人更了解行業(yè)。
對于AI創(chuàng)業(yè)者,B2B意味著賺錢的難度和門檻更高了。不過,收費的價值也因此體現(xiàn)。在陳洪亮看來,一旦客戶為此買單,其在組織機構內部能夠被更高效地推行,避免淪為乏人問津的免費試用。王詠剛也相信,移動互聯(lián)網(wǎng)的免費打法在人工智能時代將難以延續(xù)。
盡管業(yè)內少有公司公布自己的營收情況,但投資人大都表示,人工智能正在加速變現(xiàn),“有些2B的項目,盈利已經(jīng)很好了。”對于投資人和創(chuàng)業(yè)者而言,變現(xiàn)不僅僅代表了財務模型的轉正,也意味著終于贏得了市場與用戶的認可。
四家獨角獸
擁有大數(shù)據(jù)支持的金融、安防和醫(yī)療,被視為是人工智能的下一個機會,也成為過去一年資本聚集的行業(yè)。國內計算機視覺賽道的創(chuàng)業(yè)公司接近30 家,人臉識別領域更是出現(xiàn)4 個獨角獸——曠視(Face++)、商湯、依圖、云從科技,紛紛完成融資。2017年,在工信部發(fā)布的“獨角獸”企業(yè)榜單中,曠視的市場估值突破20億美元。
曠視市場部副總裁謝憶楠告訴《21CBR》記者,2013年,曠視開始專注于人臉視覺的產(chǎn)品通用化?!爱敃r主攻三方面的算法——人臉檢測、關鍵點標注和人臉識別,團隊基于行業(yè)做了很多技術上的研究。”2013-2014年,曠視拿下3項世界計算機視覺競賽的第一名。2015年,在德國漢諾威IT博覽會上,馬云向德國總理默克爾演示Smile to Pay掃臉技術,就是由曠視提供核心算法,將刷臉支付模塊內置到支付寶客戶端中。
目前,曠視的Face++人工智能開放平臺面向中小銀行、地產(chǎn)園區(qū)、IT企業(yè)及獨立開發(fā)者開放人臉、圖像、文字等識別能力。其中,人臉識別API的日均調用量超過2400萬次,是目前世界最大的人臉技術平臺。曠視方面聲稱,其人臉識別技術在國內互聯(lián)網(wǎng)金融領域擁有80%以上的份額。
曠視的快速崛起得益于技術和市場的多重利好。一方面,深度學習算法在過去10年間取得重要突破,給計算機視覺的大規(guī)模應用奠定了基礎。另一方面,2014年,國家實名制工作相繼在網(wǎng)絡、電信和金融領域全面鋪開。2015年,互聯(lián)網(wǎng)金融雨后春筍般涌現(xiàn),通過人臉識別技術完成遠程開戶和身份驗證,成為各方普遍采用的技術手段。計算機視覺創(chuàng)業(yè)公司步入商業(yè)化時期。
謝憶楠表示,公司在商業(yè)化前期關鍵性地走通了“數(shù)據(jù)—算法—產(chǎn)品—技術”這一循環(huán),面向行業(yè)的通用服務乃至更為深度的定制化方案得以落地。
而另一家獨角獸公司——依圖科技則啃下了安防這塊骨頭,其“蜻蜓眼”人像大平臺服務于全國上百個地市的公安系統(tǒng),是全國唯一擁有十億級人像庫比對能力的公司。
利用技術優(yōu)勢,快速切入一兩個行業(yè),從而形成深度合作,是上述獨角獸公司早期脫穎而出的共同原因。在現(xiàn)有技術已然成熟、各家準確率紛紛達標的情況下,如何基于真實痛點挖掘場景,提供定制化且可復制的解決方案,成為打破傳統(tǒng)行業(yè)壁壘、快速拿下市場的關鍵。
而在語音賽道,技術成熟也意味著消費級機器人市場的打開。Rokid并非頭一個玩家,卻自帶網(wǎng)紅體質。其迄今為止發(fā)布的兩款產(chǎn)品,在未設獨立展位的情況下,連續(xù)兩年獲得CES(國際消費電子展)創(chuàng)新類獎項。創(chuàng)始人Misa(祝銘明)在江湖上見首不見尾,研究團隊的陣容卻堪稱強大:位于北京和舊金山的兩個實驗室由數(shù)十名全職博士科學家組成,來自中科院、哈佛、斯坦福、伯克利等一批海內外頂尖院校。
Rokid北京實驗室負責人高鵬告訴《21CBR》記者,智能音箱Pebble的核心功能體驗分為三類:音樂、兒童讀物等內容服務,天氣、鬧鐘等工具類服務,以及智能家居控制服務。憑借600萬首320K碼率高品質曲庫和喜馬拉雅FM等對接資源,Pebble向用戶提供的內容涵蓋音樂、新聞、電臺、相聲、戲曲和脫口秀等。一切體驗從用戶對其說出激活詞“若琪”的一刻開啟。
激活詞“若琪”的設計和打磨用了將近一年時間。高鵬介紹,激活詞的識別錯誤率隨著音節(jié)的加長而降低。目前國內外同類產(chǎn)品的激活詞大多設置在3-4個音節(jié),而雙音節(jié)的高激活率很難成功。在經(jīng)歷“若小琪”、“Hi,若琪”的反反復復后,研究團隊還是通過算法驗證實現(xiàn)了雙音節(jié)。在公開的試用報告中,Pebble多個維度的人機交互體驗超過了谷歌推出的業(yè)內首款產(chǎn)品Google Home。
而在聲音定位上,祝銘明早年從威爾·史密斯主演的科幻電影《我,機器人》中的機器人女聲獲得靈感。高鵬坦言:“當時根本沒有那樣的現(xiàn)成聲音?!眻F隊開始在市場上尋覓適合的音色,同時自主研發(fā)TTS(Textto-Speech)語音合成技術,并由專門團隊對聲音處理和內容反饋進行設計,“若琪”最終被定位為一個溫柔、幽默、聰明且不失個性的女聲。
通過開放基于網(wǎng)絡協(xié)議的API標準,Rokid還將飛利浦、小米、lifesmart等品牌納入到其智能家居生態(tài)鏈中。在幾乎未做投放、線下推廣的情況下,開售三個星期的Pebble在天貓官網(wǎng)的銷量逼近千臺。祝銘明對媒體表示:“產(chǎn)品日活躍用戶數(shù)量超過50%,用戶使用時長平均超過1小時。”6月8日,Rokid宣布開通全渠道銷售,Pebble登陸全國500多家經(jīng)銷商門店。
在Rokid的品牌文案中,“自然”是多次出現(xiàn)的一個詞。產(chǎn)品負責人向文杰對此表示,語言、視覺和觸摸是人類最自然的交流方式,“未來的產(chǎn)品方向就是向用戶提供最自然的交互體驗,希望讓用戶感受到,我們的產(chǎn)品是有溫度的家庭成員,而不是一臺冷冰冰的機器?!?/p>
智能的未來
人工智能的商業(yè)春天才剛剛開始。
埃森哲的研究結果顯示,到2035年,人工智能將有望令包括美國、日本在內的12個發(fā)達國家的經(jīng)濟增長率翻番,勞動生產(chǎn)率增長40%。在謝憶楠看來,目前國內人工智能市場仍處在存量消化階段,保守估計仍有七成左右的垂直行業(yè)尚待開發(fā),在教育、交通、社保等領域潛力巨大。朱瓏則表示,過去一年間,性能成倍提升的人工智能技術不斷解鎖應用場景,人類的想象力已經(jīng)跟不上人工智能的發(fā)展速度。
機器的迷人之處在于智能未來。業(yè)內普遍認為,無人駕駛將是未來人工智能的重要落點。在創(chuàng)新工場的投資策略里,未來5-10年的投資項目中有相當一部分投給了無人駕駛。“機會太大了,將是萬億級的市場,且很難被個別巨頭壟斷?!蓖踉亜偙硎荆瑹o人駕駛是一個完整的產(chǎn)業(yè)鏈,從感知、決策、控制等多個模塊的算法,再到各類傳感器,乃至汽車共享和交通改造,有著巨大的想象空間,遠未到技術收斂的階段。
另一個充滿未來感的方向則是沉浮數(shù)年的消費級智能硬件。亞馬遜在6月初宣布,旗下智能音箱Echo的年出貨量預期突破1000萬臺;蘋果則被傳即將在年度開發(fā)者大會中發(fā)布一款由語音助手Siri控制的智能音箱。國內方面則早有叮咚、小智者激起的浪花,“千箱之年”的說法因此在業(yè)內盛行開來。
Rokid將自身定位為一家科技公司而非硬件廠商,著眼于更宏大的語音技能生態(tài)建設。高鵬表示,Rokid將在近期推出開放平臺,有望接入外賣、快遞、叫車等來自第三方開發(fā)者的擴展功能,為用戶提供更為豐富的語言技能應用。
人工智能從來就不是一場輕巧肆意的游戲,參與者面臨的仍將是重重阻礙。
首先是巨大的人才缺口。陳洪亮稱,未來很長一段時間,人工智能的馬太效應將體現(xiàn)在人才方面。李開復提過一組數(shù)字,全球當下的人工智能專家不超過7000人,在中國這個數(shù)字可能是700個,且大多被BAT收入囊中。這也是創(chuàng)新工場成立人工智能工程院的一大使命:通過人才招聘和高校共建,同時加強與政府部門、國內外高科技公司的合作,培育和孵化高水準的人工智能技術團隊。
數(shù)據(jù)壁壘則是人工智能創(chuàng)業(yè)打破大公司壟斷、完成行業(yè)深度融合的另一項難題,一大原因在于數(shù)據(jù)安全泄露和用戶隱私破壞。王詠剛認為,人工智能的發(fā)展與數(shù)據(jù)安全不是相互撕裂的關系,而是博弈均衡。
而最大的困難還是來源于技術本身。深度學習理論沿革每隔10年左右就會經(jīng)歷巨大變化,每一次的技術遞進也推動著人工智能的工業(yè)化進程,新商業(yè)模式因此而生?!扒把丶夹g當然對一線業(yè)務開展有著指導意義。”王詠剛說。
人工智能始終是強技術驅動的領域。謝憶楠稱:“從算法、軟件、硬件到解決方案,每一步都要靠硬實力說話。純商業(yè)模式的東西,天花板很明顯?!庇嬎銠C視覺領域的四個獨角獸之一云從科技CEO周曦也公開宣稱:“人工智能是有門檻的,短期之內只要自己保持足夠快的進步速度,別人很難對你構成威脅。”
王詠剛強調,深度學習不等于人工智能。強化學習技術由于新版AlphaGo的使用而為外界所知,由于不需要大量訓練樣本,而是直接從實驗和錯誤中學習,強化學習相對而言更接近人類的思維模式。此外,谷歌、阿里等企業(yè)的內部團隊也開始測試深度對抗網(wǎng)絡技術。作為人工智能發(fā)展的新熱點,王詠剛看好這些技術從實驗室階段向工業(yè)級場景的發(fā)展走向。
人工智能之所以令人著迷,在于其正向的資本模型、可預見的商業(yè)化成果,以及關乎未來的無限想象力。王詠剛表示,人工智能能改善當前優(yōu)質醫(yī)療資源不足的現(xiàn)狀,“即便有層層的阻力和壁壘,人工智能哪怕能夠前進一點,都將是人類極大的福音。”