IBM Watson中文名字叫做沃森,命名來自IBM 創(chuàng)始人 Thomas J. Watson老沃森的姓氏。沃森最早出現(xiàn)在2011年2月美國老牌益智節(jié)目“危險(xiǎn)邊緣”(Jeopardy?。┲校c節(jié)目史上最強(qiáng)的兩位答題高手一較高下,并最終以優(yōu)異的表現(xiàn)打敗了人類選手。
我們管沃森叫做超級計(jì)算機(jī)系統(tǒng),它是繼IBM深藍(lán)超級計(jì)算機(jī)系統(tǒng)之后的下一代超級計(jì)算機(jī)。說起IBM“深藍(lán)”可謂大名鼎鼎——1997年5月1日,國際象棋大師卡斯帕羅夫最終以25:35的比分輸給了IBM RS/6000SP “深藍(lán)”計(jì)算機(jī),舉世震驚。自此以后,關(guān)于機(jī)器智能的話題,就一直不絕于耳。
近年來,出現(xiàn)了不少關(guān)于機(jī)器智能與人工智能的電影,其中最為有名的包括《人工智能》《超驗(yàn)駭客》《超體》《我,機(jī)器人》《終結(jié)者》等。人們對機(jī)器智能的想象已經(jīng)遠(yuǎn)遠(yuǎn)超過了現(xiàn)實(shí)的科技進(jìn)展,沃森代表了迄今為止能夠?qū)崿F(xiàn)的最高機(jī)器智能。那么問題來了,沃森是誰?
沃森的歷史
沃森把世界帶進(jìn)了一個(gè)新的計(jì)算紀(jì)元——認(rèn)知計(jì)算。沃森的成功,是基于IBM百年的研究歷史。作為世界上第一家百年IT企業(yè),IBM公司在眾多技術(shù)領(lǐng)域一直處于最前沿,為此該公司每年投入超過60億美元研發(fā)經(jīng)費(fèi)。自20世紀(jì)90年代人工智能研究陷入低潮以來,大多數(shù)商業(yè)公司已經(jīng)停止或削減了這個(gè)領(lǐng)域的研究支持,而IBM是少數(shù)堅(jiān)持投入人工智能研究的企業(yè)。
嚴(yán)格來說,認(rèn)知計(jì)算并不完全是人工智能,認(rèn)知計(jì)算強(qiáng)調(diào)的人與機(jī)器共存。早在1960年,歷史上最有名的美國科學(xué)家J. C. R. Licklider寫了一篇非常著名的文章《人機(jī)共存》,他預(yù)言:“在不久的將來,人腦與計(jì)算機(jī)將緊密地連接起來,形成人機(jī)合作伙伴關(guān)系,將比人腦更能思考,處理數(shù)據(jù)的能力將遠(yuǎn)超今天現(xiàn)有的計(jì)算機(jī)?!痹谡J(rèn)知計(jì)算時(shí)代,并不是機(jī)器取代人類,而是人機(jī)協(xié)作創(chuàng)造出更好的結(jié)果。
自從“深藍(lán)”項(xiàng)目獲得成功以后,IBM的研發(fā)人員就一直在尋找下一個(gè)挑戰(zhàn)。2004年,當(dāng)時(shí)的IBM研究院決定挑戰(zhàn)“Jeopardy!”節(jié)目。沃森為什么要參加“危險(xiǎn)邊緣”而不是其他的益智問答節(jié)目?首先,“Jeopardy!”對于計(jì)算系統(tǒng)是一個(gè)巨大的挑戰(zhàn),因?yàn)樗婕皩W(xué)科廣泛,涵蓋了包括歷史、文學(xué)、政治、藝術(shù)、娛樂和科學(xué)在內(nèi)的廣泛主題。其次,“Jeopardy!”并不是簡單的問答,它不僅停留在答案的準(zhǔn)確度上,還同時(shí)測試了回答者的“信心”,因?yàn)榇疱e就要扣分。第三,“Jeopardy!”最大的特點(diǎn)是搶答形式,一般問答系統(tǒng)只需要答案,而不管回答的時(shí)間。所以“Jeopardy!”對于超級計(jì)算機(jī)來說,是一個(gè)很好的衡量體系。
“這個(gè)小子不簡單”
從2004年提出挑戰(zhàn)“Jeopardy!”的構(gòu)想,到2011年沃森真正打敗“Jeopardy!”,中間差不多經(jīng)歷了6年的時(shí)間。為什么會這么困難?
“Jeopardy!”的題目常常包含微妙含義、反諷、謎語等種種線索,沃森之所以能夠應(yīng)付這種“狡猾”的試題,主要依靠的是它對自然語言的理解和高速的計(jì)算。當(dāng)沃森被問到某個(gè)問題的時(shí)候,能夠調(diào)用100多種運(yùn)算方法,通過不同的方式對問題進(jìn)行分析,并給出很多可能的答案。在得出這些答案之后,另一組算法將對這些答案進(jìn)行分析并給出得分。對于每個(gè)答案,沃森都需要找出支持以及反對這個(gè)答案的證據(jù)。因此,每一個(gè)答案都會再次引出數(shù)百條證據(jù),同時(shí)由數(shù)百套算法對這些證據(jù)支持答案的程度進(jìn)行打分。證據(jù)評估的結(jié)果越好,沃森的信心值也就越高。而評估成績最高的答案,最終成為沃森給出的答案。因此在比賽中,如果連評估成績最高的答案都無法樹立足夠高的信心值,沃森能決定不搶答問題,以免答錯而輸?shù)舄劷稹_@所有的一切計(jì)算、選擇與決策都在3秒鐘之內(nèi)完成。
可以看到,沃森計(jì)算機(jī)不是只為了增加數(shù)據(jù)儲存空間或是搜尋的精準(zhǔn)度,而是要分析比對海量數(shù)據(jù),再協(xié)助人類從中挖掘各種更有創(chuàng)意、更創(chuàng)新的最佳解答,這是沃森的意義和價(jià)值。
沃森還能做什么?
沃森并不是簡單的機(jī)器學(xué)習(xí)系統(tǒng),當(dāng)IBM的研究員開始嘗試構(gòu)造沃森的時(shí)候,就發(fā)現(xiàn)傳統(tǒng)的機(jī)器學(xué)習(xí)算法行不通。傳統(tǒng)的機(jī)器學(xué)習(xí)算法先歸納知識,把知識形成規(guī)則,再讓機(jī)器根據(jù)規(guī)則進(jìn)行響應(yīng)。而這不足以讓沃森在“Jeopardy!”節(jié)目中勝出,因?yàn)閿?shù)據(jù)量過于龐大,IBM研究員意識到,他們必須讓沃森能夠自行學(xué)習(xí)知識而無須人工干預(yù)。這就是后來大家所熟知的“Deep Q&A”深度問答系統(tǒng)。
IBM的研究們給“Deep Q&A”深度問答系統(tǒng)一個(gè)事先沒有經(jīng)過分類的、無結(jié)構(gòu)的信息庫,同時(shí)設(shè)計(jì)了一套算法,讓系統(tǒng)能夠自行從龐雜的信息庫里抽取知識。經(jīng)過學(xué)習(xí)和訓(xùn)練,Deep Q&A系統(tǒng)能夠從原始信息中自動抽取知識,給知識進(jìn)行分類,并且能夠分析和理解語言。如此,沃森就能夠像人類一樣進(jìn)行學(xué)習(xí),并對發(fā)生的事件進(jìn)行推理以及總結(jié)經(jīng)驗(yàn)。因此,由于這樣的任務(wù)已經(jīng)超出了前代超級計(jì)算機(jī)的能力,IBM的研究員從頭設(shè)計(jì)了沃森系統(tǒng)。
由前述可知,沃森在現(xiàn)實(shí)生活中有著廣泛的應(yīng)用前景。2014年初的時(shí)候,IBM宣布為超級計(jì)算機(jī)沃森創(chuàng)建一個(gè)新的業(yè)務(wù)集團(tuán),通過云計(jì)算模式向商業(yè)用戶交付認(rèn)知計(jì)算能力。IBM將推動一系列新的軟件、服務(wù)和應(yīng)用更快進(jìn)入市場,這些新的軟件、服務(wù)和應(yīng)用能夠在海量的大數(shù)據(jù)環(huán)境中進(jìn)行思考,不斷通過自學(xué)習(xí)得到提升,從而解答復(fù)雜問題并獲取洞察力。特別是為了推動沃森技術(shù)的商用化,盡快為人類社會服務(wù),IBM在云開發(fā)平臺上推出了Watson API,開發(fā)者可以以云計(jì)算的方式,很容易地調(diào)用沃森的智能,從而構(gòu)建自己的應(yīng)用程序。
為了加速把沃森引入中國,IBM與騰訊等國內(nèi)企業(yè)合作,通過對國內(nèi)大數(shù)據(jù)的理解與分析,先行讓沃森了解中國市場。為了讓中國了解沃森,IBM還舉辦了沃森認(rèn)知烹飪嘉年華,展示由“沃森大廚”設(shè)計(jì)的新派美食?!拔稚髲N”通過學(xué)習(xí)35,000多種經(jīng)典食譜,分析海量食材配搭,結(jié)合化學(xué)、營養(yǎng)學(xué)等方面數(shù)據(jù),制造超越人類經(jīng)驗(yàn)和想象的新型食譜。
今年是IBM中國開發(fā)中心成立十五周年。15年來,IBM與浪潮、用友、騰訊、華勝天成等合作伙伴為中國的企業(yè)用戶提供云計(jì)算、數(shù)據(jù)分析、移動計(jì)算等解決方案。接下來,IBM還要把沃森推入中國市場,服務(wù)于中國的傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型以及智慧城市的發(fā)展,幫助中國從制造大國走向智造強(qiáng)國。