Isaac Sacolick
人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)并非萬能的。一位首席信息官就企業(yè)投資人工智能之前應(yīng)知道什么給出了建議。
當(dāng)你每天都會面對鋪天蓋地的廣告宣傳時,怎樣判斷人工智能這類新興技術(shù)是否值得投入呢?我們著迷于一些驚人的成果——例如,AlphaGo擊敗了圍棋冠軍、自動駕駛汽車的進(jìn)步、Alexa和Cortana實(shí)現(xiàn)的語音識別功能,以及Google Photos、Amazon Rekognition和其他照片共享應(yīng)用程序?qū)崿F(xiàn)的圖像識別功能等。
當(dāng)谷歌、亞馬遜、微軟、IBM和蘋果這樣技術(shù)強(qiáng)大的巨頭在技術(shù)上取得成功并且媒體也大肆宣傳的時候,企業(yè)往往會認(rèn)為這些技術(shù)也可以為其所用。但真會這樣嗎?如果是真的,又體現(xiàn)在什么地方呢?
每當(dāng)有新技術(shù)開始成為主流時,下面這類問題是首席信息官們要思考的:
● 對首席信息官而言,這項(xiàng)技術(shù)值得投入、研究和關(guān)注嗎,或者應(yīng)該將其忽略?我們怎樣向企業(yè)領(lǐng)導(dǎo)們解釋該技術(shù)對企業(yè)的適用性,它會帶來競爭機(jī)會還是意味著潛在的威脅?
● 對于那些好奇的員工們,我們怎樣通俗易懂給他們解釋該技術(shù)能做什么,幫助他們分清楚炒作、當(dāng)今的現(xiàn)實(shí)和未來的可能?
● 當(dāng)一部分員工表現(xiàn)出有興趣去探索這些技術(shù)時,我們是否應(yīng)該給予支持,我們應(yīng)該把他們引向什么問題,他們應(yīng)該花時間學(xué)習(xí)技術(shù)的哪些方面?
● 當(dāng)供應(yīng)商在實(shí)際營銷中表明他們所取得的成績是由新興技術(shù)推動的,而且他們的員工中有專家博士幫助支持產(chǎn)品的開發(fā),那么,我們怎樣評估哪些技術(shù)具有真正的商業(yè)潛力,哪些服務(wù)應(yīng)用的還太早,而有的則純粹是炒作,并沒有實(shí)際價值?
人工智能到底是什么,它是怎樣實(shí)現(xiàn)的?
人工智能技術(shù)已經(jīng)出現(xiàn)一段時間了,但我認(rèn)為,這一技術(shù)真正始于1968至1969年間,那時SHRDLU自然語言處理(NLP)系統(tǒng)問世,發(fā)表了感知器和反向傳播的研究論文,全世界通過《2001:太空漫游》里的HAL知道了人工智能的存在。接下來的重大突破可以追溯到上個世紀(jì)80年代后期,在學(xué)習(xí)算法中使用了反向傳播技術(shù),然后將其應(yīng)用于手寫識別等問題中。人工智能在上個世紀(jì)90年代后期掀起了大規(guī)模的挑戰(zhàn),出現(xiàn)了第一個聊天機(jī)器人(ALICE),而深藍(lán)打敗了國際象棋世界冠軍卡斯帕羅夫。
上個世紀(jì)90年代,我第一次體驗(yàn)了人工智能。在亞利桑那大學(xué)的研究生院,我們幾個人采用C語言編寫神經(jīng)網(wǎng)絡(luò),以解決醫(yī)療、天文學(xué)和其他研究領(lǐng)域中的圖像識別問題。圍繞一些不精確的數(shù)據(jù),為解決優(yōu)化問題,我們嘗試了各種學(xué)習(xí)算法和技術(shù),以及做出決策的方法。
當(dāng)我們研究神經(jīng)網(wǎng)絡(luò)時,我們會手工編程感知器的數(shù)學(xué)運(yùn)算,然后遍歷網(wǎng)絡(luò)的各個層以產(chǎn)生輸出,再反向遍歷來應(yīng)用反向傳播算法對網(wǎng)絡(luò)進(jìn)行調(diào)整。我們要等待很長的時間,系統(tǒng)才能穩(wěn)定地輸出。
當(dāng)早期結(jié)果失敗后,我們確定不了是不是因?yàn)閼?yīng)用了錯誤的學(xué)習(xí)算法,沒有針對我們要解決的問題去優(yōu)化調(diào)整網(wǎng)絡(luò),還是在感知器或者反向傳播算法中出現(xiàn)了編程錯誤。
而發(fā)展到今天,很容易看到為什么人工智能在過去幾年中有了指數(shù)級的飛躍,這要?dú)w功于幾個方面的進(jìn)步。
首先是云計算,它支持在一群機(jī)器上運(yùn)行大型神經(jīng)網(wǎng)絡(luò)。計算是分布在大量的計算節(jié)點(diǎn)上,而不是逐個遍歷感知器,只處理一個或者兩個網(wǎng)絡(luò)層。這就實(shí)現(xiàn)了深度學(xué)習(xí)算法,它本質(zhì)上是具有大量節(jié)點(diǎn)和分層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),能夠在合理的時間內(nèi)處理大規(guī)模問題。
其次,商用和開源庫以及TensorFlow、Caffe、Apache MXNet等其他服務(wù)的出現(xiàn)為數(shù)據(jù)科學(xué)家和軟件開發(fā)人員提供了把機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法應(yīng)用于其數(shù)據(jù)集的工具,這就不需要對底層數(shù)學(xué)進(jìn)行編程,也不必采用并行計算。在英偉達(dá)、英特爾、AMD等企業(yè)創(chuàng)新和相互競爭的帶動下,未來的人工智能應(yīng)用是由芯片人工智能或者板載人工智能推動的。
不要把人工智能炒作和人工智能現(xiàn)實(shí)混為一談
一旦你知道了歷史,對技術(shù)有所理解,評估新興技術(shù)在其生命周期中的所處位置往往是很有幫助的。
Gartner認(rèn)為機(jī)器學(xué)習(xí)和深度學(xué)習(xí)仍然處于熱炒時期,預(yù)測2020年之后將出現(xiàn)“通用人工智能”(能夠解決任何智能問題的人工智能)。Venture Scanner調(diào)查表明,在人工智能領(lǐng)域,大約有三分之二的啟動資金將用于早期的幾輪融資(種子資金、A輪和B輪),這表明很多銷售或者推廣人工智能解決方案的公司仍然處在產(chǎn)品開發(fā)和銷售周期的早期階段。McKinsey指出,在認(rèn)識到人工智能重要性的公司中,只有20%采用了人工智能,50%以上的人工智能投資來自于科技巨頭和初創(chuàng)公司,而不是那些碰巧使用這一技術(shù)的企業(yè)。
看到這些統(tǒng)計數(shù)據(jù)后,任何首席信息官或者企業(yè)高管們在全面投入人工智能之前都應(yīng)該靜下來想一想。盡管人工智能肯定會大有前途,但這些算法的大規(guī)模商用還為時尚早。
早期的勝利者將屬于那些大型科技公司和擁有人才、資金和耐心去試驗(yàn)新技術(shù)的初創(chuàng)公司。大多數(shù)企業(yè)和中型企業(yè)很難有這樣的機(jī)會,還只是剛剛開始他們的人工智能之旅。
人工智能絕對是一種非常顛覆性的技術(shù),所以你不應(yīng)該忽視它。但是要謹(jǐn)慎行事,不能被人工智能炒作所迷惑。
例如,對于某些應(yīng)用程序,語音成為比屏幕和鍵盤更好的人機(jī)界面時,或者聊天機(jī)器人變得比人類客服更聰明、更快時,很多企業(yè)將不得不利用這些技術(shù)來提升他們的用戶體驗(yàn)。
同樣,當(dāng)深度學(xué)習(xí)算法能夠更好地檢測欺詐、風(fēng)險交易和安全威脅時,企業(yè)將不得不準(zhǔn)備去使用這些方法。
當(dāng)我們能夠越來越多地使用結(jié)構(gòu)化數(shù)據(jù),開始盡可能高效地從口語、音頻和視頻中提取出智能信息時,使用這些功能將為很多企業(yè)帶來明顯的競爭優(yōu)勢。
“時機(jī)”才是關(guān)鍵詞。
大多數(shù)企業(yè)的目標(biāo)應(yīng)該是快速追隨者,而不是早期采用者。這意味著應(yīng)盡早關(guān)注甚至嘗試人工智能,但要一直等到人工智能足夠成熟、經(jīng)受足夠考驗(yàn)而且能大規(guī)模交付時,才能完全信賴人工智能。
當(dāng)你知道了人工智能能夠干什么后,應(yīng)尋找工具和實(shí)例來幫助評估人工智能應(yīng)用及其成熟度。實(shí)例包括:
● Forrester定義了9項(xiàng)基本的人工智能技術(shù),并提出了一個構(gòu)建模塊模型,這一模型以假設(shè)和研究開始,以三個層面的規(guī)范化應(yīng)用結(jié)束。
● Workday發(fā)布了其成熟度模型,將人工智能應(yīng)用于自動化,并在發(fā)現(xiàn)和轉(zhuǎn)換應(yīng)用程序之前通知用戶。這是有道理的,因?yàn)榘讶斯ぶ悄軕?yīng)用于人們已經(jīng)解決的問題時,就更容易評估人工智能的結(jié)果。
● 業(yè)界有很多這樣的例子,包括保險、醫(yī)療、銀行、農(nóng)業(yè)、法律、廣告、建筑、慈善和媒體等行業(yè)。
著眼于基本的業(yè)務(wù)目標(biāo),啟動你的人工智能計劃
人工智能和機(jī)器學(xué)習(xí)的大肆宣傳促使一些技術(shù)和業(yè)務(wù)領(lǐng)導(dǎo)們開始采用技術(shù)優(yōu)先戰(zhàn)略。如果你是通過嘗試機(jī)器學(xué)習(xí)庫或是求助于那些大肆宣傳人工智能的供應(yīng)商來開始你的人工智能之旅,那么你就錯過了一些關(guān)鍵的啟動步驟。
相反,首先應(yīng)關(guān)注能帶來很大好處的業(yè)務(wù)問題和機(jī)會,以抵消研發(fā)成本。這些機(jī)會來自于你已經(jīng)擁有的龐大的數(shù)據(jù)集,或者你很容易獲得并進(jìn)行數(shù)據(jù)整合的數(shù)據(jù)集。應(yīng)該從其他非科技公司能夠獲得成功的其他行業(yè)中汲取靈感。
從明確的業(yè)務(wù)機(jī)會開始的一個原因是,你能夠找到不需要最新人工智能技術(shù)的解決方案。如果需要某種形式的人工智能,這種明確業(yè)務(wù)機(jī)會的方法可以讓你對解決方案進(jìn)行分類,評估所需人工智能的整體成熟度。
例如,如果你想自動完成一個非常依靠人工操作的業(yè)務(wù)流程,這包括對流水線上下來的部件進(jìn)行目視檢查,那么你的解決方案中將同時包括圖像識別和機(jī)器人流程自動化。這些都是比較成熟的人工智能領(lǐng)域,這方面的各種成功案例和供應(yīng)商解決方案證實(shí)了這一點(diǎn)。
另一方面,如果解決方案需要大量的認(rèn)知評估和思考,那么你將進(jìn)入一個不太成熟的人工智能領(lǐng)域。
衡量人工智能成熟度的一種方法是查看人工智能初創(chuàng)公司發(fā)布的各種供應(yīng)商概況,例如,來自Venture Scanner的供應(yīng)商概況、機(jī)器智能的現(xiàn)狀、O'Reilly的機(jī)器人概況,以及人工智能金融技術(shù)概況等。仔細(xì)看一下這些列表,你會發(fā)現(xiàn)很多初創(chuàng)公司都把注意力集中在離散問題集上,而不是更廣義的認(rèn)知解決方案上。
當(dāng)一個供應(yīng)商說什么“把你的數(shù)據(jù)扔給我們的人工智能”,然后等專家情報反饋就行了,那么不要被此愚弄了。這是不可能發(fā)生的。
要想真正的工作,你的人工智能需要大量的數(shù)據(jù)
這就帶來了成功運(yùn)行人工智能的第二個先決條件:你需要大量相對干凈的數(shù)據(jù)來訓(xùn)練人工智能解決方案并評估輸出。
自動駕駛汽車之所以能夠?qū)崿F(xiàn),一個重要的原因是有大量的數(shù)據(jù)——這些汽車行駛一個小時,其激光雷達(dá)和其他傳感器便會產(chǎn)生4000GB的數(shù)據(jù)。對于只是關(guān)于汽車是否應(yīng)該轉(zhuǎn)向、加速、減速或者完全停止的一些基本決定,這些數(shù)據(jù)的確是太多了。
很多成功的人工智能解決方案都屬于這一類——把大量的數(shù)據(jù)轉(zhuǎn)換成數(shù)量有限的決定。例如,在圖像識別中,我正在觀察的圖片中是不是有你?在協(xié)作過濾中,根據(jù)你過去的閱讀體驗(yàn)以及其他閱讀選項(xiàng),最近發(fā)表的文章是否更適合你?在評估一項(xiàng)交易時,它是否與欺詐交易有相似的模式?
在人工智能內(nèi)部,則是通過逼近曲線來作出這些決定。例如,在深度學(xué)習(xí)中,網(wǎng)絡(luò)中大量的分層結(jié)構(gòu)和神經(jīng)元能夠逼近非常復(fù)雜的曲線來區(qū)分結(jié)果。為了開發(fā)這種網(wǎng)絡(luò),你需要一個帶標(biāo)簽的大數(shù)據(jù)集,這樣就可以通過把計算結(jié)果與你期望得到的經(jīng)過標(biāo)記的結(jié)果進(jìn)行比較來訓(xùn)練網(wǎng)絡(luò)。然后,使用反向傳播或者其他學(xué)習(xí)算法,利用產(chǎn)生的誤差來調(diào)整網(wǎng)絡(luò),并且在所有標(biāo)記數(shù)據(jù)上重復(fù)多次這種練習(xí),直到網(wǎng)絡(luò)穩(wěn)定至最優(yōu)曲線為止。這些是采用訓(xùn)練集開發(fā)的有監(jiān)督學(xué)習(xí)解決方案。
如果數(shù)據(jù)沒有被標(biāo)記,那么網(wǎng)絡(luò)可以使用無監(jiān)督學(xué)習(xí)方法,這些方法依賴于對結(jié)果進(jìn)行評估的熵表達(dá)式。例如,當(dāng)谷歌的DeepMind被用來學(xué)習(xí)玩Atari游戲“突圍”時,它使用得分來評估結(jié)果。
除了數(shù)據(jù)集之外,企業(yè)還需要數(shù)據(jù)集成和自動化功能,這樣數(shù)據(jù)就能夠輸入和輸出任何人工智能處理引擎。如果你的企業(yè)習(xí)慣于讓人工運(yùn)行腳本來推送數(shù)據(jù),那么我強(qiáng)烈建議你在開展人工智能解決方案之前先投入自動化。
嘗試人工智能的幾個選擇
一旦你找到了業(yè)務(wù)機(jī)會,并且得到了大量經(jīng)過清理的數(shù)據(jù)集,那就可以考慮人工智能之旅了。這兩個步驟是為你的企業(yè)準(zhǔn)備人工智能的先決條件。接下來的主要步驟是考慮人工智能解決方案的類型和實(shí)施方法。如果你有這方面的天賦,那么可以嘗試TensorFlow或者其他的人工智能引擎。如果你沒有專業(yè)知識,那就認(rèn)真考慮一下招人吧;科技巨頭們?yōu)橄∪钡娜斯ぶ悄苋瞬胖Ц读司揞~薪水,所以說進(jìn)入這個行業(yè)的成本是非常高的。
還有一種選擇是借助于在其解決方案中嵌入了人工智能的供應(yīng)商。Salesforce Einstein就是一個這樣的例子,這一人工智能平臺能夠采用Salesforce中存儲的CRM數(shù)據(jù)進(jìn)行預(yù)測,以及實(shí)現(xiàn)其他功能。同樣的,你可以看看具體的行業(yè)解決方案,例如,Synechron為金融技術(shù)(FinTech)提供的Neo。
一旦你確定了一兩種方法,最重要的是要與相關(guān)方一起設(shè)定切合實(shí)際的期望。投入人工智能應(yīng)開展敏捷實(shí)驗(yàn),因?yàn)槟愫芸赡軙萑虢┚?,需要反?fù)試驗(yàn)才能對其進(jìn)行優(yōu)化。預(yù)先設(shè)定好對預(yù)算、時間和人才的預(yù)期。
Isaac Sacolick是《數(shù)字化驅(qū)動:通過技術(shù)進(jìn)行業(yè)務(wù)轉(zhuǎn)型的領(lǐng)導(dǎo)者指南》一書的作者,該書涵蓋了很多實(shí)踐,例如敏捷、開發(fā)運(yùn)維和數(shù)據(jù)科學(xué)等,這些都是成功實(shí)施數(shù)字化轉(zhuǎn)型計劃的關(guān)鍵。Sacolick是公認(rèn)的社交領(lǐng)域的最佳首席信息官,也是“社交、敏捷和轉(zhuǎn)型”以及CIO.com的長期博主,還兼任StarCIO總裁。
原文網(wǎng)址:
http://www.infoworld.com/article/3241904/artificial-intelligence/what-ai-can-really-do-for-your-business-and-what-it-cant.html