石菲
要問現(xiàn)在最火的技術(shù)是什么?肯定是人工智能!
作為“智能+”時代的新動能,人工智能正在對我們的未來產(chǎn)生影響。
IBM云與認知軟件高級副總裁Arvind Kirshna在2019美國Think大會上曾這樣表示,“如今人工智能就像‘電一樣存在,并且在徹底改變商業(yè)社會?!?/p>
植物生長需要養(yǎng)分,汽車奔跑需要動力,未來商業(yè)社會最重要的能源就是人工智能。縱然人工智能已經(jīng)成為新時代的“必需品”,但企業(yè)要應(yīng)用好人工智能絕非易事,換句話說,人工智能不是你想上,想上就能上。
還記得董明珠在寧波“闖紅燈”被抓嗎?其實是在過馬路時由于公交廣告上董小姐的“大頭照”太過明顯,被闖紅燈人臉識別系統(tǒng)捕捉到,誤以為是真人。如果說這個烏龍屬于規(guī)則制定的不完善,如果數(shù)據(jù)出了問題則會直接導(dǎo)致人工智能應(yīng)用的失敗。
2018年世界杯期間有研究機構(gòu)試圖用人工智能預(yù)測比賽結(jié)果,但大多數(shù)預(yù)測結(jié)果都是完全錯誤的,原因只有一個:“無論你的模型有多好,它們都只是和你的數(shù)據(jù)一樣好……最近的足球數(shù)據(jù)還不足以預(yù)測世界杯的表現(xiàn)。”
數(shù)據(jù)是人工智能的基礎(chǔ),沒有足夠高質(zhì)量的數(shù)據(jù),人工智能就會產(chǎn)生偏差。
那么,應(yīng)該怎么做才能獲得人工智能所需要的高質(zhì)量數(shù)據(jù)呢?
目前全世界最快的計算機是Summit和Sierra,由于其上運行著大量數(shù)據(jù)分析和人工智能應(yīng)用,Summit和Sierra采取了和之前不同的整體存儲架構(gòu),不僅可以達到每秒2.5TB的帶寬,每秒鐘還可以在一個目錄里創(chuàng)造5萬個小文件。正是基于高可用的存儲平臺,才能夠支撐全球最龐大的人工智能系統(tǒng)順利運行。
這背后的秘密武器就是能夠快速、高效提供人工智能所需要數(shù)據(jù)的信息架構(gòu)。
簡單地說,在人工智能應(yīng)用需求逐步增大和日益復(fù)雜的多云環(huán)境下,企業(yè)需要通過一個統(tǒng)一、高效的平臺實現(xiàn)對數(shù)據(jù)的高效利用。
有數(shù)據(jù)顯示,盡管83% 的企業(yè)將 AI 視為戰(zhàn)略機會。但大部分企業(yè)領(lǐng)導(dǎo)者并不了解 AI 究竟需要什么樣的數(shù)據(jù)。即便他們了解AI所需要的數(shù)據(jù),仍然有80% 的數(shù)據(jù)無法訪問、不可信或者無法分析。
所以企業(yè)需要一種具備合理結(jié)構(gòu)的全面方法為人工智能應(yīng)用打好基礎(chǔ)。簡而言之,要想高效應(yīng)用人工智能,必須要有一個高效的信息架構(gòu)。
近期,IBM總結(jié)并提出了人工智能階梯概念,幫助企業(yè)實現(xiàn)數(shù)據(jù)資產(chǎn)的現(xiàn)代化,加速人工智能之旅。具體來說,人工智能階梯是一種整合方法,可以幫助企業(yè)借助規(guī)范性方式加速人工智能的應(yīng)用。
人工智能階梯分為四個部分。
第一階段收集數(shù)據(jù)。用于奠定穩(wěn)固的數(shù)據(jù)基礎(chǔ),確保數(shù)據(jù)簡單、可用。
第二階段組織數(shù)據(jù)。創(chuàng)建一個能夠為人工智能提供可靠數(shù)據(jù)且隨時可用的業(yè)務(wù)分析基礎(chǔ)。
第三階段分析數(shù)據(jù)。確保人工智能可以隨時使用數(shù)據(jù),并為高級分析應(yīng)用和建立人工智能模型做好準備。
最后一個階段是融合數(shù)據(jù)。在經(jīng)歷過前三個階段后,企業(yè)已經(jīng)具備了利用人工智能模型實現(xiàn)更高商業(yè)價值的基礎(chǔ),這時候就可以將 AI 融合到企業(yè)的整個業(yè)務(wù)運營當中。
下面,我們就來具體看看這四個階段分別應(yīng)該如何操作。
首先,企業(yè)應(yīng)該如何收集數(shù)據(jù)?
數(shù)據(jù)分布在企業(yè)運營的方方面面,快速、靈活地收集不同類型、不同位置、不同數(shù)據(jù)源的數(shù)據(jù)可不是一件簡單的事情。
有一家太陽能面板制造企業(yè),當產(chǎn)品生產(chǎn)出來后,會對每件產(chǎn)品拍攝一張照片,一方面可以對產(chǎn)品質(zhì)量進行定級,另一方面為了方便以后進行質(zhì)量追溯。由于生產(chǎn)制造環(huán)節(jié)遍布在全球十幾間工廠,加上產(chǎn)品的生命周期較長,這些數(shù)據(jù)需要存儲數(shù)十年甚至更長時間,數(shù)據(jù)的存儲成為難題。IBM為這家企業(yè)搭建了全球共享的數(shù)據(jù)資源池,并且用軟件定義存儲的方式將每一間工廠超過一定保留時間的數(shù)據(jù)自動存放在磁帶中,郵寄到總部,存入帶庫。不管數(shù)據(jù)源來自哪里,全球所有工廠都可以用同樣的方式進行訪問。在打好數(shù)據(jù)收集基礎(chǔ)之后,這家企業(yè)下一步計劃用圖像識別的方法對產(chǎn)品自動進行分級評定。
做好數(shù)據(jù)收集,讓數(shù)據(jù)變得簡單并易于訪問之后,下一步是組織數(shù)據(jù)。
許多企業(yè)其實低估了不良數(shù)據(jù)可能帶來的潛在風(fēng)險。如果企業(yè)無法確保數(shù)據(jù)的可信性、完善性和一致性,他們就無法確信自己能夠?qū)崿F(xiàn)數(shù)據(jù)的全部價值。更令人擔(dān)憂的是,如果一家企業(yè)并不知道自己掌握了哪些數(shù)據(jù),也不知道如何使用數(shù)據(jù),那么,這家企業(yè)可能因違規(guī)而面臨監(jiān)管方面的挑戰(zhàn)。所以,組織數(shù)據(jù)就是要求企業(yè)對所有數(shù)據(jù)進行梳理,構(gòu)建一個可信的、面向業(yè)務(wù)的數(shù)據(jù)基礎(chǔ)。
經(jīng)歷了收集數(shù)據(jù)、組織數(shù)據(jù),數(shù)據(jù)已經(jīng)變得可以信任并易于訪問,可以隨時用于業(yè)務(wù)分析,企業(yè)的人工智能之旅就可以進入下一階段,讓數(shù)據(jù)產(chǎn)生價值。
通過分析數(shù)據(jù)可以為企業(yè)提供快速擴展的洞察力。比如某大型國際機場就利用AI視覺深度學(xué)習(xí)技術(shù)提高了安全性和管理效率,同時改善了客戶體驗。當發(fā)現(xiàn)無人行李或者尾隨人員時可及時作出反應(yīng),還可以進行人流分析,及時發(fā)現(xiàn)排隊情況并進行疏導(dǎo),智能商圈管理還可以讓機場的商業(yè)設(shè)施更加符合旅客的需求。
最近IBM宣布與小罐茶合作的AI自動除雜生產(chǎn)線也是分析數(shù)據(jù)的典型案例,小罐茶是近兩年迅速崛起的現(xiàn)代茶葉品牌,對茶葉品質(zhì)有著嚴格標準,除了在原料上精挑細選之外,對加工環(huán)節(jié)也有著苛刻的要求。在依托認知視覺檢測的生產(chǎn)線上,可以實現(xiàn)整箱毛茶自動開箱,將茶葉倒入暫存斗,經(jīng)輸送帶震動整理傳輸,進入視覺監(jiān)測區(qū)域,由攝像頭拍照并傳送到后臺進行視覺分析,定位各類雜質(zhì)所在位置,然后控制機械臂將雜質(zhì)挑揀并分離開來,達到標準后轉(zhuǎn)入收集和計量稱重環(huán)節(jié)。整個過程模擬了人工篩茶、鋪茶和挑揀的過程,但比人更加精確可控,而且效率更高。保守估計,一條這樣的生產(chǎn)線每天可以完成200公斤毛茶的篩揀除雜工作,相當于50-60個挑茶工的工作量。
以上三個階段都完成后,下一步就進入了將人工智能融入企業(yè)運營,實現(xiàn)更高商業(yè)價值的融合階段。
由于企業(yè)想要將人工智能試點和概念驗證轉(zhuǎn)化為更大規(guī)模的生產(chǎn),所以,他們會遇到一個障礙——如何信賴人工智能驅(qū)動的應(yīng)用。
比如大家都知道的今日頭條,會根據(jù)你的閱讀歷史進行內(nèi)容推送。但很多人發(fā)現(xiàn)這種根據(jù)初始閱讀習(xí)慣進行的推送容易固化,容易讓你被定性為只喜歡某一類別,使你接觸不到其他信息,這就是數(shù)據(jù)產(chǎn)生了偏差,是人工智能模型普遍存在的一種可能性。
隨著人工智能被融入更多業(yè)務(wù)之中,這種情況會變得尤為明顯。這時我們就需要在保證數(shù)據(jù)可解釋、可信賴的前提下在企業(yè)中融入可信賴、可理解的 AI 驅(qū)動型流程。也就是說,和之前組織數(shù)據(jù)階段的可信不同,融合數(shù)據(jù)階段的重點是保證數(shù)據(jù)模型的公正。
為此,企業(yè)需要可以查看到模型提供建議的方式和原因,能夠跟蹤模型構(gòu)建所用的系列數(shù)據(jù)和訓(xùn)練,通過融合建立信任和透明度,并且可以將模型集成到工作流和流程自動化平臺之中,從而幫助企業(yè)更快地實現(xiàn)人工智能運營化。
通過人工智能階梯的四個階段,企業(yè)就可以實現(xiàn)數(shù)據(jù)資產(chǎn)的現(xiàn)代化,成功打造一個靈活、統(tǒng)一、高效且規(guī)范的信息架構(gòu),為企業(yè)利用人工智能進一步實現(xiàn)商業(yè)價值奠定堅實的基礎(chǔ)。
最后還要注意的是,未來的商業(yè)環(huán)境越來越復(fù)雜,擁有一個開放且統(tǒng)一的整合架構(gòu)無疑會幫助企業(yè)加快人工智能發(fā)揮價值的速度。IBM Cloud Private for Data 可以為企業(yè)提供一個完全統(tǒng)一且可控的整合式平臺,是一種開放、可擴展的基礎(chǔ),能夠?qū)⑷斯ぶ悄茈A梯上的所有功能整合到一個混合型多云環(huán)境中。在IBM Cloud Private for Data數(shù)據(jù)平臺中,開放源碼和現(xiàn)代云架構(gòu)已然合為一體,可以說這是一種用于人工智能的云原生信息架構(gòu)。這種架構(gòu)能夠充分實現(xiàn)數(shù)據(jù)容器化、部署微服務(wù)架構(gòu),還能提供完全可控的自動化整合技術(shù)和工作流。