国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

為什么機器學(xué)習(xí)沒有捷徑可循?

2019-03-22 02:22MattAsayMonkeyKing
計算機世界 2019年6期
關(guān)鍵詞:捷徑機器經(jīng)驗

Matt Asay Monkey King

企業(yè)必須明白,好的數(shù)據(jù)科學(xué)在企業(yè)實踐中需要花費時間,同時還要給相關(guān)人員學(xué)習(xí)和成長的空間,所以這里沒有任何捷徑可循。

OReilly最新的調(diào)查數(shù)據(jù)顯示,大數(shù)據(jù)仍然只是1%,或者15%的企業(yè)游戲。大多數(shù)的企業(yè) (85%)依然沒有破解AI和機器學(xué)習(xí)的密碼。僅僅只有15%的“見多識廣”的企業(yè)在生產(chǎn)過程中運行一些數(shù)據(jù)模型超過了5年。更重要的是,這些企業(yè)更傾向于在一些重要的領(lǐng)域花費時間和精力,比如模型偏差和數(shù)據(jù)隱私。相對而言,那些還屬于初學(xué)者之列的企業(yè)仍然還在努力嘗試著尋找啟動按鈕。

不幸的是,對于那些希望通過自動快捷方式比如Google的AutoML或者通過聘請咨詢公司縮小數(shù)據(jù)科學(xué)差距的企業(yè),我們給出的答案是:實現(xiàn)數(shù)據(jù)科學(xué)的確需要花費時間,而且沒有捷徑可循。

聰明的企業(yè)專注于深層次數(shù)據(jù)

首先,值得注意的是, OReilly的調(diào)查數(shù)據(jù)來自于其自選的一群人: 那些曾經(jīng)參加過OReilly活動的,或者參加過該公司在線研討會或通過其他途徑與之有接觸的人。這些人群對于數(shù)據(jù)科學(xué)都有前瞻性的興趣,即使(按照調(diào)查數(shù)據(jù)的顯示)他們中的大部分人并沒有從事太多的相關(guān)工作。對于那些沉浸在大數(shù)據(jù)體驗中的人來說,最好的客戶群體就是那些被稱為“見多識廣”的企業(yè),它們在生產(chǎn)過程中使用的數(shù)據(jù)模型已經(jīng)運行了5年以上。

從調(diào)查上可以發(fā)現(xiàn)一個有趣的現(xiàn)象,那就是這些企業(yè)是怎樣稱呼他們自己的數(shù)據(jù)專家的。具有豐富數(shù)據(jù)經(jīng)驗的企業(yè)稱之為數(shù)據(jù)科學(xué)家。而那些思維尚停留在上世紀90年代 “數(shù)據(jù)挖掘”模式的企業(yè)則更傾向于稱其為“數(shù)據(jù)分析師”。如圖1所示。

調(diào)查發(fā)現(xiàn),無論企業(yè)選擇如何稱呼他們的數(shù)據(jù)專家,企業(yè)在AI和機器學(xué)習(xí)方面的經(jīng)驗越豐富,他們就越有可能依靠內(nèi)部數(shù)據(jù)科學(xué)團隊建立模型,如圖2所示。

幾乎沒人關(guān)注云機器學(xué)習(xí)服務(wù)(至少現(xiàn)在還沒有)。那些只有2年以下生產(chǎn)經(jīng)驗的企業(yè)傾向于依賴外部的顧問來搭建機器學(xué)習(xí)模型。對于這樣的企業(yè)而言,這種感覺就像一種不用投入人力而享受數(shù)據(jù)科學(xué)收益的機會,但這是一個非常愚蠢的方法。

企業(yè)的數(shù)據(jù)越復(fù)雜,其數(shù)據(jù)科學(xué)團隊就越能建立模型,并評估項目成功的關(guān)鍵指標??v觀所有的企業(yè),產(chǎn)品經(jīng)理對于項目成功的作用是36%,管理團隊的數(shù)據(jù)是29%,數(shù)據(jù)科學(xué)團隊的貢獻是21%。

對于那些經(jīng)驗豐富的企業(yè)來說,產(chǎn)品經(jīng)理的作用依然占到34%,數(shù)據(jù)科學(xué)團隊27%,幾乎與管理團隊(28 %)相同。

對那些缺乏經(jīng)驗的企業(yè)而言,管理團隊占到31%,數(shù)據(jù)科學(xué)團隊占比較少 (16%)。這不是個問題,事實是這些數(shù)據(jù)科學(xué)團隊最適合計算出如何使用數(shù)據(jù)并衡量其成功。

太多時候,是外行指導(dǎo)外行

這種依賴管理層來推動數(shù)據(jù)科學(xué)的想法引起了人們的注意。調(diào)查顯示,不少高管自稱是數(shù)據(jù)驅(qū)動的,但卻無視了數(shù)據(jù)其實并不支持那些靠直覺驅(qū)使的決策(62 %的人承認這么做)。

那些缺乏大數(shù)據(jù)悟性的企業(yè)似乎愿意口頭提供數(shù)據(jù),但他們根本不明白有效數(shù)據(jù)科學(xué)的細微差別。他們?nèi)狈Ρ貍涞慕?jīng)驗來確??梢垣@得有意義的、無偏見的數(shù)據(jù)洞察力。

關(guān)于如何理解機器學(xué)習(xí)模型,以及如何相信該模型所導(dǎo)致的結(jié)果,更多有成熟經(jīng)驗的企業(yè)顯然掌握了Gartner博客網(wǎng)絡(luò)中的一位博主Andrew White的評估方法:

·AI的創(chuàng)新之處就在于AI可以重新定義新的基線,換句話說就是那些我們認為太過復(fù)雜的東西和非常規(guī)的東西,目前都可以利用AI來實現(xiàn)。和之前的技術(shù)相比,AI應(yīng)該可以處理更加復(fù)雜而且具有認知能力的工作。

·這個新的現(xiàn)實只有在AI自動處理的結(jié)果是合理的時候才有意義。如果這個新奇的工具所得出的決策和結(jié)果讓人類無法理解,那人們就會放棄這個工具。因此在某種程度上,能否理解AI所做出的決策也非常重要。

·然而,理解決策和理解算法如何工作是兩回事。人是可以掌握輸入、選擇、權(quán)重以及結(jié)果的原理的,而即便算法能夠在一定程度上將所有這些結(jié)合到一起,但我們依然無法證明這一進程。如果結(jié)果和輸入之間的差距太大,那么人對算法的信任就很有可能會喪失——這是人的天性。

想要達到這種理解水平是無法通過花錢雇傭咨詢顧問能實現(xiàn)的。云端也不是現(xiàn)成的。運用工具比如Google的AutoML 可以“使得那些具有有限機器學(xué)習(xí)專長經(jīng)驗的開發(fā)者能訓(xùn)練針對其業(yè)務(wù)需求的高質(zhì)量模型。”這聽起來非常好,但是想要從數(shù)據(jù)科學(xué)中受益需要有數(shù)據(jù)科學(xué)的經(jīng)驗。這不僅僅是調(diào)整模型的問題,更需要知道如何實現(xiàn),這需要大量的試錯經(jīng)驗。

另外,從事數(shù)據(jù)科學(xué)需要有人文的心態(tài),再次強調(diào),需要經(jīng)驗。沒有捷徑可循。實際上,這意味著那些早期投資于數(shù)據(jù)科學(xué)的企業(yè)應(yīng)該發(fā)現(xiàn)自己領(lǐng)先于那些沒有競爭優(yōu)勢的同行——這種差異很可能會持續(xù)下去。

對于那些希望迎頭趕上的企業(yè),Gartner分析師Svetlana Sicular最為經(jīng)典的忠告仍然在耳邊回響:“企業(yè)應(yīng)該在內(nèi)部多看看。其實內(nèi)部已經(jīng)有人比那些神秘的數(shù)據(jù)科學(xué)家更了解自己的數(shù)據(jù)?!敝灰髽I(yè)明白要在企業(yè)完成好的數(shù)據(jù)科學(xué)需要花費時間,并且給予其人員學(xué)習(xí)和成長的空間,他們就不再需要尋找捷徑。

Matt Asay是信息領(lǐng)域的長期從業(yè)者,以及前知識產(chǎn)權(quán)律師,目前是Adobe公司開發(fā)者生態(tài)系統(tǒng)的最高領(lǐng)導(dǎo)。

猜你喜歡
捷徑機器經(jīng)驗
機器狗
機器狗
2021年第20期“最值得推廣的經(jīng)驗”評選
捷徑,是更漫長的道路
上了985才發(fā)現(xiàn),拼命讀書是大多數(shù)人的捷徑
經(jīng)驗
2018年第20期“最值得推廣的經(jīng)驗”評選
未來機器城
放棄捷徑
當(dāng)你遇見了“零經(jīng)驗”的他
鄂托克前旗| 丹江口市| 喜德县| 九龙坡区| 铜鼓县| 龙胜| 天台县| 合山市| 大安市| 九龙坡区| 互助| 翁牛特旗| 安丘市| 达州市| 莎车县| 二连浩特市| 富民县| 札达县| 台东市| 隆德县| 武功县| 青田县| 昭苏县| 南雄市| 拜泉县| 曲周县| 梁河县| 崇义县| 长岭县| 柳州市| 铁岭市| 浪卡子县| 胶州市| 乐至县| 泰和县| 柳江县| 祥云县| 平泉县| 乌苏市| 镇远县| 永兴县|