斯科特·貝利納托
數(shù)據(jù)科學正在迅猛發(fā)展。企業(yè)在過去五年間,投資數(shù)十億美元,網(wǎng)羅最有才華的數(shù)據(jù)科學家,在他們的幫助下開實體店,搜集了以澤字節(jié)計算的“原料”,通過算法找出喧囂數(shù)據(jù)中隱藏的有用信號。從某種程度上說,這種做法是有效果的。在諸如翻譯、零售業(yè)、醫(yī)療和籃球運動等眾多領域,數(shù)據(jù)改變了現(xiàn)有關系。
雖有成功案例,但很多企業(yè)仍未能從數(shù)據(jù)科學中獲得應有價值。即使企業(yè)運營良好,分析效果出色,依然無法將洞見轉化為利潤。問題出現(xiàn)在最后環(huán)節(jié)——數(shù)據(jù)部門向決策者講述這些洞見時存在不足。
Kaggle公司2017年針對7000多名數(shù)據(jù)科學家的調研結果表明,前七個“工作障礙”中有四個和最后環(huán)節(jié)有關,并非技術問題,其中包括“缺乏管理、財務支持”“解決的問題不夠清晰”“決策者對結果不予使用”以及“向其他人解釋數(shù)據(jù)科學”。數(shù)據(jù)科學家雨果·鮑恩安德森(Hugo Bowne-Anderson)在他的播客中采訪了35名數(shù)據(jù)科學家,得出與上述調研一致的結論“我的大多數(shù)客戶告訴我,數(shù)據(jù)科學家的關鍵技能是在工作中學習,提高溝通能力,以便回答商業(yè)問題,向非技術利益相關方解釋復雜的分析結果?!?/p>
我在大型機構講授數(shù)據(jù)可視化(dataviz)和說服溝通,并提供咨詢,數(shù)據(jù)科學家和高管都向我表達過他們的挫敗。數(shù)據(jù)團隊知道自己手握有價值的洞見,但就是無法推銷出去。他們認為決策者誤解或過度簡化了他們的分析,對他們有不切實際的期待,認為他們能回答出所有問題。而高管則抱怨自己斥巨資研發(fā)數(shù)據(jù),結果卻無法得到期待中的指導性結果。高管看不到切實的結果,是因為數(shù)據(jù)團隊沒有用他們能理解的語言向其解釋這些結果。
商業(yè)和技術之間的鴻溝早就存在,但隔閡正在加深。105年前,還沒有出現(xiàn)編程和計算機時,威拉德·布林頓(Willard Brinton)在他里程碑式的著作《用圖表法陳述事實》(Graphic Methods for Presenting Facts)中描述了最后環(huán)節(jié)的問題,“這事已經屢見不鮮,掌握事實的技術人員深思熟慮后提交了計劃,但某個無知專橫的委員會成員或董事會成員讓他亂了陣腳,因為他沒能充分準備好應對這些反對之聲……數(shù)據(jù)和有效陳述之間的關系,相當于大教堂和地基。”
一個多世紀過去了,為什么情況還是這樣?最后環(huán)節(jié)的問題根源盤根錯節(jié),不一而足。首先,研究人員使用的工具含有可視化功能,這讓大家覺得數(shù)據(jù)科學家應當承擔起溝通責任。這些工具的默認功能比不上構思精細、設計優(yōu)美的數(shù)據(jù)可視化,導致數(shù)據(jù)處理結果和可視化程度不匹配,數(shù)據(jù)科學家一般也不愿意溝通。很多數(shù)據(jù)科學家告訴我他們警惕可視化,因為這會簡化其成果,掩蓋科學分析的細微之處和不確定性,誤導高管得出簡單化的結論。但是,企業(yè)在爭奪炙手可熱的數(shù)據(jù)科學家時,重點放在他們能找到的最優(yōu)秀的技術導向型人才,并沒有考慮到他們和外行溝通的能力或意愿。
如果企業(yè)雇用其他人才來填補斷層也可以,但現(xiàn)實并非如此。企業(yè)希望科學家整理數(shù)據(jù),在了解公司業(yè)務和戰(zhàn)略的情況下分析數(shù)據(jù)、制作圖表、對外行解釋這些數(shù)據(jù)的意義。這并不合理,同時具備這些才能的人很罕見,屬于獨角獸。
要想解決最后環(huán)節(jié)的問題,企業(yè)必須停止尋找獨角獸,開始思考數(shù)據(jù)部門所需的人才配置。本文為這些企業(yè)提供了一種解決之道,停止對數(shù)據(jù)科學家不切實際的期待,招聘新類型員工作為補充。解決問題需要跨學科團隊,包括在相近領域工作的不同類型人才。讓員工通過了解他人的工作培養(yǎng)同理心,從而進行互補性合作。工作不再需要在不同團隊間傳遞,而是共同完成。
團隊工作法并非新事物,此處是舊法新用,可以幫助數(shù)據(jù)科學團隊跨越最后環(huán)節(jié)的障礙,交付為組織創(chuàng)造的價值。
背后的原因
20世紀早期,現(xiàn)代管理學先驅為了通過可視化溝通將數(shù)據(jù)轉化為決策,進行了復雜操作,通過跨學科團隊完成,其中包括復穿孔機操作員、卡片分揀員、管理者和制圖人員(當時幾乎都是男性)。布林頓書中提到很多這類協(xié)作。鐵路公司和大型制造公司尤其嫻熟,他們了解了如何通過工廠找出最高效的配送原材料路線,實現(xiàn)區(qū)域銷售績效目標,以及優(yōu)化節(jié)假日安排。
團隊工作法貫穿了整個20世紀。在瑪麗·埃莉諾·斯皮爾(Mary Eleanor Spear)1969年出版的著作《實用圖表技術》(Practical Charting Techniques)中,作者詳細描述了理想團隊的組成,包含溝通者、圖表分析師和制圖員(仍然是男性占多數(shù)),以及他們的責任。斯皮爾寫道,“(三者)合作是明智選擇?!?/p>
20世紀70年代開始出現(xiàn)分裂??茖W家紛紛使用新技術,利用技術他們可以在處理數(shù)據(jù)時(通過計算機程序)視覺化數(shù)據(jù)。很快他們不需要其他人幫助,可以獨立制作出未經打磨的圖表。在數(shù)據(jù)可視化的世界,計算機驅動的視覺化和更加經典的制圖人員(終于有了更多女性參與)設計驅動的視覺化之間出現(xiàn)了裂縫。
Chart Wizard是微軟在Excel表格上的創(chuàng)新功能,可以“一鍵視覺化”,徹底分割了這兩個世界。忽然間,隨便什么人都能立刻做一個表,輔以過猶不及的各種變形,把柱狀圖做成三維的或者將餅狀圖弄得跟甜甜圈一樣。其影響之深遠怎么強調都不為過,它讓表格成為了商業(yè)通用語,在運營中融入了數(shù)據(jù)應用,最終發(fā)展出數(shù)據(jù)科學,因為它突破了設計師將數(shù)據(jù)轉化為視覺化工作量的下限。更關鍵的是,它改變了工作的結構。設計師,即制圖人員被低估,最終消失在數(shù)據(jù)分析領域。視覺化成為數(shù)據(jù)管理人員的工作,他們大多既沒有受過視覺化培訓,也不想學習這些知識,相比更耗時、需要更多資源、設計主導的視覺化過程,在陳述中粘貼一個Chart Wizard圖更快速便捷,即使前者效果明顯更好。
數(shù)據(jù)科學出現(xiàn)后,雖然從業(yè)人員的必備技能已經拓展到包括編程、統(tǒng)計學和算法模型,但大家對數(shù)據(jù)科學家的期待仍和過去一樣——處理數(shù)據(jù)并向外界解釋成果。在2012年關于數(shù)據(jù)科學家里程碑式的文章中,將數(shù)據(jù)科學稱為21世紀最性感的工作,用“獨角獸”詞匯來模糊描述這一職業(yè):“成功的數(shù)據(jù)科學家應當具備哪些能力?他的能力包含了數(shù)據(jù)電腦黑客、分析師、溝通者和可信賴的顧問。這種組合非常強大,且罕見?!?/p>
因此,在招聘這一最炙手可熱的職位時,很多公司難以找到所需人才,不得不另辟蹊徑。最佳方式就是改變他們對數(shù)據(jù)科學家技能組合的要求,招聘具有不同能力的人才組成團隊。
打造更優(yōu)秀的數(shù)據(jù)科學團隊
基于團隊合作的高效數(shù)據(jù)運營可以借鑒布林頓和斯皮爾的例子,但也要考慮現(xiàn)代商業(yè)環(huán)境,包括需要處理的數(shù)據(jù)量、自動化系統(tǒng)、視覺化技能的發(fā)展。
此外,項目類型也發(fā)生了變化,包括標準分析學數(shù)據(jù)的簡單報告(例如財務結果),以及使用最前沿的機器學習算法的復雜大數(shù)據(jù)工作。
我們將在下文介紹打造團隊的四個步驟:
定義能力,而不是團隊成員。你可能覺得,在拆解獨角獸思維時,第一步理應是將“完美”數(shù)據(jù)科學家的職能分配給不同的人:數(shù)據(jù)處理人員,數(shù)據(jù)分析師,設計師和溝通者。
其實并非如此。與其將人員分配到不同職位,不如找出成功所需的能力。一種能力不等于一個人,可能一個或多個人都擁有這項能力。一個人可能擁有幾項才能,三個人可能有五項才能。在項目處于不同階段時,讓團隊能夠靈活配置或重新配置人員時,這是一個微妙但很重要的區(qū)別。
每家公司所需的能力不同,但核心包括以下六種:
項目管理。根據(jù)項目類型和階段,團隊要足夠敏捷,隨時調整,采用類似敏捷開發(fā)的方法,會涉及運營的各個方面。一名優(yōu)秀的項目經理要有出色的組織能力和強大的外交技能,通過在會議上彌合不同人才之間的文化鴻溝,讓團隊成員彼此順利溝通。
數(shù)據(jù)整理。這種能力包含以下技能:構建系統(tǒng);搜集、處理、結構化數(shù)據(jù);創(chuàng)建并維護算法和其他統(tǒng)計引擎。懂得整理數(shù)據(jù)的人才會尋找機會優(yōu)化企業(yè)運營,例如,他們會針對多個項目構建可重復流程,或創(chuàng)建模板,獲得可靠、可預測的視覺輸出,用于啟動信息設計流程。
數(shù)據(jù)分析。這種能力是提出假設并驗證,在數(shù)據(jù)中發(fā)現(xiàn)意義,將其應用于具體的商業(yè)環(huán)境中。這點在很多數(shù)據(jù)科學運營中體現(xiàn)不足。一些機構非常倚重數(shù)據(jù)整理人員,讓他們兼做數(shù)據(jù)分析。但是優(yōu)秀的數(shù)據(jù)分析與編程和數(shù)學分離。這種能力往往出現(xiàn)在人文科學而不是計算機科學中。軟件公司Tableau認為,2018年分析學方面最大的趨勢之一是人文和數(shù)據(jù)分析的融合。人文學科中的一些核心學習能力,包括批判性思維、情境設定等,恰好也是分析數(shù)據(jù)方面的核心技能,反之亦然。在關于這個話題的一個網(wǎng)絡課程中,Tableau研究科學家邁克爾·科雷爾(Michael Correll)解釋了為什么他認為數(shù)據(jù)科學和人文科學的融合很關鍵?!皩?shù)據(jù)和人類分開是不可能的,”他說,“人文科學擅長幫助我們深入情境之中,通過某種方式體現(xiàn)出人類的存在,技術在這方面可能有所缺失?!?/p>
學科知識。過去大家常說,數(shù)據(jù)科學團隊在地下室埋頭做著晦澀的神秘工作,僅在公司需要時浮出水面?,F(xiàn)在已經不是這樣了。數(shù)據(jù)科學不該被視作服務部門,團隊應有管理層加入。掌握業(yè)務和戰(zhàn)略的高管在項目設計和數(shù)據(jù)分析時可以擔任顧問,讓團隊將精力放在產出業(yè)務結果,而不僅僅是構建最佳統(tǒng)計模型上。杰奎因·坎德拉(Joaquin Candela)是Facebook公司應用機器學習部門的領導,他的工作是讓團隊集中精力改善商業(yè)結果而非數(shù)據(jù)科學,并獎勵有利于這些結果的決策。
設計。很多人誤解了這種才能。優(yōu)秀的設計并非善于選擇顏色和字體,或者作出精美的圖表。這些屬于風格,并非設計中最重要的部分。富有設計才能的人會研究并開發(fā)出能夠有效進行視覺交流的系統(tǒng)。在數(shù)據(jù)科學方面,他們懂得如何針對受眾創(chuàng)造和編輯視覺圖像,幫助他們提取信息。特別擅長理解和處理數(shù)據(jù)視覺化的信息設計才能對數(shù)據(jù)科學團隊非常重要。
敘事能力。敘事是人類非常強大的發(fā)明,也是數(shù)據(jù)科學中利用最為不足的一項能力。
彌合算法和高管之間溝通鴻溝的最重要能力,就是用講故事的方法闡述數(shù)據(jù)洞見?!坝脭?shù)據(jù)講故事”,是一個老生常談的詞,但被很多人誤解了。它絕不是讓講述者變成史蒂芬·金(Stephen Kings)或者湯姆·克蘭西(Tom Clancys)(兩位均為美國暢銷書作家),而是理解闡述的原理和結構,并將其應用在數(shù)據(jù)可視化和業(yè)務陳述中。
配置必要的能力組合。一旦你找到所需能力,無需讓招聘團隊覺得這是需要一一對應的職位。只要團隊中的人具備這些能力就可以了。有些能力是相伴而生的:例如設計和闡述能力,或者數(shù)據(jù)整理和數(shù)據(jù)分析,可能會在一個人身上出現(xiàn)。
有時候員工不具備某項能力,但是可以外包。我在工作中會儲備一些智囊團,他們在我能力欠缺的領域是專家。比如說,可以聯(lián)系一家信息設計公司,或者外包一些數(shù)據(jù)整理工作,以預處理和結構化新數(shù)據(jù)流。
區(qū)分人才和能力,會幫助公司解決最后環(huán)節(jié)的問題,這樣他們就不會試圖尋找既懂數(shù)據(jù)科學又會溝通的人。數(shù)據(jù)科學家在出色的設計師同事的幫助下,可以專注自己擅長的事。之前可能被忽視的人也因此有了新機會。例如某個擅長設計的程序員,在這種情況下就能發(fā)揮作用。
Life Epigenetics公司首席數(shù)據(jù)科學家和Reddit 頻道“數(shù)據(jù)之美”(分享和討論優(yōu)秀的數(shù)據(jù)視覺化)的策展人蘭德爾·奧爾森(Randal Olson),曾經只關注數(shù)據(jù)科學的技術部分是否出色?!皠側胄袝r,我完全不重視溝通的部分?!彼f,“我覺得這是個普遍問題?!爆F(xiàn)在他會在某些情況下改變招聘流程,“你知道,候選人進來后我們馬上在白板開始建模,”他說,“這是數(shù)據(jù)科學家之間的溝通方式。但現(xiàn)在我有時候會找一個非技術人員,讓候選人‘向這個人解釋一下這個模型?!?/p>
讓團隊成員和其他成員接觸,了解自己不具備的能力。要想避免文化沖突,我們要想辦法理解他人的體驗。設計人才往往接觸不到統(tǒng)計學或者算法,而是專注于設計美學方面的打磨、簡化、明晰和闡述。設計師很難充分表現(xiàn)數(shù)據(jù)成果的深度和復雜性,而另一方面理性的數(shù)據(jù)科學家重視客觀性、統(tǒng)計的嚴謹性和全面性,溝通對于他們來說不但陌生而且是種干擾?!斑@不符合他們的氣質,”一家大型科技公司數(shù)據(jù)部門的管理者說,“我在數(shù)據(jù)行業(yè)干了十年,一直都是這種方式,但是當我必須打造一個團隊時,過程大開眼界。我發(fā)現(xiàn)哪怕是稍微學習下關于溝通的內容,也會讓我們的業(yè)務獲得更多支持?!?/p>
很多方法可以讓團隊成員看到他人才華的價值。設計師應該學習一些基礎的統(tǒng)計知識,例如參加入門課程,數(shù)據(jù)科學家也可以學習一些基本的設計原理。彼此都不需要成為對方領域的專家,只要達到能夠理解對方的程度即可。
不同人才都應列席敏捷開發(fā)“站會”等會議。司克蘭模式(Scrum)敏捷開發(fā)的站會多數(shù)是為了討論公司最新技術進展,營銷部門的員工也可以參加并進行業(yè)務陳述,奧爾森的公司就是這么做的。學科專家應該讓數(shù)據(jù)整理和分析人員參加戰(zhàn)略會議。利益相關方和數(shù)據(jù)團隊溝通的專門會議也能夠促進彼此的理解。StitchFix的首席算法官埃里克·科爾森讓團隊成員向非技術受眾進行一分鐘的業(yè)務闡述,強迫他們以大家都能理解的方式解釋問題?!捌駷橹?,”科爾森說,“如果你提到‘椰子,公司的人都知道這是某人用來描述他在解決的某個統(tǒng)計學問題所用到的比喻。我們努力以大家都能理解的方式來講述,因為公司不會做他不理解的事?!睌?shù)據(jù)學團隊的另一位管理者整理了技術人員和設計人員使用的詞匯表,幫助大家了解彼此的語言。
如果你所在的機構擁有像科爾森這樣兼具數(shù)據(jù)和溝通、設計才能的罕見人才,可以讓他們來指導他人。如果員工表示希望能夠學習自己不會但企業(yè)需要的知識,應當鼓勵,即使這種能力(例如設計技巧)和他們已經掌握的能力(數(shù)據(jù)整理)相去甚遠。在我的工作坊,數(shù)據(jù)科學家說他們想要提高自己的設計或者闡述能力,但是沒有時間去做。其他人也希望團隊有這樣的能力,但是他們的項目管理主要關注技術成果,而非商業(yè)成果。
所有交流都是為了能力不同的團隊成員彼此共情。共情會帶來信任,這是團隊高效合作的必要基礎??茽柹f又一次他使用敘事能力,幫助解釋數(shù)據(jù)分析的一項成果:“我記得有一次我們在進行一個產品促銷問題的業(yè)務陳述,我們認為公司當時的思路有問題。我希望促銷和銷售團隊相信我們所說的?!彼麤]有通過解釋貝塔二項式分布等統(tǒng)計學概念來支持自己的觀點,而是講述了一個某人試圖從缸中取球,隨著時間推移,缸中球的種類和數(shù)量發(fā)生變化的故事?!按蠹液芟矚g這個故事,”他說,“你能感到屋子里面的人對這個故事有共鳴,這讓他們對我們有信心,已經無需解釋背后的數(shù)學邏輯,我們贏得了信任?!?/p>
根據(jù)能力安排項目。有了不同的能力組合,就可以用這些能力實現(xiàn)目標。項目何時需要什么樣的能力是不斷變化的,這讓項目變得棘手。出色的項目管理技能和敏捷方法的經驗會在配置和重新配置能力、按需配置資源,確保整個流程按計劃執(zhí)行中發(fā)揮作用。
不可或缺的其他步驟
項目想成功,還需要其他步驟。
任命一位獲得授權的利益相關者。數(shù)據(jù)團隊可能并不管理所有所需人才。設計人才也許效力于營銷部門;學科專家可能是向CEO匯報的高管。盡管如此,仍然需要盡可能多的給他們決策權。利益相關方往往是具有商業(yè)專長,對商業(yè)目標負責或關系密切的人。畢竟,數(shù)據(jù)科學的終極目標是為了取得更好的商業(yè)結果,這些人能夠為團隊創(chuàng)造共同目標和激勵因素。如果團隊和幾位各執(zhí)己見的利益相關人打交道,你可能會陷入有責無權的境地。理想狀況下,你可以借此避開這種情況。
任命主要負責人和支持性員工。團隊由誰帶頭,誰負責提供支持,取決于項目類型和所處階段。
同地辦公。在完成項目的過程中,讓所有團隊成員在同一個辦公場所工作。再建立一個網(wǎng)上共享空間,供大家交流協(xié)作。如果設計和敘事人才使用Slack辦公,技術團隊使用GitHub,商業(yè)專家通過電子郵件溝通,這種情況并不可取。可以使用“配對分析”法,團隊成員坐在一起,在同一臺電腦前工作,像敏捷開發(fā)中的迭代過程那樣。比如說數(shù)據(jù)整理和分析人員一起調整數(shù)據(jù)模型,測試假設,或者具有學科專長和敘事能力的人,共同完善一個業(yè)務陳述,在需要調整圖表時叫設計人員來幫忙。
成為真正的團隊。同地辦公最關鍵要保證團隊作為整體有力量。在Stitch Fix,“我們的規(guī)則是不允許‘傳球,”科爾森說,“我們不想在不同部門之間協(xié)調三個人?!睘榇耍紫却_保團隊在外部支持有限的情況下,擁有實現(xiàn)目標所需的全部能力。他還嘗試雇用那些大家稱為通才的人,兼具技術和溝通能力的人才。工作中,數(shù)據(jù)科學家需要敘事,或者學科專家需要理解一些統(tǒng)計學原理,在這類情況下,科爾森通過不斷反饋強化了這一模式。
重復使用并建立模板??茽柹€創(chuàng)造了一個“算法UI團隊”,即結合了設計才能和數(shù)據(jù)整理才能的一組人,編出可重復使用的代碼,讓項目團隊得以創(chuàng)造出優(yōu)秀的數(shù)據(jù)可視化。這類模板對團隊的高效運營非常重要。比如說,通過代碼,將信息設計師和數(shù)據(jù)分析師之間關于最優(yōu)視覺化的對話固化下來,成為工具。格雷漢姆·麥克唐納(Graham Mac-Donald)是Urban Institute的首席數(shù)據(jù)科學家,他成功地建立了很多這樣的模板。他的團隊為美國很多縣制作縣級數(shù)據(jù)。通過結合數(shù)據(jù)整理和學科專長,理解溝通需求,該團隊打造了一個可重復使用的模板,為任意一個縣制作出定制化的結果。如果沒有團隊對不同能力的整合,是很難做到這點的。最后環(huán)節(jié),也就是向外行解釋數(shù)據(jù)科學,進化發(fā)展得不像數(shù)據(jù)技術那么快,或者說那么全面。這點必須盡快得到解決,要重新思考如何組建和管理數(shù)據(jù)團隊,以及從第一個數(shù)據(jù)流到最后向董事會展示的圖表——流程的每個節(jié)點由誰參與。數(shù)據(jù)科學團隊如果不能成功跨越“最后一公里”,將無法履行對公司的承諾。