袁斯來(lái)
如果身體有些不太舒服,我們可能不會(huì)馬上加入到三甲醫(yī)院看病的人海中,為個(gè)小毛病掛上百元的專家號(hào)。很多時(shí)候,人們習(xí)慣于先上網(wǎng)搜索一番,對(duì)癥自我診斷一下,再看是不是真有必要?jiǎng)谛馁M(fèi)力地跑一趟。
沒有任何醫(yī)學(xué)背景的張超創(chuàng)立康夫子就是想讓用戶的自我診斷更加專業(yè)一些。康夫子是一家醫(yī)療人工智能(AI)輔助診療提供商,它想用AI培養(yǎng)出靠譜的機(jī)器人“全科醫(yī)生”,更好地提高就診效率,盡可能利用有限的醫(yī)療資源。它的預(yù)問診機(jī)器人能嵌入到各大掛號(hào)平臺(tái)和醫(yī)院的醫(yī)院信息系統(tǒng)(HIS)中,完成智能導(dǎo)診和分診,讓病人更準(zhǔn)確地找到醫(yī)生,幫醫(yī)生節(jié)約重復(fù)性詢問和初診時(shí)間。目前,康夫子已經(jīng)和知名的HIS系統(tǒng)提供商?hào)|華軟件、東軟集團(tuán)、健康160、360良醫(yī)搜索等數(shù)十家企業(yè)達(dá)成合作,并且在2017年9月完成5000萬(wàn)元人民幣A輪融資,投資方為火山石資本和寬帶資本旗下的晨山基金,天使輪投資方晨興資本跟投。
康夫子的創(chuàng)始人張超是個(gè)不折不扣的理工男,他本科在成都的電子科技大學(xué)學(xué)數(shù)學(xué),到新加坡交換時(shí),研究方向?yàn)樽匀徽Z(yǔ)言處理,也曾在百度從事自然語(yǔ)言處理和信息提取工作。2015年,一直想創(chuàng)業(yè)的張超終于還是離開了百度,拉著自己的同事成立了康夫子。當(dāng)年和他一起交換的同學(xué)很多拿到了美國(guó)的教職,有的還成了“青年千人計(jì)劃”學(xué)者,但“我是肯定要去工業(yè)界的,我還是喜歡折騰”,張超告訴《第一財(cái)經(jīng)周刊》。
其實(shí),張超當(dāng)時(shí)也還不知道AI將成為一個(gè)大風(fēng)口,他們小團(tuán)隊(duì)最大的強(qiáng)項(xiàng)是善于做知識(shí)圖譜和自然語(yǔ)言處理,他想要切入的是一個(gè)既需要技術(shù),又需要“知識(shí)經(jīng)驗(yàn)”的領(lǐng)域。最開始,張超甚至還想過去做金融領(lǐng)域的應(yīng)用,但被在金融行業(yè)工作的妻子勸住了。后來(lái)他和同伴幾乎是憑直覺選擇了醫(yī)療健康行業(yè),“當(dāng)時(shí)覺得醫(yī)療變化很劇烈,覺得這樣的領(lǐng)域能殺出來(lái)。”張超說。
正巧那個(gè)時(shí)候,妻子懷孕,張超就想著做個(gè)針對(duì)孕婦膳食營(yíng)養(yǎng)分析的應(yīng)用。他們拿著靠“刷臉”得到的將近200萬(wàn)元投資,五六個(gè)人全職投入進(jìn)去,很快就推出了一款“孕婦營(yíng)養(yǎng)”的小工具。最開始,這個(gè)應(yīng)用的表現(xiàn)還不錯(cuò),但當(dāng)他們興致勃勃地上線了更詳細(xì)的分析功能,要做產(chǎn)品迭代時(shí),日活沒上升,反而下跌了不少。準(zhǔn)媽媽們對(duì)每天多吃或少吃“一個(gè)蘋果”其實(shí)沒有多大的興趣,那些分析可能遠(yuǎn)不如關(guān)鍵意見領(lǐng)袖(KOL)的一碗心靈雞湯有用?!霸袐D需要心理慰藉,需要很多運(yùn)營(yíng),我們不擅長(zhǎng)。”張超感覺失去了方向。
張超意識(shí)到他們幾個(gè)理工男必須從純“技術(shù)思維”中走出來(lái),真正從產(chǎn)品的角度去關(guān)注用戶的剛需。他想起自己在百度工作時(shí),很多人會(huì)搜索“頭痛應(yīng)該怎么辦”“咳嗽是什么病”這類問題。在張超看來(lái),即使除開導(dǎo)流的因素,搜索引擎上良莠不齊的答案其實(shí)并不能很好地解決問題,這就意味著他們的強(qiáng)項(xiàng)可能有用武之地。
在國(guó)外,有了這些常見的癥狀,人們首先會(huì)去找全科醫(yī)生診療。同樣是頭痛,可能只是感冒,也可能是惡性腫瘤的癥狀表現(xiàn),如果是后者,就會(huì)很快轉(zhuǎn)到專科醫(yī)生處,全科醫(yī)生承擔(dān)的是分診的工作。而在國(guó)內(nèi),更多人是直接到大醫(yī)院找到專科醫(yī)生。這樣一來(lái),很可能大把時(shí)間就浪費(fèi)在了一次次轉(zhuǎn)診上。
“平時(shí)看病就和升級(jí)打怪一樣,要花很多錢,還會(huì)走很多彎路。計(jì)算機(jī)技術(shù)能夠縮短就醫(yī)路徑,這個(gè)是剛需?!睆埑f。
雖然選定了新方向,但這時(shí)候的張超還對(duì)之前做的營(yíng)養(yǎng)分析產(chǎn)品念念不忘,拿著BP給投資人做介紹時(shí),他還提到70%做醫(yī)療,30%做營(yíng)養(yǎng)。投資人明確表示,“不要說營(yíng)養(yǎng),我只對(duì)醫(yī)療感興趣”,張超才終于放棄了之前的產(chǎn)品。
轉(zhuǎn)型自然是痛苦的。他們實(shí)際上要從無(wú)到有去訓(xùn)練一個(gè)全科醫(yī)生,最重要的就是要搭建一個(gè)診療“知識(shí)圖譜”。
醫(yī)學(xué)是一門知識(shí)+經(jīng)驗(yàn)驅(qū)動(dòng)的學(xué)科,知識(shí)圖譜是知識(shí)非常好的表達(dá)方式。很多日常會(huì)使用的功能都可以靠知識(shí)圖譜解決,比如越來(lái)越“聰明”,能夠理解我們?cè)捳Z(yǔ)的“語(yǔ)義搜索”—輸入“咳嗽可能是感冒嗎”,計(jì)算機(jī)就會(huì)去查找“咳嗽”和“感冒”的關(guān)系,再分析推理,之后給出相應(yīng)結(jié)果。
在康夫子,最初的知識(shí)圖譜搭建非常艱難。他們得教會(huì)計(jì)算機(jī)像人類一樣學(xué)習(xí)海量的醫(yī)學(xué)文獻(xiàn),在分析數(shù)據(jù)后,發(fā)現(xiàn)上億條文本書寫的規(guī)律,還要根據(jù)規(guī)律,從這些文本中自動(dòng)抽取知識(shí),形成一張網(wǎng)絡(luò)交錯(cuò)的圖譜。
訓(xùn)練計(jì)算機(jī)的“學(xué)習(xí)原料”就是結(jié)構(gòu)化的數(shù)據(jù)。所謂結(jié)構(gòu)化,就是將以自然語(yǔ)言書寫的文獻(xiàn)或者病歷,處理成計(jì)算機(jī)能夠理解的信息點(diǎn)?!白铌P(guān)鍵的是要從無(wú)結(jié)構(gòu)化中提取出結(jié)構(gòu)化的信息,比如用了什么藥,癥狀是什么,表現(xiàn)怎么樣,必須是明確結(jié)構(gòu)化后的知識(shí)?!笨捣蜃拥募夹g(shù)合伙人栗曉華告訴《第一財(cái)經(jīng)周刊》。
而且,僅僅是提取信息點(diǎn)遠(yuǎn)遠(yuǎn)不夠,還要把口語(yǔ)和專業(yè)的術(shù)語(yǔ)對(duì)應(yīng),才能形成醫(yī)療上的判斷。這需要計(jì)算機(jī)具備推理能力,比如它能自動(dòng)把“拉肚子”和“腹瀉”“抽筋”及“痙攣”聯(lián)系在一起。
但是,僅僅搭建這樣一個(gè)圖譜,還不足以輔助診斷。一種癥狀可能對(duì)應(yīng)多個(gè)疾病,計(jì)算機(jī)還得算出不同疾病之間的權(quán)重,才能為醫(yī)生的診斷提供一目了然的參考意見。他們計(jì)算權(quán)重,用的是統(tǒng)計(jì)學(xué)的辦法,比如感冒病人里面有多少有咳嗽癥狀,然后根據(jù)病人的回答做計(jì)算。“你要定義成醫(yī)生助手,即使是醫(yī)生,也會(huì)有反應(yīng)不過來(lái)的時(shí)候,機(jī)器能避免盲區(qū)。我們不是幫著決策,只是收集數(shù)據(jù),給出建議,不是幫醫(yī)生做決定?!睆埑f。
既需要將海量信息提取和串聯(lián),還需要算出不同可能性,對(duì)技術(shù)來(lái)說是巨大的考驗(yàn)。好在張超團(tuán)隊(duì)之前在百度做的就是類似的工作,當(dāng)時(shí)他們每天需要在上千億個(gè)網(wǎng)頁(yè)中抽取知識(shí)點(diǎn),算是有了方法論上的優(yōu)勢(shì),所以康夫子花三個(gè)多月就搭建起了初版引 擎。
現(xiàn)在看來(lái),張超他們轉(zhuǎn)型初期還是陷入了過于迷信“技術(shù)至上”的誤區(qū)。雖然一開始就組建了自己的醫(yī)學(xué)團(tuán)隊(duì),但張超并沒有多重視醫(yī)學(xué)本身的特殊性。他很簡(jiǎn)單地認(rèn)為,“只要數(shù)據(jù)足夠多,應(yīng)該就能跑出漂亮的模型。”
實(shí)際上,要建立起完善的診療技術(shù)的知識(shí)圖譜,他們很多時(shí)候還是徹底的外行。比如用藥,張超只是覺得把說明書扔到系統(tǒng)里,分析下每種病應(yīng)該用什么藥,完全沒想到要考慮藥物沖突、藥物禁忌,還要知道病人的過敏史和用藥史。
而康夫子剛開始的交互甚至沒有辦法判斷患者是急癥還是慢癥,這只能通過不斷交互去優(yōu)化。比如同樣是出血,有可能只是小擦傷包扎一下就行,也可能是被帶鐵銹的利器劃傷,這會(huì)兒就沒時(shí)間再一問一答了,康夫子應(yīng)該馬上建議患者去醫(yī)院掛外科號(hào),打破傷風(fēng)針。
張超設(shè)想的應(yīng)用場(chǎng)景是高度模擬醫(yī)生問診的對(duì)話式人機(jī)界面,要做到這一點(diǎn),他們必須獲得大量醫(yī)患就診時(shí)一問一答的數(shù)據(jù)記錄,來(lái)訓(xùn)練對(duì)話引擎。但實(shí)際情況是,醫(yī)患之間的這些回答最終都體現(xiàn)在病歷中,無(wú)法逆向還原。雖然他們能夠從患者填寫的材料中獲得一些數(shù)據(jù),但這些遠(yuǎn)不足以支撐一個(gè)合格的“機(jī)器醫(yī)生”需要的計(jì)算。
康夫子只能用“笨辦法”解決,招聘了一批有醫(yī)學(xué)背景的員工,讓他們通過病歷,反向還原問答場(chǎng)景。比如醫(yī)生只記錄了腹痛幾天,他們就需要還原出“腹痛多長(zhǎng)時(shí)間”“痛了3天”這樣詳細(xì)的回答。
現(xiàn)在來(lái)看,康夫子的客戶主要集中在B端。走到這一步,他們踩過的“坑“還是不少。他們最早的客戶是一家醫(yī)療信息技術(shù)公司,張超希望幫他們做電子病歷評(píng)級(jí),對(duì)方一開始很不感興趣,“就覺得,你們團(tuán)隊(duì)活到什么時(shí)候我們都不知道”,張超說,直到拿到一筆新投資,對(duì)方才答應(yīng)讓他們“試試”。
康夫子早期另一家重要的合作伙伴是東華軟件,這家公司的客戶包括北京協(xié)和醫(yī)院、四川大學(xué)華西醫(yī)院等??捣蜃訛樗鼈兲峁┑倪€是比較簡(jiǎn)單的病歷結(jié)構(gòu)化產(chǎn)品,也就是把病歷“翻譯”成計(jì)算機(jī)能夠識(shí)別的信息點(diǎn)。
但剛開始,客戶對(duì)他們的產(chǎn)品并不滿意。他們提供的結(jié)構(gòu)化數(shù)據(jù)幾乎就是照本宣科,很難達(dá)到醫(yī)生的需求。“就是沒滿足具體場(chǎng)景和醫(yī)生患者的心態(tài)?!睆埑髞?lái)檢討。比如做鼻咽癌結(jié)構(gòu)化,他們提取的只是一些癥狀加上檢查報(bào)告,但實(shí)際在臨床診斷上,醫(yī)生非常關(guān)注患者的吸煙史,甚至?xí)?xì)化到幾歲開始吸煙、習(xí)慣抽什么牌子多少價(jià)位的煙、每天吸多少支、平時(shí)吸煙會(huì)不會(huì)用濾嘴等。
不止如此,他們的“外行”還導(dǎo)致了不少bug,比如只是很機(jī)械地復(fù)制理想化的看病流程,和真實(shí)場(chǎng)景相差很遠(yuǎn),在和山東大學(xué)齊魯兒童醫(yī)院合作時(shí),有些科室號(hào)掛完了,康夫子的機(jī)器人醫(yī)生就束手無(wú)策,直接讓患者回家。但實(shí)際上,病人可以去問導(dǎo)診臺(tái)還有沒有其他科室的醫(yī)生也能診斷。“越做越發(fā)現(xiàn),這是個(gè)非常龐大的系統(tǒng),所以對(duì)系統(tǒng)的理解是一層層的,越做越復(fù)雜,不是單純用算法能夠解決的問題。”張超感慨。
張超也是從這時(shí)開始越來(lái)越重視醫(yī)療團(tuán)隊(duì)。從前醫(yī)療團(tuán)隊(duì)只是做數(shù)據(jù)標(biāo)注和醫(yī)療建模,現(xiàn)在他們成了所有產(chǎn)品的“裁判員”,產(chǎn)品合不合格,首先得通過他們這關(guān),看看是否滿意,有沒有不符合他們常識(shí)和認(rèn)知的部分,只有得到醫(yī)學(xué)團(tuán)隊(duì)的認(rèn)可,產(chǎn)品才會(huì)上 線。
不過,除了挫折,現(xiàn)實(shí)的場(chǎng)景有時(shí)也會(huì)帶來(lái)意外之喜,比如兒科和婦科,康夫子就做了單獨(dú)的優(yōu)化,因?yàn)檫@些患者在就診時(shí)會(huì)填寫得非常詳細(xì)。“尤其是家長(zhǎng),一般都受過比較好的教育,所以填寫的數(shù)據(jù)質(zhì)量非常高?!睆埑f。
經(jīng)過了兩年的時(shí)間,康夫子的引擎在這樣的試錯(cuò)和調(diào)整中一點(diǎn)點(diǎn)成熟。到現(xiàn)在,如果加上檢驗(yàn)報(bào)告的數(shù)據(jù),康夫子輔助診斷引擎算出的結(jié)果和醫(yī)生診斷的重合度基本能達(dá)到90%。
這個(gè)結(jié)果意味著AI輔助診療領(lǐng)域巨大的想象空間?!叭斯ぶ悄茚t(yī)生不是很近的事,但也沒那么遙遠(yuǎn)。第一步是先要達(dá)到一定水平,要人機(jī)能PK,第二才是在監(jiān)管下作出診斷。未來(lái)可能做到人工智能家庭醫(yī)生的級(jí)別?!被鹕绞Y本副總裁劉凱告訴《第一財(cái)經(jīng)周 刊》。
一直以來(lái),國(guó)內(nèi)的醫(yī)生都是短缺資源。衛(wèi)生計(jì)劃委的報(bào)告表明,2017年1月至11月,中國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)總診療人次達(dá)73億,比2016年多了2.1億人次。但是,去年新增的醫(yī)生不過20萬(wàn)左右。
所以,康夫子這樣的人工智能醫(yī)療產(chǎn)品獲得資本青睞的主要原因是它們實(shí)際上增加了醫(yī)療生產(chǎn)力,而不是簡(jiǎn)單地做了生產(chǎn)力的分配。AI醫(yī)生的未來(lái)目標(biāo),就是能夠復(fù)制醫(yī)生的能力,甚至代替他們做一些重復(fù)性的工作,這樣能最大限度解放醫(yī)生的生產(chǎn)力?!耙婧虯I算法的規(guī)模效益會(huì)很高,邊際成本很低,如果能夠替代醫(yī)生30%的工作量,會(huì)有巨大的潛力。”學(xué)醫(yī)出身的劉凱對(duì)此還是充滿信心。