摘要:生成式人工智能的發(fā)展為醫(yī)療行業(yè)帶來顛覆性的變革。本文論述了生成式人工智能在新藥研發(fā)、診療服務(wù)和醫(yī)學(xué)教育等領(lǐng)域的研究進(jìn)展和應(yīng)用現(xiàn)狀,概述了生成式人工智能在醫(yī)療領(lǐng)域面臨的問題和挑戰(zhàn),包括數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全、算法可解釋性和評(píng)測(cè)標(biāo)準(zhǔn)等,并探討了生成式人工智能在醫(yī)療領(lǐng)域的未來發(fā)展方向。
關(guān)鍵詞:生成式人工智能;大模型;醫(yī)療領(lǐng)域
DOI:10.12433/zgkjtz.20243008
一、生成式人工智能在醫(yī)療領(lǐng)域的典型應(yīng)用場(chǎng)景
(一)新藥研發(fā)
在全球范圍內(nèi),新藥研發(fā)一直面臨著平均研發(fā)投入高達(dá)10億美元、研發(fā)周期長(zhǎng)達(dá)10年的“雙十困境”。近年來,隨著人工智能、大數(shù)據(jù)等數(shù)字技術(shù)的不斷迭代,推動(dòng)了生物學(xué)、化學(xué)和臨床醫(yī)學(xué)等學(xué)科的交叉融合發(fā)展,新藥研發(fā)領(lǐng)域隨之發(fā)生全方位的變革。相比傳統(tǒng)AI,生成式AI能夠從海量的知識(shí)庫中快速提煉出關(guān)鍵信息,并預(yù)測(cè)和推斷出哪些潛在的藥物靶點(diǎn)有價(jià)值、可能成功的合成路徑是什么,能夠加速靶點(diǎn)的確立、開發(fā)測(cè)試化合物的驗(yàn)證分析方法,篩選先導(dǎo)化合物,協(xié)助臨床前試驗(yàn)以確定有效性,這為新藥研發(fā)范式帶來顛覆性的變化。
國(guó)際領(lǐng)先的生物科技公司英矽智能2024年3月在Nature Biotechnology發(fā)文,詳細(xì)介紹了其首款由生成式人工智能發(fā)現(xiàn)和設(shè)計(jì)的潛在全球首創(chuàng)TNIK抑制劑,從靶點(diǎn)識(shí)別到2期臨床試驗(yàn)的四年研發(fā)歷程,并對(duì)INS018_055藥物抗特發(fā)性肺纖維化的作用靶點(diǎn)、臨床前結(jié)果和已有臨床試驗(yàn)數(shù)據(jù)進(jìn)行了詳細(xì)披露[1]。Jumper J等2021年設(shè)計(jì)了基于神經(jīng)網(wǎng)絡(luò)的AlphaFold模型,使耗時(shí)、困難且復(fù)雜的預(yù)測(cè)蛋白質(zhì)結(jié)果任務(wù)縮減到分鐘級(jí)別,極大加速了癌癥、抗生素和靶向藥物的研發(fā)進(jìn)程[2]。根據(jù)麥肯錫的研究,小分子藥物研發(fā)中的一個(gè)難題是如何識(shí)別并且篩選出最有可能成功、值得進(jìn)一步測(cè)試優(yōu)化的化合物,生成式人工智能通過先進(jìn)的基礎(chǔ)化學(xué)模型加速篩選過程,可以提升化合物活性模型性能2.5倍;識(shí)別新化合物系列的速度提高4倍以上。谷歌DeepMind和Isomorphic Labs聯(lián)合發(fā)布的預(yù)測(cè)蛋白質(zhì)等結(jié)構(gòu)的大模型AlphaFold 3,可通過準(zhǔn)確預(yù)測(cè)蛋白質(zhì)、DNA、RNA等結(jié)構(gòu)以及它們之間的相互作用,增強(qiáng)對(duì)蛋白質(zhì)的預(yù)測(cè)準(zhǔn)確率和架構(gòu)解讀,進(jìn)而幫助理解疾病的分子基礎(chǔ),發(fā)現(xiàn)疾病的成因和潛在的治療目標(biāo)[3]。2021年華為推出的盤古藥物分子大模型,主要面向藥物研發(fā)領(lǐng)域,提供結(jié)合預(yù)測(cè)、屬性預(yù)測(cè)、分子優(yōu)化與生成能力,幫助國(guó)內(nèi)超級(jí)抗菌藥Drug X先導(dǎo)藥的研發(fā)周期獲得了數(shù)十倍的加速,從數(shù)年縮短到數(shù)月,研發(fā)成本降低了70%。
在臨床試驗(yàn)階段,生成式人工智能可以通過挖掘和分析大量的臨床試驗(yàn)資料,優(yōu)化臨床試驗(yàn)設(shè)計(jì),提高試驗(yàn)的效率和成功率。例如,在患者招募方面能發(fā)揮以下作用:一是強(qiáng)大的數(shù)據(jù)處理能力,能夠處理海量的醫(yī)療數(shù)據(jù),包括患者的基本信息、病史、檢查結(jié)果等,并根據(jù)招募需求提取關(guān)鍵特征,從而更全面地評(píng)估患者的適合性。二是基于深度學(xué)習(xí)和自然語言處理技術(shù)的智能化篩選,能夠自動(dòng)篩選符合招募標(biāo)準(zhǔn)的患者,提高篩選效率和準(zhǔn)確性。三是支持個(gè)性化推薦,通過分析患者的個(gè)體特征和招募標(biāo)準(zhǔn),能夠給患者推薦最匹配的臨床實(shí)驗(yàn)項(xiàng)目,提高患者的參與意愿和依從性。四是試驗(yàn)策略的管理優(yōu)化,通過建立患者管理系統(tǒng),跟蹤患者的招募進(jìn)度、參與情況和反饋機(jī)制,提供個(gè)性化患者服務(wù)建議,并動(dòng)態(tài)優(yōu)化招募策略。例如,國(guó)內(nèi)領(lǐng)先的第三方患者招募平臺(tái)翼帆醫(yī)藥參與的某藥企全球三期臨床研究項(xiàng)目,通過大模型數(shù)據(jù)結(jié)構(gòu)化和智能算法匹配,在自建的意向患者庫中精準(zhǔn)找到潛在合適的患者,最終完成89例患者知情、64例患者入組、入組目標(biāo)達(dá)成率128%,有效提升了轉(zhuǎn)化精準(zhǔn)度。
(二)診療服務(wù)
在醫(yī)療問答和患者咨詢的場(chǎng)景中,生成式人工智能在理解患者需求方面表現(xiàn)優(yōu)異。醫(yī)學(xué)大語言模型ChatDoctor利用醫(yī)患對(duì)話等數(shù)據(jù)集對(duì)LLaMA大模型進(jìn)行微調(diào)后,大模型的精度、召回率和F1值均超過了ChatGPT[4]。Google研發(fā)的Med-PaLM2專家級(jí)醫(yī)療問答大語言模型,通過整合近期大模型領(lǐng)域的先進(jìn)技術(shù),如小樣本(Few-shot)、思路鏈(Chain-of-thought,CoT)技術(shù)、自一致性(Self-consistency,SC)機(jī)制和集成優(yōu)化(Ensemble Refinement,ER)方法等,在PubMedQA、MedQA等多個(gè)測(cè)評(píng)數(shù)據(jù)集上取得了最優(yōu)表現(xiàn),特別是在多項(xiàng)選擇和長(zhǎng)形式醫(yī)療問答任務(wù)場(chǎng)景中表現(xiàn)出色。
從輔助診斷的醫(yī)療實(shí)踐看,生成式人工智能能夠通過分析大量臨床診療數(shù)據(jù),深度學(xué)習(xí)醫(yī)療領(lǐng)域知識(shí),在自動(dòng)分析醫(yī)療影像、精準(zhǔn)診斷決策和治療方案選擇等方面,為醫(yī)生提供更準(zhǔn)確和可靠的依據(jù),不僅能提高診斷的準(zhǔn)確率,還能幫助醫(yī)生大幅提高效能,也有助于改善醫(yī)療資源不平衡的問題。以骨科類疾病為例,其涵蓋了系列復(fù)雜的病理狀態(tài),如骨折、關(guān)節(jié)病變、脊柱異常和運(yùn)動(dòng)損傷等,導(dǎo)致骨科疾病的診療決策復(fù)雜性較高。生成式人工智能能夠迅速分析患者的臨床癥狀、醫(yī)療史以及影像學(xué)檢查結(jié)果等非結(jié)構(gòu)化的信息,從而識(shí)別出骨折、畸形和其他骨骼疾病,為醫(yī)生在復(fù)雜臨床情況下提供高效、實(shí)時(shí)的決策輔助。從當(dāng)前應(yīng)用實(shí)踐看,生成式人工智能在骨科影像輔助識(shí)別和診斷方面作用顯著,能夠自動(dòng)識(shí)別和分析X光、CT、MRI等醫(yī)學(xué)影像,快速檢測(cè)和標(biāo)記異常區(qū)域,并且能夠整合不同來源和類型的多模態(tài)圖像,如將CT和MRI圖像融合,提供更全面的骨骼和軟組織信息,增強(qiáng)診斷的準(zhǔn)確性。
Mika等學(xué)者在2023年測(cè)試了ChatGPT在全髖關(guān)節(jié)置換術(shù)方面的應(yīng)答情況,在10個(gè)患者常見問題中只有1個(gè)被評(píng)為“不滿意”,2個(gè)無須更正,大多數(shù)需要最小或適度澄清,表明生成式人工智能可成為輔助患者教育和患者溝通的重要臨床工具[5]。目前已有研究探討生成式人工智能大模型在神經(jīng)障礙性疾病、眼科、肺癌等特定疾病輔助診斷上的使用案例[6]。在垂直領(lǐng)域的大模型實(shí)踐中,已有自動(dòng)識(shí)別和分析肺部CT影像的醫(yī)學(xué)影像診斷平臺(tái)、基于基因組學(xué)數(shù)據(jù)為患者提供個(gè)性化腫瘤診療方案的診療大模型等。
在診后護(hù)理或其他日常健康管理場(chǎng)景中,生成式人工智能的作用已得到驗(yàn)證:一是遠(yuǎn)程監(jiān)測(cè)患者健康,特別是慢性病患者,通過定期分析生理參數(shù)、設(shè)備數(shù)據(jù)和健康記錄,能夠幫助醫(yī)生有效遠(yuǎn)程管理疾病。例如,通過大模型技術(shù)對(duì)糖尿病患者的血糖、血壓等健康數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,并提供個(gè)性化的管理建議和干預(yù)措施。二是分析健康記錄、生活方式和基因信息,識(shí)別風(fēng)險(xiǎn)因素和早期疾病跡象,實(shí)現(xiàn)個(gè)體化健康管理和疾病預(yù)防,例如,一位50歲女性,近期頻繁出現(xiàn)胸悶、心悸、呼吸短促以及肩膀酸痛的癥狀,尤其是在輕微運(yùn)動(dòng)后癥狀更為明顯,她如果向靈醫(yī)大模型咨詢,大模型會(huì)高度提示用戶可能存在心臟方面的問題,能夠幫助用戶更早識(shí)別潛在的心臟問題,并采取有效的措施進(jìn)行干預(yù)和治療。三是提供遠(yuǎn)程醫(yī)療建議和護(hù)理指導(dǎo),增強(qiáng)遠(yuǎn)程護(hù)理體驗(yàn)。以“腦卒中”為例,借助訊飛醫(yī)療診后康復(fù)管理平臺(tái),能夠自動(dòng)生成個(gè)性化的患者康復(fù)計(jì)劃,包括用藥指導(dǎo)、康復(fù)運(yùn)動(dòng)、飲食建議、出院隨訪計(jì)劃等,并能夠根據(jù)患者的實(shí)時(shí)數(shù)據(jù),自動(dòng)或人工動(dòng)態(tài)調(diào)整康復(fù)計(jì)劃,確?;颊吣軌虬凑兆顑?yōu)路徑進(jìn)行康復(fù)。
(三)醫(yī)學(xué)教育
隨著現(xiàn)代醫(yī)學(xué)體系日益復(fù)雜,醫(yī)學(xué)知識(shí)和文獻(xiàn)呈現(xiàn)指數(shù)級(jí)增長(zhǎng),專業(yè)細(xì)分程度越來越高,導(dǎo)致不同醫(yī)學(xué)學(xué)科的認(rèn)知壁壘也越來越大,醫(yī)學(xué)從業(yè)人員已經(jīng)難以通過閱讀和學(xué)習(xí)建立較強(qiáng)的認(rèn)知能力。生成式人工智能通過人機(jī)交互的協(xié)作方式,有助于提升醫(yī)學(xué)教育水平,補(bǔ)充醫(yī)學(xué)從業(yè)人員的認(rèn)知能力,提高醫(yī)學(xué)教育的可及性和均等性。
一是問答式的交互方式能夠加速醫(yī)學(xué)從業(yè)人員對(duì)知識(shí)的獲取,通過智能學(xué)習(xí)輔助系統(tǒng),可以為基于能力的自主學(xué)習(xí)提供支持,并深化學(xué)者對(duì)復(fù)雜醫(yī)學(xué)知識(shí)的理解。二是能夠提供個(gè)性化的學(xué)習(xí)體驗(yàn),通過調(diào)整教學(xué)內(nèi)容和難度,適應(yīng)不同水平從業(yè)人員的需求。三是通過生成式人工智能構(gòu)建復(fù)雜的臨床案例,能夠?yàn)閺臉I(yè)人員提供探索不同診斷路徑和治療方案的模擬環(huán)境,提升處理復(fù)雜臨床情景的推理能力,特別是模擬手術(shù)訓(xùn)練等外科培訓(xùn)的應(yīng)用前景被廣泛關(guān)注。同時(shí),基于大模型的醫(yī)學(xué)智能教育能夠使欠發(fā)達(dá)地區(qū)的醫(yī)生能夠及時(shí)獲取前沿、權(quán)威的醫(yī)學(xué)知識(shí),有助于縮小不同地區(qū)醫(yī)療水平差距,緩解醫(yī)學(xué)發(fā)展不平衡問題[7]。
此外,也有學(xué)者提出需高度重視生成式人工智能對(duì)醫(yī)學(xué)教育和管理范式的沖擊,預(yù)計(jì)將對(duì)現(xiàn)有“師—生”教學(xué)模式產(chǎn)生巨大的影響,將“師—機(jī)—生”的三元結(jié)構(gòu)帶入人們的視野[8]。認(rèn)為大模型智能技術(shù)的應(yīng)用,對(duì)未來的醫(yī)學(xué)教育和醫(yī)療管理將帶來巨大沖擊,數(shù)字醫(yī)生理念變得現(xiàn)實(shí)且迫切,不可避免地像培養(yǎng)人類醫(yī)生一樣“培養(yǎng)”數(shù)字人醫(yī)生,像管理人類醫(yī)生一樣“管理”數(shù)字人醫(yī)生,將進(jìn)一步加快推動(dòng)醫(yī)生與醫(yī)院的虛實(shí)互動(dòng)平行化進(jìn)程[9]。
二、生成式人工智能在醫(yī)療領(lǐng)域面臨的主要挑戰(zhàn)
(一)數(shù)據(jù)隱私保護(hù)和醫(yī)療大數(shù)據(jù)質(zhì)量問題
醫(yī)療數(shù)據(jù)的特點(diǎn)是具有較高的復(fù)雜性、稀缺性和隱私性。一方面,醫(yī)療數(shù)據(jù)通常包含公眾的個(gè)人敏感信息,需要確保生成式大語言模型在訓(xùn)練和應(yīng)用時(shí),公眾的數(shù)據(jù)隱私和數(shù)據(jù)安全得到充分保護(hù),包括采用數(shù)據(jù)訪問控制、審計(jì)跟蹤、數(shù)據(jù)脫敏等合規(guī)性措施,以防止數(shù)據(jù)泄露和濫用;另一方面,醫(yī)療領(lǐng)域需要多個(gè)組織之間共享數(shù)據(jù)以進(jìn)行合作研究,但我國(guó)醫(yī)療行業(yè)的“數(shù)據(jù)孤島”現(xiàn)象突出,且醫(yī)學(xué)數(shù)據(jù)模態(tài)多元,不同模態(tài)間差異顯著。目前醫(yī)療數(shù)據(jù)仍以相對(duì)碎片化的方式存儲(chǔ)保存于各醫(yī)療機(jī)構(gòu),且由于信息系統(tǒng)技術(shù)規(guī)范、基礎(chǔ)信息數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一和缺失,醫(yī)療數(shù)據(jù)普遍不能互通互認(rèn),導(dǎo)致醫(yī)療數(shù)據(jù)質(zhì)量低,數(shù)據(jù)要素價(jià)值尚未充分顯現(xiàn)。北京市在《北京市加快醫(yī)藥健康協(xié)同創(chuàng)新行動(dòng)計(jì)劃(2024—2026年)》中提出,要實(shí)施醫(yī)療大數(shù)據(jù)共享與應(yīng)用,建設(shè)全市共享的門急診、住院、體檢、科研等電子病歷體系,推動(dòng)標(biāo)準(zhǔn)化、信息化臨床研究數(shù)據(jù)共享,明確數(shù)據(jù)脫敏標(biāo)準(zhǔn),打通醫(yī)院之間數(shù)據(jù)鏈接,以上措施有望打破醫(yī)療“數(shù)據(jù)孤島”現(xiàn)象。如何確保共享數(shù)據(jù)的隱私和安全性的前提下,推動(dòng)大量且高度驗(yàn)證的醫(yī)學(xué)知識(shí)和醫(yī)療數(shù)據(jù)資源更好結(jié)合,從而支撐生成式人工智能醫(yī)療產(chǎn)品的研發(fā)和應(yīng)用,將是行業(yè)面臨的長(zhǎng)期課題。
(二)算法可解釋性和可靠性
當(dāng)前生成式大模型是生成式人工智能領(lǐng)域的主流技術(shù),基于深度學(xué)習(xí)的大模型,由于高維特征的復(fù)雜性、缺少直觀的輸入輸出映射、訓(xùn)練過程中的隨機(jī)性設(shè)計(jì)等原因,可解釋性差的問題至今仍難以解決。生成式大模型本質(zhì)上是概率模型,幻覺問題是大模型落地垂直應(yīng)用不可避免的問題。同時(shí),醫(yī)療關(guān)系到社會(huì)公眾的生命健康安全,任何在醫(yī)療領(lǐng)域的技術(shù)應(yīng)用都需要保證高度的準(zhǔn)確性和可靠性,大模型作為一個(gè)“黑箱”系統(tǒng),在疾病診斷等復(fù)雜決策領(lǐng)域的應(yīng)用仍存在一定局限性。
(三)缺少一致性的評(píng)測(cè)體系
大模型需要經(jīng)過客觀評(píng)測(cè)才能大規(guī)模應(yīng)用于醫(yī)學(xué)場(chǎng)景,雖然已有在公開數(shù)據(jù)集上的模型評(píng)估、基于ChatGpt4.0的自動(dòng)評(píng)估,以及有專業(yè)醫(yī)生的人工評(píng)估,但這些評(píng)估均存在規(guī)模小、不全面、封閉和難以復(fù)制等問題[10]。MedBench醫(yī)療大模型測(cè)評(píng)平臺(tái)由上海人工智能實(shí)驗(yàn)室與上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機(jī)構(gòu)推出,已為387個(gè)醫(yī)療大模型提供評(píng)測(cè),在開放性問答評(píng)估中引入了醫(yī)學(xué)專家人工標(biāo)注的“給分點(diǎn)”。但目前醫(yī)療大模型評(píng)測(cè)多側(cè)重其掌握知識(shí)的程度,對(duì)模型能力的評(píng)測(cè)不足。醫(yī)療大模型要在實(shí)際應(yīng)用中發(fā)揮價(jià)值,必須能夠勝任真實(shí)醫(yī)療場(chǎng)景的復(fù)雜任務(wù),如讀取病理片、分析檢查報(bào)告、書寫病歷等,其評(píng)測(cè)要兼顧知識(shí)和能力兩方面。但由于目前缺乏統(tǒng)一的評(píng)測(cè)數(shù)據(jù)集、標(biāo)準(zhǔn)指標(biāo)和方法體系,不同模型的性能難以進(jìn)行客觀全面的比較,不同測(cè)評(píng)結(jié)果難以互相驗(yàn)證,間接降低了醫(yī)療大模型的可信度。
三、未來展望
醫(yī)療是生成式人工智能落地應(yīng)用的重點(diǎn)領(lǐng)域之一,醫(yī)療行業(yè)大模型已在醫(yī)學(xué)影像分析、臨床診斷、藥物研發(fā)等方面發(fā)揮了重要作用,為醫(yī)療領(lǐng)域帶來深刻變革。從當(dāng)前實(shí)踐看,盡管以大模型為代表的生成式人工智能技術(shù)在醫(yī)療領(lǐng)域的大規(guī)模落地仍存在一定挑戰(zhàn),但以生成式人工智能驅(qū)動(dòng)行業(yè)發(fā)展的技術(shù)路線勢(shì)在必行。下一階段,醫(yī)療大模型需立足深度機(jī)器學(xué)習(xí)等底層技術(shù)的創(chuàng)新實(shí)踐,進(jìn)一步融合多模態(tài)數(shù)據(jù),提升大模型對(duì)醫(yī)學(xué)復(fù)雜數(shù)據(jù)的理解水平、提高各類場(chǎng)景下的推理能力、安全性和可靠性,同時(shí)逐步建立面向不同場(chǎng)景醫(yī)療大模型的評(píng)測(cè)標(biāo)準(zhǔn)和監(jiān)管體系,以“人工智能+”推動(dòng)醫(yī)療健康行業(yè)邁向全新的發(fā)展階段。
參考文獻(xiàn):
[1]Ren F, Aliper A, Chen J, et al. A small-molecule TNIK Inhibitor Targets Fibrosis in Preclinical and Clinical Models[J].Nature Biotechnology,2024:1-13.
[2]Jumper J, Evans R, Pritzel A, et al. Highly Accurate Protein Structure Prediction with AlphaFold[J].Nature,2021,596(7873):583-589.
[3]ABRAMSON J,ADLER J,DUNGER J, et al. Accurate Structure Prediction of Biomolecular Interactions with AlphaFold 3[J].Nature,2024:1-3.
[4]LIY, LIZ, ZHANGK,et al. Chatdoctor: a Medical Chat Model Fine-tuned on a Large Language Model Meta-AI (llama) Using Medical Domain Knowledge[J]. Cureus,2023,15(6).
[5]Aleksander P. Mika,J. Ryan Martin,Stephen M.et al. Assessing ChatGPT Responses to Common Patient Questions Regarding Total Hip Arthroplasty[J]. Bone Joint Surg Am,105(19):1519-1526.
[6]劉泓澤,王耀國(guó),唐圣晟,等.醫(yī)學(xué)大語言模型的應(yīng)用現(xiàn)狀與發(fā)展趨勢(shì)研究[J].中國(guó)數(shù)字醫(yī)學(xué),2024,19(8):1-7+13.
[7]Khan, R. A., Jawaid, M., amp; Khan, A. R. et al. (2023). ChatGPT-Reshaping Medical Education and Clinical Management[J]. Pakistan Journal of Medical Sciences,39(2):605-607.
[8]楊宗凱,王俊,吳砥,等.ChatGPT/生成式人工智能對(duì)教育的影響探析及應(yīng)對(duì)策略[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2023,41(7):26-35.
[9]王飛躍.平行醫(yī)生與平行醫(yī)院:ChatGPT與通用人工智能技術(shù)對(duì)未來醫(yī)療的沖擊與展望[J].協(xié)和醫(yī)學(xué)雜志,2023,14(4):673-679.
[10]顏見智,何雨鑫,駱子燁,等.生成式大語言模型在醫(yī)療領(lǐng)域的潛在典型應(yīng)用與面臨的挑戰(zhàn)[J].醫(yī)學(xué)信息學(xué)雜志,2023,44(9):23-31.
(作者單位:1.北京水滴科技集團(tuán)有限公司,
2.北京翼帆風(fēng)順醫(yī)藥科技有限公司)