高遠(yuǎn),張仕娜,盛博洋,董云春,龐瑞涵,晏峻峰,彭清華
〔摘要〕 ChatGPT作為現(xiàn)象級(jí)產(chǎn)品受到廣泛關(guān)注,本文從數(shù)據(jù)的數(shù)量、質(zhì)量、驅(qū)動(dòng)和保護(hù)4個(gè)方面,通過闡述ChatGPT的數(shù)據(jù)特點(diǎn),引發(fā)中醫(yī)智能診斷研究中數(shù)據(jù)問題的思考。中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式和中醫(yī)診斷的數(shù)據(jù)元標(biāo)準(zhǔn),以解決中醫(yī)智能診斷研究中數(shù)據(jù)的數(shù)量和質(zhì)量問題。多學(xué)科團(tuán)隊(duì)需要基于中醫(yī)診斷知識(shí)進(jìn)行推理,并且需要大數(shù)據(jù)對(duì)中醫(yī)診斷知識(shí)推理規(guī)則調(diào)整參數(shù)、優(yōu)化算法,共同構(gòu)建融合知識(shí)與數(shù)據(jù)驅(qū)動(dòng)方法,實(shí)現(xiàn)認(rèn)知智能的中醫(yī)智能診斷系統(tǒng),以增強(qiáng)計(jì)算機(jī)推理結(jié)果的邏輯性和可解釋性。中醫(yī)學(xué)者在數(shù)據(jù)共享的同時(shí),也要保護(hù)中醫(yī)診斷數(shù)據(jù)的版權(quán)與安全。這些數(shù)據(jù)關(guān)系人民與國(guó)家的數(shù)據(jù)安全,關(guān)系我國(guó)全民健康情況和我國(guó)衛(wèi)生事業(yè)的發(fā)展趨勢(shì)。
〔關(guān)鍵詞〕 ChatGPT;中醫(yī);人工智能;辨證;數(shù)據(jù);版權(quán);安全
〔中圖分類號(hào)〕R2? ? ? ?〔文獻(xiàn)標(biāo)志碼〕A? ? ? ? 〔文章編號(hào)〕doi:10.3969/j.issn.1674-070X.2023.07.027
Thoughts on data issues in intelligent diagnosis research of
TCM prompted by ChatGPT
GAO Yuan1,2, ZHANG Shina1,2, SHENG Boyang1,2, DONG Yunchun1,3, PANG Ruihan1,3,
YAN Junfeng1,2,3*, PENG Qinghua1,2*
1. Hunan University of Chinese Medicine, Changsha, Hunan 410208, China; 2. Institute of TCM Diagnostics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China; 3. School of Informatics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China
〔Abstract〕 As a phenomenal product, ChatGPT has received widespread attention. This paper expounds the data features of ChatGPT from aspects of data quantity, quality, driving, and protection, prompting thoughts on data issues in intelligent diagnosis research of TCM. In order to solve the problems related with data quantity and quality in intelligent diagnosis research of TCM, it is necessary to establish data sharing model and data element standard for it. Furthermore, knowledge reasoning need to be conducted based on TCM diagnostic knowledge by multidisciplinary teams; big data is needed to adjust parameters and optimize algorithms for TCM diagnostic knowledge reasoning rules; TCM intelligent diagnostic systems should be jointly built to integrate knowledge and data-driven methods. The above measures help achieve cognitive intelligence and enhance the logic and interpretability of computer reasoning results. In addition, TCM academics should protect the copyright and security of TCM diagnostic data while sharing. These data determine the data security, and concern the health situation of Chinese people and the development of health service.
〔Keywords〕 ChatGPT; TCM; artificial intelligence; pattern differentiation; data; copyright; security
2022年底,美國(guó)OpenAI公司發(fā)布聊天機(jī)器人程序ChatGPT(Chat Generative Pre-trained Transformer)受到廣泛關(guān)注。Nature發(fā)表的論文中提到:ChatGPT作為對(duì)話式人工智能(artificial intelligence, AI)對(duì)科學(xué)來說是游戲規(guī)則改變者[1]。ChatGPT在對(duì)話中會(huì)保存使用者先前的對(duì)話信息,可根據(jù)之前的信息對(duì)當(dāng)前問題做出即時(shí)的個(gè)性化回答。ChatGPT這種會(huì)話方式使得人機(jī)交互變得更簡(jiǎn)單,極簡(jiǎn)的交互方式體現(xiàn)了極高的智能水平,將會(huì)取代傳統(tǒng)關(guān)鍵詞搜索式人機(jī)交互,成為互聯(lián)網(wǎng)應(yīng)用領(lǐng)域的新高地,尤其是在醫(yī)療領(lǐng)域的應(yīng)用,前景廣闊。
AI技術(shù)已經(jīng)成為重要的醫(yī)療輔助工具[2]。計(jì)算機(jī)模仿人類思維的智能學(xué),可以應(yīng)用于中醫(yī)診斷領(lǐng)域,彌補(bǔ)中醫(yī)診斷在客觀化、標(biāo)準(zhǔn)化方面的劣勢(shì)。中醫(yī)診斷是基于四診信息對(duì)人體的健康狀態(tài)和病變本質(zhì)進(jìn)行辨識(shí),做出概括性判斷[3]。中醫(yī)智能診斷是近年來智慧醫(yī)療領(lǐng)域的熱點(diǎn)之一,ChatGPT依靠數(shù)據(jù)、算法和算力的成功,成為數(shù)據(jù)驅(qū)動(dòng)模式的現(xiàn)象級(jí)產(chǎn)品。程京院士曾指出:“無數(shù)據(jù)則無人工智能,數(shù)據(jù)是促進(jìn)人工智能賦能中醫(yī)藥的重中之重?!盵4]《“十四五”中醫(yī)藥信息化發(fā)展規(guī)劃》基本原則指出:發(fā)揮數(shù)據(jù)作為新生產(chǎn)要素的關(guān)鍵作用,推進(jìn)中醫(yī)藥數(shù)據(jù)的共享與安全[5]。因此,基于數(shù)據(jù)在中醫(yī)智能診斷研究的基礎(chǔ)性地位和推動(dòng)性作用,本文通過闡述ChatGPT的數(shù)據(jù)特點(diǎn),引發(fā)中醫(yī)智能診斷研究中數(shù)據(jù)問題的思考。
1 數(shù)據(jù)數(shù)量問題
1.1? ChatGPT擁有海量數(shù)據(jù)
ChatGPT看似突如其來,實(shí)則是依賴OpenAI公司長(zhǎng)期的積累。ChatGPT通過學(xué)習(xí)大量的訓(xùn)練數(shù)據(jù)(包括現(xiàn)成文本和對(duì)話集合)模擬人的語(yǔ)言,根據(jù)上下文語(yǔ)境,使用AI模型生成人類可以理解的自然語(yǔ)言[6],進(jìn)而在人機(jī)交互過程中提供會(huì)話式服務(wù),如同人類流暢回答各種問題。ChatGPT基于8000億個(gè)單詞的語(yǔ)料庫(kù)作為訓(xùn)練數(shù)據(jù),通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)、提取1750億個(gè)參數(shù)。隨著訓(xùn)練數(shù)據(jù)的增加、模型參數(shù)的優(yōu)化,ChatGPT處理復(fù)雜自然語(yǔ)言的準(zhǔn)確性將不斷提高[7]。2022年11月30日,ChatGPT開放公眾測(cè)試,在海量跨語(yǔ)種的數(shù)據(jù)支持下,ChatGPT的訓(xùn)練參數(shù)將進(jìn)一步調(diào)整優(yōu)化,下一代ChatGPT會(huì)有更優(yōu)秀的表現(xiàn)。
1.2? 中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式
中醫(yī)智能診斷研究經(jīng)歷了從中醫(yī)專家系統(tǒng)到傳統(tǒng)機(jī)器學(xué)習(xí)再到現(xiàn)今大數(shù)據(jù)與深度學(xué)習(xí)探索的發(fā)展過程[8]。智能診斷研究需要全面、規(guī)范、準(zhǔn)確地收集大量的人體四診及其辨識(shí)結(jié)果的數(shù)據(jù),數(shù)據(jù)包含文本、影像、音頻、脈搏波等類型。中醫(yī)學(xué)者往往以某位專家的臨床案例或者某醫(yī)院科室的病例作為研究基礎(chǔ),建立智能診斷系統(tǒng)。然而,每項(xiàng)研究的樣本數(shù)據(jù)不同,中醫(yī)學(xué)者也受到傳統(tǒng)師承思想的束縛,許多研究的原始數(shù)據(jù)未公開,以致后續(xù)的中醫(yī)學(xué)者難以重復(fù)驗(yàn)證,難以基于前人的研究基礎(chǔ)展開新的研究,更難以實(shí)現(xiàn)多中心、大樣本的研究。缺乏多中心、大樣本數(shù)據(jù)是智能診斷研究所面臨的一大阻礙。
智能診斷研究應(yīng)跳出傳統(tǒng)中醫(yī)的經(jīng)驗(yàn)性、模糊性的論述框架,利用AI技術(shù),基于中醫(yī)思維對(duì)患者進(jìn)行個(gè)性化地病情判斷。要實(shí)現(xiàn)智能診斷的精準(zhǔn)化和高效化,需要大量的四診及其辨識(shí)結(jié)果的數(shù)據(jù)支持,這些數(shù)據(jù)的共享將促進(jìn)智能診斷研究的發(fā)展。目前,中醫(yī)界尚缺乏大樣本、公開的中醫(yī)診斷數(shù)據(jù)庫(kù)。因此,為實(shí)現(xiàn)優(yōu)質(zhì)中醫(yī)藥臨床病例資源的共享,中華中醫(yī)藥學(xué)會(huì)開發(fā)建設(shè)中國(guó)中醫(yī)藥臨床案例成果庫(kù)[9],截至2023年3月12日,共收錄935篇臨床案例,但還有待進(jìn)一步發(fā)展。因此,開放共享的數(shù)據(jù)支持是中醫(yī)智能診斷發(fā)展的重要前提,實(shí)現(xiàn)資源合理配置,也是推動(dòng)智慧醫(yī)療發(fā)展的必要條件之一。
2 數(shù)據(jù)質(zhì)量問題
2.1? ChatGPT擁有高質(zhì)量的數(shù)據(jù)標(biāo)注
高質(zhì)量的數(shù)據(jù)標(biāo)注是支持ChatGPT模型訓(xùn)練的關(guān)鍵[10]。ChatGPT通過“預(yù)訓(xùn)練語(yǔ)言模型”在大數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,專業(yè)的標(biāo)注人員會(huì)對(duì)ChatGPT生成的回答進(jìn)行標(biāo)注、評(píng)估和反饋,給出一個(gè)針對(duì)回答的分?jǐn)?shù)或者標(biāo)簽,這些標(biāo)注數(shù)據(jù)可以作為強(qiáng)化學(xué)習(xí)過程中的“獎(jiǎng)勵(lì)函數(shù)”,用來指導(dǎo)ChatGPT的參數(shù)調(diào)整,使得輸出的文本符合人的認(rèn)知[11]。數(shù)據(jù)標(biāo)注的質(zhì)量和準(zhǔn)確性是AI算法有效運(yùn)行的關(guān)鍵[10],沒有高質(zhì)量的數(shù)據(jù)標(biāo)注,就不會(huì)有如今ChatGPT的成功。
2.2? 中醫(yī)智能診斷研究需建立中醫(yī)診斷的數(shù)據(jù)元標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)注是開發(fā)AI模型預(yù)處理的一部分,中醫(yī)診斷數(shù)據(jù)不僅包含了癥狀、體征和微觀參數(shù)等信息,還包含辨病、辨證等辨識(shí)結(jié)果。數(shù)據(jù)標(biāo)注需要對(duì)這些數(shù)據(jù)添加標(biāo)簽為AI模型指定上下文,幫助做出準(zhǔn)確預(yù)測(cè)。許多企業(yè)和研究機(jī)構(gòu)推出了帶標(biāo)注的公開數(shù)據(jù)集[10],然而,中醫(yī)診斷數(shù)據(jù)載體豐富,具有較強(qiáng)的主觀性,難以實(shí)現(xiàn)匯交融合,存在同名異義、異名同義、定義內(nèi)涵外延描述不規(guī)范和定量描述較隨意等現(xiàn)象[11-13]。因此,中醫(yī)診斷數(shù)據(jù)的準(zhǔn)確、規(guī)范表達(dá),是智能診斷研究面臨的一大難題。數(shù)據(jù)元是數(shù)據(jù)的基本單元,建立中醫(yī)診斷的數(shù)據(jù)元標(biāo)準(zhǔn)是智能診斷研究中數(shù)據(jù)共享和交換的基礎(chǔ),以方便研究人員開展規(guī)范化的數(shù)據(jù)標(biāo)注工作。
3 數(shù)據(jù)驅(qū)動(dòng)問題
3.1? ChatGPT主要是以數(shù)據(jù)驅(qū)動(dòng)的AI模式
ChatGPT主要運(yùn)用以數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等模型開展人類思維的模擬工作。ChatGPT支持連續(xù)多輪對(duì)話,根據(jù)輸入語(yǔ)句,基于詞語(yǔ)序列的概率相關(guān)性分布進(jìn)行建模,預(yù)測(cè)下一個(gè)時(shí)刻不同語(yǔ)句甚至語(yǔ)言集合出現(xiàn)的概率分布,自動(dòng)生成答案。ChatGPT相較于以往自然語(yǔ)言處理模型,具有更強(qiáng)的生成能力。但在邏輯推理復(fù)雜的領(lǐng)域,ChatGPT缺乏邏輯推理能力,回答會(huì)出現(xiàn)缺乏人類常識(shí)的情況。因此,增強(qiáng)計(jì)算機(jī)推理結(jié)果的邏輯性和可解釋性是ChatGPT發(fā)展的方向,也對(duì)智能診斷研究具有重要啟示。
3.2? 中醫(yī)智能診斷研究需融合知識(shí)與數(shù)據(jù)驅(qū)動(dòng)的AI模式
中醫(yī)智能診斷若僅運(yùn)用數(shù)據(jù)驅(qū)動(dòng)的AI模式,需要巨大的算力與資金支持[11],并且缺乏邏輯推理,導(dǎo)致結(jié)果的可解釋性較低,決策者難以信任辨識(shí)結(jié)果的可靠性。中醫(yī)辨證的核心是辨證知識(shí)的表示與推理[14],然而,知識(shí)表示與推理的方法雖然可解釋性強(qiáng),但存在只能解決確定性問題的局限性,難以用于具有復(fù)雜性、非線性、模糊性的中醫(yī)診斷。因此,類比中醫(yī)師的成長(zhǎng)過程,需要先學(xué)習(xí)中醫(yī)經(jīng)典以及中醫(yī)教材,掌握中醫(yī)診斷知識(shí),基于中醫(yī)先驗(yàn)知識(shí)進(jìn)行中醫(yī)診斷推理訓(xùn)練,在臨床中面對(duì)一定數(shù)量的患者,鞏固強(qiáng)化中醫(yī)診斷思維。從AI角度,張鈸院士等[15]通過闡述AI的發(fā)展歷程,認(rèn)為知識(shí)驅(qū)動(dòng)方法的AI模式和數(shù)據(jù)驅(qū)動(dòng)方法的AI模式均具有局限性,未來AI的發(fā)展方向需要融合知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的AI模式。
作為大數(shù)據(jù)時(shí)代的知識(shí)工程集大成者,知識(shí)圖譜為互聯(lián)網(wǎng)時(shí)代的數(shù)據(jù)知識(shí)化組織和智能應(yīng)用提供有效的解決方案[16]。中醫(yī)學(xué)者也意識(shí)到為了能對(duì)智能診斷研究獲得良好的理論依據(jù),將知識(shí)圖譜應(yīng)用于中醫(yī)診斷領(lǐng)域。通過對(duì)中醫(yī)知識(shí)以及臨床信息構(gòu)建知識(shí)圖譜,從而進(jìn)行知識(shí)表示,運(yùn)用知識(shí)推理對(duì)知識(shí)圖譜中實(shí)體關(guān)系進(jìn)行推理,進(jìn)而建立基于中醫(yī)知識(shí)圖譜的診斷模型[17]。有研究基于中醫(yī)電子病歷,構(gòu)建融合知識(shí)圖譜的多通道中醫(yī)辨證模型[18]。還有研究基于中醫(yī)知識(shí)圖譜的端到端模型,構(gòu)建中醫(yī)證候診斷決策系統(tǒng)[19],為中醫(yī)師提供決策支持。然而,中醫(yī)診斷體系具有復(fù)雜性、經(jīng)驗(yàn)性和模糊性問題,并且中醫(yī)實(shí)體關(guān)系復(fù)雜,基于知識(shí)圖譜有限的推理還不能勝任中醫(yī)辨識(shí)的復(fù)雜過程。如何構(gòu)建中醫(yī)診斷知識(shí)推理模型,成為智能診斷研究的關(guān)鍵問題。融合知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的知識(shí)表示和推理的認(rèn)知圖譜,或許是實(shí)現(xiàn)人工智能從感知智能向認(rèn)知智能演進(jìn)的重要方法[20]。有研究實(shí)驗(yàn)證明,認(rèn)知圖譜問答模型優(yōu)于其他算法模型[21],智能診斷研究未來也能走認(rèn)知圖譜的技術(shù)路線[22]。但這需要中醫(yī)學(xué)、數(shù)學(xué)、人工智能、復(fù)雜系統(tǒng)等多學(xué)科專家“多層表述,逐級(jí)定量,多次迭代,逐步近似”[23],共同構(gòu)建融合知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)方法實(shí)現(xiàn)認(rèn)知智能的中醫(yī)智能診斷系統(tǒng)。
4 數(shù)據(jù)保護(hù)問題
4.1? ChatGPT涉及數(shù)據(jù)版權(quán)保護(hù)與安全保護(hù)問題
OpenAI公司主要通過網(wǎng)絡(luò)爬蟲技術(shù)獲得超過萬億單詞的公共語(yǔ)言數(shù)據(jù)集[11]。2022年11月30日,ChatGPT開放公眾測(cè)試,用戶在ChatGPT輸入的內(nèi)容以及用戶反饋,會(huì)為下一代ChatGPT提供迭代訓(xùn)練數(shù)據(jù)。換而言之,ChatGPT為用戶提供便利的同時(shí),也獲取了用戶的數(shù)據(jù)。并且OpenAI公司擁有的數(shù)據(jù)庫(kù)和服務(wù)器均在美國(guó),連同處于美國(guó)的亞馬遜公司都警告員工不要與ChatGPT分享機(jī)密信息,因?yàn)镃hatGPT的某些回復(fù)看起來與亞馬遜的內(nèi)部情況十分相似[24]?!度A爾街日?qǐng)?bào)》記者Francesco Marconi就公開指責(zé)OpenAI公司,未經(jīng)授權(quán)大量使用國(guó)外主流媒體的文章訓(xùn)練ChatGPT模型,并且從未支付任何費(fèi)用[25]。換言之,ChatGPT是通過爬取現(xiàn)成文本和對(duì)話集合進(jìn)行數(shù)據(jù)訓(xùn)練并創(chuàng)作,回答并未溯源原始引用出處或者標(biāo)注根據(jù)何處改編,并且可能會(huì)篡改作者原意,誤導(dǎo)用戶。OpenAI公司并不否認(rèn)ChatGPT的輸出結(jié)果會(huì)侵犯他人作品的版權(quán)[26]。因此,ChatGPT涉及數(shù)據(jù)版權(quán)保護(hù)與安全保護(hù)問題。
4.2? 中醫(yī)智能診斷研究的數(shù)據(jù)版權(quán)保護(hù)問題
版權(quán),亦稱“著作權(quán)”,指原創(chuàng)作者或組織對(duì)具有獨(dú)創(chuàng)性并能以一定形式表現(xiàn)的智力成果依法享有的權(quán)利,我國(guó)的著作權(quán)保護(hù)期為50年。若在著作權(quán)保護(hù)期內(nèi)未經(jīng)作者允許擅自使用,可能會(huì)損害原創(chuàng)作者的合法權(quán)益[27]。2018年4月國(guó)務(wù)院印發(fā)的《科學(xué)數(shù)據(jù)管理辦法》指出:數(shù)據(jù)使用者應(yīng)遵守知識(shí)產(chǎn)權(quán)規(guī)定,在工作中注明所使用和參考引用的數(shù)據(jù)[28]。多位專家針對(duì)ChatGPT帶來的版權(quán)問題展開討論,ChatGPT是在受版權(quán)保護(hù)的素材里訓(xùn)練的語(yǔ)言模型,可能涉及侵犯他人的版權(quán)[29],并且未溯源原始引用出處。但現(xiàn)階段,也很難對(duì)人工智能生成物進(jìn)行法律追究,未來是否對(duì)人工智能生成物采用版權(quán)保護(hù)還有待專家們的進(jìn)一步討論。
數(shù)據(jù)在共享過程中涉及大量版權(quán)問題,國(guó)內(nèi)外很多高校都致力于數(shù)據(jù)版權(quán)的管理工作[30]。中醫(yī)診斷數(shù)據(jù)包括了中醫(yī)專家經(jīng)驗(yàn)和臨床診療數(shù)據(jù),蘊(yùn)含著實(shí)踐經(jīng)驗(yàn)、診斷方法、治療方案和科研成果等方面的內(nèi)容,反映中醫(yī)藥的獨(dú)特優(yōu)勢(shì)和前沿成果。中醫(yī)診斷數(shù)據(jù)的收集、整理和應(yīng)用具有重要的意義和價(jià)值,可以推進(jìn)中醫(yī)藥文化傳播、提高人民健康水平。由于中醫(yī)診斷數(shù)據(jù)承載了中華文化以及作者的智慧和心血,是一種知識(shí)產(chǎn)權(quán),應(yīng)該受到法律的保護(hù)。數(shù)據(jù)共享和版權(quán)保護(hù)二者之間存在沖突,但并不意味著不可調(diào)和,存在對(duì)立統(tǒng)一關(guān)系。數(shù)據(jù)共享和版權(quán)保護(hù)具有共同目標(biāo)——促進(jìn)知識(shí)創(chuàng)新和科技發(fā)展,實(shí)現(xiàn)數(shù)據(jù)生產(chǎn)者與使用者互利共贏[31]。
4.3? 中醫(yī)智能診斷研究的數(shù)據(jù)安全保護(hù)問題
數(shù)據(jù)泄露是指未經(jīng)授權(quán)或許可,數(shù)據(jù)被泄露的行為。我國(guó)“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃明確指出,數(shù)據(jù)是國(guó)家基礎(chǔ)性戰(zhàn)略資源[31]。中醫(yī)藥在現(xiàn)代醫(yī)療領(lǐng)域中占據(jù)重要地位。大數(shù)據(jù)時(shí)代,患者的個(gè)人診療信息經(jīng)整合與分析后,具有極高的價(jià)值。對(duì)于個(gè)體而言,中醫(yī)診斷數(shù)據(jù)可用于判斷人體狀態(tài),包含生理病理特點(diǎn)、體質(zhì)、病和證等方面的內(nèi)容。隨著數(shù)據(jù)的不斷增長(zhǎng),中醫(yī)診斷數(shù)據(jù)不僅可以從全局掌握我國(guó)全民健康情況,還可以預(yù)測(cè)我國(guó)衛(wèi)生事業(yè)的發(fā)展趨勢(shì),甚至為非我國(guó)授權(quán)的研究提供數(shù)據(jù)支持。此外,ChatGPT的服務(wù)器在國(guó)外,在大數(shù)據(jù)環(huán)境下,如果中醫(yī)診斷數(shù)據(jù)被掌握在國(guó)外公司的手中,這些數(shù)據(jù)很難受到中國(guó)法律的保護(hù),極易被非法使用,造成損失。這將對(duì)中醫(yī)藥文化的傳承和發(fā)展帶來不利影響,也可能危及我國(guó)的數(shù)據(jù)安全和國(guó)家利益。因此,必須加強(qiáng)對(duì)中醫(yī)藥數(shù)據(jù)的保護(hù)和管理,確保其合法合規(guī)使用,促進(jìn)中醫(yī)藥事業(yè)的健康發(fā)展。
5 結(jié)語(yǔ)
ChatGPT作為新一代人工智能技術(shù),將對(duì)醫(yī)療領(lǐng)域帶來巨大影響。中醫(yī)師診斷過程中需要對(duì)望、聞、問、切四診信息進(jìn)行分析,融合中醫(yī)知識(shí)與臨床案例相結(jié)合的思維方式,進(jìn)行辨識(shí)。因此,中醫(yī)智能診斷研究也需要基于中醫(yī)診斷規(guī)則與數(shù)據(jù)迭代,對(duì)影像、音頻、文字、脈搏波等四診信息進(jìn)行多模態(tài)信息融合。OpenAI發(fā)布ChatGPT-4是大型多模態(tài)AI模型(接受圖像和文本輸入、文本輸出),ChatGPT的更新迭代速度十分迅速,已經(jīng)超乎想象。ChatGPT的數(shù)據(jù)特點(diǎn)是成功因素之一,中醫(yī)智能診斷研究可以從ChatGPT的成功獲得啟迪。因此,中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式和中醫(yī)診斷的數(shù)據(jù)元標(biāo)準(zhǔn),以解決中醫(yī)智能診斷研究的數(shù)據(jù)數(shù)量和質(zhì)量問題。多學(xué)科團(tuán)隊(duì)需要基于中醫(yī)診斷知識(shí)進(jìn)行知識(shí)推理,并且需要大數(shù)據(jù)支持對(duì)診斷知識(shí)的推理規(guī)則調(diào)整參數(shù)、優(yōu)化算法,共同構(gòu)建融合知識(shí)與數(shù)據(jù)驅(qū)動(dòng)方法,實(shí)現(xiàn)認(rèn)知智能的智能診斷系統(tǒng),以增強(qiáng)計(jì)算機(jī)推理結(jié)果的邏輯性和可解釋性。
ChatGPT為人們帶來便利的同時(shí),數(shù)據(jù)版權(quán)與安全保護(hù)問題也需要引起足夠的思考。一方面,中醫(yī)診斷數(shù)據(jù)包括中醫(yī)專家診斷經(jīng)驗(yàn)和臨床診療數(shù)據(jù),蘊(yùn)含著實(shí)踐經(jīng)驗(yàn)、診斷方法、治療方案和科研成果等方面的內(nèi)容,承載了中華文化以及作者的智慧和心血;另一方面,數(shù)據(jù)是國(guó)家基礎(chǔ)性戰(zhàn)略資源,關(guān)系人民與國(guó)家的數(shù)據(jù)安全,反映我國(guó)全民健康情況和我國(guó)衛(wèi)生事業(yè)的發(fā)展趨勢(shì)。因此,未來需要培養(yǎng)中醫(yī)學(xué)者的數(shù)據(jù)保護(hù)意識(shí),加強(qiáng)數(shù)據(jù)安全人才隊(duì)伍建設(shè),加大經(jīng)費(fèi)投入數(shù)據(jù)保護(hù),建立健全數(shù)據(jù)保護(hù)的法律法規(guī),加強(qiáng)對(duì)中醫(yī)藥數(shù)據(jù)的管理和監(jiān)管,共同促進(jìn)中醫(yī)藥信息化發(fā)展,為中醫(yī)藥現(xiàn)代化插上騰飛的翅膀。
參考文獻(xiàn)
[1] VAN DIS E A M, BOLLEN J, ZUIDEMA W, et al. ChatGPT: Five priorities for research[J]. Nature, 2023, 614(7947): 224-226.
[2] DUAN Y Y, LIU P R, HUO T T, et al. Application and development of intelligent medicine in traditional Chinese medicine[J]. Current Medical Science, 2021, 41(6): 1116-1122.
[3] 李燦東. 中醫(yī)診斷學(xué)[M]. 4版. 北京: 中國(guó)中醫(yī)藥出版社, 2016: 202-205.
[4] 林靜怡, 李詩(shī)翩, 郭? 義, 等. 人工智能助力中醫(yī)藥發(fā)展現(xiàn)狀、問題及建議[J]. 世界中醫(yī)藥, 2022, 17(6): 864-867.
[5] 國(guó)家中醫(yī)藥管理局. “十四五”中醫(yī)藥信息化發(fā)展規(guī)劃[EB/OL].(2022-11-25)[2023-02-18]. http://www.natcm.gov.cn/guicaisi/zhengcewenjian/2022-12-05/28427.html.
[6] 馮志偉, 張燈柯, 饒高琦. 從圖靈測(cè)試到ChatGPT: 人機(jī)對(duì)話的里程碑及啟示[J]. 語(yǔ)言戰(zhàn)略研究, 2023, 8(2): 20-24.
[7] 齊? 旭, 劉? 晶, 宋? 婧. 沒有百億參數(shù)的大模型,不敢奢談ChatGPT[EB/OL].(2023-02-24)[2023-02-25]. https://www.sohu.com/a/645375330_121134737.
[8] 文志華, 夏帥帥, 劉東波, 等. 中醫(yī)智能辨證診斷技術(shù)的演進(jìn)與問題探討[J]. 世界科學(xué)技術(shù)(中醫(yī)藥現(xiàn)代化), 2021, 23(11): 4298-4304.
[9] 中醫(yī)藥發(fā)展研究.中國(guó)中醫(yī)藥臨床案例成果庫(kù)第一批案例成功入庫(kù)[EB/OL].(2020-02-26)[2022-01-05]. https://mp.weixin.qq.com/s/RUAqoEL0zQlI-Hfbd_AwyA.
[10] 蔡? 莉, 王淑婷, 劉俊暉, 等. 數(shù)據(jù)標(biāo)注研究綜述[J]. 軟件學(xué)報(bào), 2020, 31(2): 302-320.
[11] 李新龍, 黃培冬, 朱? 爽, 等. 智能化挖掘中醫(yī)臨床診療數(shù)據(jù)面臨的問題和挑戰(zhàn)[J]. 中華中醫(yī)藥雜志, 2022, 37(12): 6962-6965.
[12] 王天芳, 李燦東, 朱文鋒. 中醫(yī)四診操作規(guī)范專家共識(shí)[J]. 中華中醫(yī)藥雜志, 2018, 33(1): 185-192.
[13] 肖曉霞, 晏峻峰, 劉東波, 等. 中醫(yī)臨床癥狀數(shù)據(jù)元提取探析(英文)[J]. 數(shù)字中醫(yī)藥(英文), 2018(1): 37-46.
[14] 韋昌法, 晏峻峰. 從知識(shí)表示與推理方法探討中醫(yī)數(shù)字辨證發(fā)展[J]. 中華中醫(yī)藥雜志, 2019, 34(10): 4471-4473.
[15] 張? 鈸, 朱? 軍, 蘇? 航. 邁向第三代人工智能[J]. 中國(guó)科學(xué)(信息科學(xué)), 2020, 50(9): 1281-1302.
[16] 王? 萌, 王昊奮, 李博涵, 等. 新一代知識(shí)圖譜關(guān)鍵技術(shù)綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2022, 59(9): 1947-1965.
[17] 韋昌法, 羅麗琴, 晏峻峰. 中醫(yī)數(shù)字辨證配套醫(yī)案智能采集與分析系統(tǒng)構(gòu)建研究[J]. 湖南中醫(yī)藥大學(xué)學(xué)報(bào), 2020, 40(1): 70-74.
[18] 葉? 青, 張素華, 程春雷, 等. 融合知識(shí)圖譜的多通道中醫(yī)辨證模型[J]. 科學(xué)技術(shù)與工程, 2022, 22(21): 9190-9198.
[19] YANG R, YE Q, CHENG C L, et al. Decision-making system for the diagnosis of syndrome based on traditional Chinese medicine knowledge graph[J]. Evidence-Based Complementary and Alternative Medicine, 2022, 2022: 1-9.
[20] 徐? 菁. 《人工智能之認(rèn)知圖譜》重磅發(fā)布[EB/OL].(2020-08-28)[2022-02-25]. https://www.aminer.cn/research_report/5f48541f3c99ce0ab7bca8fc?download=false.
[21] 袁? 滿, 張維罡, 李明軒. 基于認(rèn)知圖譜的智能問答系統(tǒng)推理模型研究[J]. 吉林大學(xué)學(xué)報(bào)(信息科學(xué)版), 2021, 39(5): 589-595.
[22] 唐恒安, 唐三歌, 唐志書. 論中醫(yī)思想體系的第二次抽象[J]. 中華中醫(yī)藥雜志, 2022, 37(9): 4897-4902.
[23] 佘振蘇, 倪志勇. 人體復(fù)雜系統(tǒng)科學(xué)探索[M]. 北京: 科學(xué)出版社, 2012: 63.
[24] 網(wǎng)易科技報(bào)道.亞馬遜警告員工不要向ChatGPT分享機(jī)密,包括正在寫的代碼[EB/OL].(2023-01-25)[2023-02-25].https://www.163.com/tech/article/HRUIJJNU00097U7T.html.
[25] Francesco Marconi. ChatGPT is trained on a large amount of news data from top sources that fuel its AI[EB/OL].(2023-02-15)[2023-02-25].https://twitter.com/fpmarconi/status/1625867414410825728?cxt=HHwWgMC4_ZLznpAtAAAA.
[26] 康添雄. ChatGPT產(chǎn)生版權(quán)糾紛的可能與不可能[EB/OL].(2023-02-20)[2023-02-25]. https://column.chinadaily.com.cn/a/202302/20/WS63f31b7ba3102ada8b22fc56.html.
[27] 中國(guó)人大網(wǎng).中華人民共和國(guó)著作權(quán)法[EB/OL].(2020-11-19)[2023-02-20].http://www.npc.gov.cn/npc/c30834/202011/848e73f58d4e4c5b82f69d25d46048c6.shtml.
[28] 國(guó)務(wù)院辦公廳. 國(guó)務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知[EB/OL].(2018-04-04)[2023-02-20].https://most.gov.cn/xxgk/xinxifenlei/fdzdgknr/fgzc/gfxwj/gfxwj2018/201804/t20180404_139023.html.
[29] 趙新樂,朱麗娜. ChatGPT爆火,帶來哪些版權(quán)問題?[EB/OL].(2023-02-16)[2023-02-25].https://ie.bjd.com.cn/5b165687a010550e5ddc0e6a/contentApp/5b16573ae4b02a9fe2d558f9/AP63ed97e4e4b03a6b6edc4a1c?isshare=1.
[30] 尹夢(mèng)茹. 高??茖W(xué)數(shù)據(jù)的數(shù)字版權(quán)管理研究[J]. 圖書館研究, 2022, 52(2): 1-8.
[31] 工業(yè)和信息化部. 工業(yè)和信息化部關(guān)于印發(fā)“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃的通知[EB/OL].(2021-11-30)[2023-02-25]. https://twitter.com/fpmarconi/status/1625867414410825728?cxt=HHwWgMC4_ZLznpAtAAAA.
(本文編輯? 匡靜之)