夏淑潔,楊朝陽,周常恩,辛基梁,張佳,杜國棟,李燦東
(1.福建中醫(yī)藥大學(xué)中醫(yī)證研究基地,福建福州 350122;2.福建省中醫(yī)健康狀態(tài)辨識重點(diǎn)實(shí)驗(yàn)室,福建福州 350122;3.廈門大學(xué)智能科學(xué)與技術(shù)系,福建廈門 361005)
辨證論治是中醫(yī)的精髓,精準(zhǔn)辨證是有效治療的前提。當(dāng)前,中醫(yī)辨證存在客觀化、定量化、標(biāo)準(zhǔn)化等方面的不足,限制了中醫(yī)的進(jìn)一步傳承和發(fā)展,因此,迫切需要運(yùn)用現(xiàn)代科學(xué)技術(shù)的理論和方法推進(jìn)中醫(yī)診斷的客觀化與規(guī)范化研究[1-2]。人體是一個復(fù)雜的有機(jī)整體,證候具有多維性、模糊性、復(fù)雜性的特點(diǎn),難以簡單用傳統(tǒng)單一、線性的分析方法進(jìn)行研究[3-4]。而數(shù)據(jù)挖掘技術(shù),尤其是機(jī)器學(xué)習(xí)[5],利用海量臨床數(shù)據(jù),通過模擬中醫(yī)臨床診斷推理過程來挖掘臨床診斷數(shù)據(jù)中繁雜的病-證-癥關(guān)系,可克服人類認(rèn)知和思維的局限性,充分照顧到中醫(yī)整體觀、模糊性、非線性的特點(diǎn),從而尋找大數(shù)據(jù)下隱藏的中醫(yī)知識和規(guī)律,助力中醫(yī)診斷客觀化的進(jìn)程。以下對近年來常見機(jī)器學(xué)習(xí)方法在中醫(yī)診斷領(lǐng)域的應(yīng)用進(jìn)行述評。
支持向量機(jī)(support vector machine,SVM)于1995年首次提出,是一種以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的模式識別的機(jī)器學(xué)習(xí)方法[6]。SVM是機(jī)器學(xué)習(xí)領(lǐng)域若干技術(shù)集大成者,它具有嚴(yán)格的理論和數(shù)學(xué)基礎(chǔ),可較好地實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)最小化思想,能較為合理地解決小樣本、非線性、高維數(shù)和局部最小等實(shí)際問題。SVM的關(guān)鍵在于針對樣本數(shù)據(jù)不可分情況,利用核函數(shù)把一個復(fù)雜的分類任務(wù)映射,使之能轉(zhuǎn)化成一個線性可分問題[7]。因而,SVM主要的優(yōu)勢在于:(1)專門針對有限樣本設(shè)計(jì),目標(biāo)是獲得現(xiàn)有信息下的最優(yōu)解,根據(jù)有限的樣本信息在模型的復(fù)雜性及學(xué)習(xí)能力之間尋求最佳折衷[8]。(2)算法將實(shí)際問題通過非線性變換映射到高維特征空間,并構(gòu)建線性最佳逼近來解決原來空間的非線性逼近問題,這樣既保證了機(jī)器學(xué)習(xí)取得最好推廣能力(泛化能力),并且SVM的算法復(fù)雜性與數(shù)據(jù)維數(shù)無關(guān),因而能較好解決維數(shù)災(zāi)難問題[9]。
由于SVM不僅可以處理高維的特征向量,將非線性問題轉(zhuǎn)化為線性可分問題,并且在樣本數(shù)較少時也能獲得較好分類效果,故SVM近年來在中醫(yī)領(lǐng)域被大量使用。許明東等[10]將支持向量機(jī)方法應(yīng)用在高血壓病中醫(yī)證候診斷中,以常見癥狀、舌苔及舌體、脈象的量化數(shù)據(jù)為輸入變量,高血壓病證型為輸出變量,建立了基于SVM的高血壓病中醫(yī)證候診斷模型,該模型總體準(zhǔn)確率為90.0%。Wang J等[11]以SVM為基礎(chǔ)構(gòu)建了冠心病中醫(yī)證候診斷模型,并得出8個不同證型中各癥狀條目的權(quán)重,可從深層次反映出診治經(jīng)驗(yàn)。Sun Z Q等[12]通過采用非線性多元分析對癥狀信息降維處理,之后分別運(yùn)用神經(jīng)網(wǎng)絡(luò)和多分類SVM對證候進(jìn)行分類,發(fā)現(xiàn)中醫(yī)癥狀信息本身具有非線性和多維性,運(yùn)用多分類SVM比神經(jīng)網(wǎng)絡(luò)更具優(yōu)勢。但SVM算法對大規(guī)模訓(xùn)練樣本難以實(shí)施。此外,在中醫(yī)數(shù)據(jù)挖掘的實(shí)際應(yīng)用中,一般要解決多類的分類問題,而SVM主要解決二分類問題,對多分類問題存在困難,此時可考慮通過多個二類支持向量機(jī)的組合或構(gòu)造多個分類器的組合來解決[13]。
決策樹[14](decision tree,DT)是一種相對簡單的機(jī)器學(xué)習(xí)分類算法。其構(gòu)建思想來源于人們的決策過程,在已知各種情況發(fā)生的概率基礎(chǔ)上,通過構(gòu)成決策樹來評價(jià)項(xiàng)目風(fēng)險(xiǎn),判斷可行性的決策方法。因這種決策分支構(gòu)成的圖形很像一棵樹干,故稱為決策樹。樹中每個節(jié)點(diǎn)表示一個樣本屬性,每個分支則代表對該屬性的判斷,而每個葉子結(jié)點(diǎn)則對應(yīng)最終的類別,通常將其看作一個預(yù)測模型,代表對象屬性與對象值之間的一種映射關(guān)系[15-16]。該模型易于理解和實(shí)現(xiàn),用戶即使未學(xué)習(xí)相關(guān)背景知識,也能發(fā)掘其簡單直觀的分類規(guī)則,只要通過適當(dāng)?shù)慕忉?,用戶就能理解決策樹所表達(dá)的意義。其次,算法運(yùn)行速度快,易轉(zhuǎn)化為分類規(guī)則,分類準(zhǔn)確率較高,只要沿著根結(jié)點(diǎn)向下一直走到葉子結(jié)點(diǎn),沿途分裂條件是唯一且確定的。但決策樹在處理大樣本集時,易出現(xiàn)過擬合現(xiàn)象,從而降低分類的準(zhǔn)確性。
目前主要的決策樹算法有ID3、C4.5、C5.0和CART算法等,常用于建立中醫(yī)證的診斷模型、歸納名老中醫(yī)辨證過程等。此外,基于大量決策樹而形成的隨機(jī)森林方法還可用于證候特征權(quán)重的確定。田艷鵬等[17]采用C5.0、CRT、CHAID、QUEST決策樹方法和神經(jīng)網(wǎng)絡(luò)方法提取痰濕壅盛證的診斷規(guī)律,發(fā)現(xiàn)C5.0決策樹模型的準(zhǔn)確率(93.7%)最高。蘇翀等[18]利用基于KL距離的決策樹建立慢性阻塞性肺病中醫(yī)診斷模型,以F-Measure、G-Mean、ROC曲線下面積以及精度召回率曲線下面積作為評價(jià)指標(biāo),結(jié)果表明采用改良的決策樹較傳統(tǒng)決策樹可取得更好的預(yù)測效果。劉廣等[19]基于C4.5決策樹算法對經(jīng)預(yù)處理后的800例中醫(yī)胃炎患者的辨證數(shù)據(jù)進(jìn)行分類,并提取其分類規(guī)則,該規(guī)則基本符合中醫(yī)胃炎的辨證規(guī)律以及名老中醫(yī)診治胃炎的診療經(jīng)驗(yàn)。呂航等[20]運(yùn)用CHAID算法,構(gòu)建基于中醫(yī)人格、體質(zhì)類型預(yù)測2型糖尿?。═2MD)患者合并冠心病的患病風(fēng)險(xiǎn)模型,結(jié)果顯示以少陰人格、陰寒質(zhì)、血瘀質(zhì)為預(yù)測變量構(gòu)建的糖尿病患病風(fēng)險(xiǎn)模型預(yù)測準(zhǔn)確度為93.6%,所得的3條預(yù)測冠心病患病風(fēng)險(xiǎn)的規(guī)則也符合中醫(yī)理論。蔡曉路[21]采用隨機(jī)森林方法實(shí)現(xiàn)了類風(fēng)濕關(guān)節(jié)炎證型判別模型的構(gòu)建,并對特征癥狀進(jìn)行權(quán)重計(jì)算,其權(quán)重計(jì)算結(jié)果與現(xiàn)行的證候特征相比,將有助于證候表述的完善。通過以上分析,可以看出決策樹模型具有較好的解釋性,故在中醫(yī)診斷領(lǐng)域應(yīng)用較廣,但該方法存在過擬合現(xiàn)象,這將是今后研究過程中需要解決的問題。
K近鄰(K-nearest neighbor,KNN)分類算法指假設(shè)一個樣本在特征空間中的K個最相似(即特征空間中最近鄰)的樣本中大多數(shù)屬于某一類別,則該樣本也屬于這個類別[22]。該算法有3個基本要素:K值、距離度量和分類決策規(guī)則。其中K值的選擇與結(jié)果密切相關(guān),K值較小意味著只有與輸入實(shí)例較接近的訓(xùn)練實(shí)例才會對預(yù)測結(jié)果有作用,但容易發(fā)生過擬合;而K值較大時,學(xué)習(xí)的估計(jì)誤差減少,但近似誤差增大,此時與輸入實(shí)例較遠(yuǎn)的訓(xùn)練實(shí)例也會對預(yù)測起作用,可導(dǎo)致預(yù)測發(fā)生錯誤。一般來說,K值常選用一個較小數(shù)值,通常采用交叉驗(yàn)證方法選擇最佳K值[23]。該算法的特點(diǎn)為:首先,無需參數(shù)估計(jì)與訓(xùn)練,比較簡單有效,精度高,且對噪聲不敏感;其次,因KNN依靠周圍有限的鄰近樣本,因而對類域交叉或重疊較多的待測樣本來說,KNN相對更理想,也更適合多分類問題。但KNN分類算法也存在著解釋性較差、計(jì)算量大、當(dāng)樣本不均衡時可能導(dǎo)致結(jié)果偏差等問題。
近年來,針對本算法的不足之處,研究者不斷進(jìn)行改進(jìn),并衍生出了一系列的算法,如K-D樹KNN算法、快速KNN算法、ML-KNN算法等。其中,ML-KNN模型為近年來典型的多標(biāo)簽學(xué)習(xí)算法,具有簡單、易行、錯誤率較低等優(yōu)點(diǎn),是在傳統(tǒng)的單標(biāo)簽KNN模型基礎(chǔ)上結(jié)合貝葉斯算法發(fā)展起來。中醫(yī)的臨床表征(證候)往往不會單一出現(xiàn),而是彼此聯(lián)系交織,即涉及到證型往往不是單一的,而是兼夾的。ML-KNN算法可將與診斷相關(guān)的多個標(biāo)簽作為一個整體處理,保留了各標(biāo)簽之間的相關(guān)關(guān)系,因而也更符合中醫(yī)核心的整體思維。王剛[24]對ML-KNN算法進(jìn)行了改良,并將該改良的方法用于401例帕金森病患者的病例數(shù)據(jù)分析,分析結(jié)果提示該方法在對帕金森的中醫(yī)診斷中取得了良好的效果。辛基梁等[25]研究中醫(yī)健康狀態(tài)辨識中的多標(biāo)記分類方法,與單標(biāo)記方法KNN相比,ML-KNN性能更佳。Liu G P等[26]通過設(shè)計(jì)中醫(yī)冠心病問診標(biāo)準(zhǔn)化量表,并利用MLKNN技術(shù)構(gòu)建了基于中醫(yī)問診的診斷模型,并與RankSVM、BPMLL及KNN相比較,前者具有更好的預(yù)測效果,并且基于ML-KNN算法建立的冠心病診斷中醫(yī)辨證預(yù)測模型,可同時解決多證素兼夾的標(biāo)記問題??梢?,與單標(biāo)簽KNN相比,基于多標(biāo)簽的ML-KNN算法更適合中醫(yī)證候診斷過程中存在的多標(biāo)簽即證素、證型等兼夾問題。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是模仿生物神經(jīng)系統(tǒng)中神經(jīng)元的一種數(shù)學(xué)處理方法。ANN由大量處理單元(神經(jīng)元)互聯(lián)組成非線性大規(guī)模自適應(yīng)動態(tài)系統(tǒng),依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整大量單元間相互連接關(guān)系,從而達(dá)到處理信息的目的[27]。ANN模型的性能主要與神經(jīng)元的特性、神經(jīng)元之間相互連接形式以及為適應(yīng)環(huán)境而改善性能的學(xué)習(xí)規(guī)則有關(guān)。ANN構(gòu)成原理與功能更接近人腦,擅于適應(yīng)環(huán)境、總結(jié)規(guī)律以處理模糊復(fù)雜、推理規(guī)則不明確的問題,不用考慮各變量之間是否獨(dú)立及滿足正態(tài)分布等條件,并且ANN可給出結(jié)構(gòu)參數(shù),這也與傳統(tǒng)的統(tǒng)計(jì)分析不一樣[28]。而在此基礎(chǔ)上進(jìn)行算法拓展,進(jìn)一步興起了深度學(xué)習(xí),它運(yùn)用分層抽象的思想,被應(yīng)用在圖像識別、語音識別等領(lǐng)域,具有更高的識別精度[29]。然而,因ANN具有黑箱運(yùn)行的特點(diǎn),ANN在解釋推理過程和推理依據(jù)及其存儲知識的意義時存在一定困難。目前,常見的神經(jīng)網(wǎng)絡(luò)主要有向前神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、Hopfield神經(jīng)網(wǎng)絡(luò)等。
臨床上,證候之間、證候與診斷結(jié)果之間、證候與方藥之間的關(guān)系具有非線性、復(fù)雜性、模糊性、非定量的特點(diǎn),因而ANN比較符合中醫(yī)辨證理論和中醫(yī)數(shù)據(jù)處理的運(yùn)用要求[30]。辛基梁[31]采用“中醫(yī)證素辨證系統(tǒng)”作為病例采集工具,采用基于神經(jīng)網(wǎng)絡(luò)的多標(biāo)記分類算法對1 146例病例進(jìn)行結(jié)果預(yù)測,其平均精度可達(dá)到0.79。岳桂華等[32]研究高血壓中醫(yī)證候與分級的關(guān)系時,運(yùn)用基于共軛梯度算法的BP神經(jīng)網(wǎng)絡(luò)技術(shù)建立模型,該模型對高血壓分級的平均識別率可達(dá)75%,說明BP神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于高血壓中醫(yī)證候與分級研究具有方法學(xué)上的可行性。王娟等[33]應(yīng)用多元數(shù)據(jù)統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)挖掘方法構(gòu)建基于多系統(tǒng)理化指標(biāo)信息的慢性心力衰竭(CHF)血瘀證診斷模型,篩選出有統(tǒng)計(jì)學(xué)意義的指標(biāo)信息20項(xiàng),測試樣本的準(zhǔn)確率達(dá)到82.4%。由此可見,ANN表現(xiàn)出極大的靈活性和自適應(yīng)性,因此人工神經(jīng)網(wǎng)絡(luò)技術(shù)可運(yùn)用于智能中醫(yī)辨證系統(tǒng)構(gòu)建過程中[34]。但人工神經(jīng)網(wǎng)絡(luò)技術(shù)具有難解釋性等缺陷,難以顯現(xiàn)隱藏在網(wǎng)絡(luò)中的知識。為進(jìn)一步適應(yīng)醫(yī)學(xué)領(lǐng)域,可以使用決策樹、規(guī)則提取等技術(shù)對人工神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行改進(jìn),提高系統(tǒng)的可理解性。
貝葉斯網(wǎng)絡(luò)(Bayesian networks)又稱貝葉斯信念網(wǎng)絡(luò),是由Pearl J[35]在1988年提出,現(xiàn)已成為近些年的研究熱點(diǎn)。貝葉斯網(wǎng)絡(luò)作為一種更高級、應(yīng)用范圍更廣的貝葉斯分類算法,其主要思想是將概率統(tǒng)計(jì)應(yīng)用到復(fù)雜領(lǐng)域中以進(jìn)行不確定性推理及數(shù)據(jù)分析,并充分考慮變量間的依賴關(guān)系,能更好地提高分類正確率,故被認(rèn)為是表達(dá)不確定知識和推理的最有效理論模型之一[36]。貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)為一個有向無環(huán)圖,主要由節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的有向邊構(gòu)成。其中,節(jié)點(diǎn)表示已知或未知的隨機(jī)變量;節(jié)點(diǎn)間的有向邊記錄了兩節(jié)點(diǎn)間的條件概率,以此可類推表示所有節(jié)點(diǎn)間的關(guān)系[37]。但因貝葉斯網(wǎng)絡(luò)的建造是一個復(fù)雜的任務(wù),故需要該領(lǐng)域?qū)<业膮⑴c并不斷完善。另外,因各節(jié)點(diǎn)間關(guān)系復(fù)雜,條件概率表存在著難以計(jì)算且不便使用的問題[38]。
貝葉斯網(wǎng)絡(luò)能充分利用先驗(yàn)知識,并用圖表來顯示變量之間的關(guān)系和解釋因果鏈接關(guān)系,可以處理不完全、不精確、有噪聲的信息,因而也被多次運(yùn)用到中醫(yī)診斷問題上[39]。呂胤[40]分別運(yùn)用決策樹、支持向量機(jī)和貝葉斯網(wǎng)絡(luò)3種數(shù)據(jù)挖掘分類方法對高血壓病的臨床病例進(jìn)行分類處理,發(fā)現(xiàn)貝葉斯網(wǎng)絡(luò)分類算法準(zhǔn)確率最高,耗時最短。徐全壹等[41]比較分析貝葉斯網(wǎng)絡(luò)和聚類分析在構(gòu)建腎虛證數(shù)學(xué)診斷模型中的差異,發(fā)現(xiàn)聚類分析能大致構(gòu)建出腎虛證癥狀的主要結(jié)構(gòu)系統(tǒng),但可能會丟失很多重要的特性,而貝葉斯網(wǎng)絡(luò)分析結(jié)果提供了一個清晰的整體腎虛證癥狀系統(tǒng),并成功地檢測到4種不同的腎虛證癥狀類型,故認(rèn)為貝葉斯網(wǎng)絡(luò)可更有效地分析出腎虛證癥狀系統(tǒng)的不同層次。徐璡等[42]在專家辨證和先驗(yàn)知識的基礎(chǔ)上運(yùn)用貝葉斯網(wǎng)絡(luò)對冠心病患者四診證候信息進(jìn)行分類識別,發(fā)現(xiàn)該模型對本病5個不同證型的識別率較高,因而認(rèn)為該方法在冠心病中醫(yī)證候分類客觀化研究中具有較好的應(yīng)用前景。可見,運(yùn)用貝葉斯網(wǎng)絡(luò)可以揭示癥狀之間及癥狀與證型之間的關(guān)系,并歸納出該證型具有代表性的癥狀,這將不僅有助于證候診斷的標(biāo)準(zhǔn)化和規(guī)范化,還可為輔助診療提供參考。
AdaBoost算法是一種集成算法,即將多個機(jī)器學(xué)習(xí)算法構(gòu)成集成分類器來完成學(xué)習(xí)任務(wù)[43]。該算法的理論基礎(chǔ)是假設(shè)存在“弱”分類器,這種弱分類器的預(yù)測能力(分類正確性大于0.5)僅比隨機(jī)猜測準(zhǔn)確一點(diǎn),當(dāng)其個數(shù)趨于無窮個數(shù)時,最終形成一個預(yù)測錯誤率很低的“強(qiáng)”分類器[44]。作為一種算法框架,AdaBoost可用于絕大多數(shù)的機(jī)器學(xué)習(xí)算法以提高原算法的預(yù)測精度,故被評為數(shù)據(jù)挖掘十大算法之一。它的自適應(yīng)性源于前一個基本分類器分錯的樣本會得到加強(qiáng),加權(quán)后的全體樣本再次被用來訓(xùn)練下一個基本分類器。同時,在每一輪中加入新的弱分類器,直到達(dá)到某個預(yù)定的足夠小的錯誤率或指定的最大迭代次數(shù)[45]。AdaBoost算法具有理論扎實(shí)、不需要先驗(yàn)知識、能夠顯著改善子分類器預(yù)測精度等優(yōu)點(diǎn)[46-47],其在解決各行業(yè)應(yīng)用問題中都獲得了較好的結(jié)果。但在運(yùn)用AdaBoost集成算法的過程中還需要解決如何得到若干個個體學(xué)習(xí)器和如何選擇一種合理的結(jié)合方法的關(guān)鍵問題。
目前,AdaBoost算法在中醫(yī)領(lǐng)域的應(yīng)用研究不多,主要集中在舌診、面診等方面。胡申寧[48]根據(jù)傳統(tǒng)的中醫(yī)理論,將AdaBoost算法融合到舌色、苔色的判別中,先在HSV[色調(diào)(H),飽和度(S),明度(V)]顏色空間中對舌象進(jìn)行特征提取、降維,提取有效的舌象特征,而后通過AdaBoost算法把一系列弱分類器提升為強(qiáng)分類器,實(shí)現(xiàn)了具有較好魯棒性的舌體自動分割。吳墩華[49]在中醫(yī)面診規(guī)范化研究中,運(yùn)用AdaBoost和FCM聚類算法對人臉特征進(jìn)行粗定位,并在這些矩形區(qū)域中利用聚類獲得它們的初始區(qū)域,在此基礎(chǔ)上以面色臟腑分屬圖上特征點(diǎn)的顏色作為面色特征,獲得了84.6%的識別率。此外,也有將AdaBoost算法運(yùn)用在中醫(yī)證候規(guī)范化研究。佟旭[50]嘗試運(yùn)用AdoBoost算法構(gòu)建糖尿病腎病患者的多標(biāo)簽的證型分類模型,其分類準(zhǔn)確率接近98%,得出該方法的算法結(jié)構(gòu)和原理對于解決中醫(yī)多維度數(shù)據(jù)具有良好的優(yōu)勢。可見,該方法目前主要應(yīng)用于中醫(yī)望診研究領(lǐng)域,其特點(diǎn)是可綜合多種算法的優(yōu)勢,但具體如何針對中醫(yī)數(shù)據(jù)特點(diǎn)實(shí)現(xiàn)更好地結(jié)合亦需進(jìn)一步研究。
中醫(yī)診斷的基本原理為“司外揣內(nèi)”,通過望、聞、問、切方式獲得患者的癥狀、體征,從而推測導(dǎo)致疾病發(fā)生的原因及當(dāng)前階段的證候特點(diǎn),又稱之為“因發(fā)知受”[51-52]。中醫(yī)診斷過程是一個多源信息的獲取和處理、整合的過程,由于傳統(tǒng)中醫(yī)診法主要憑借醫(yī)生的個人經(jīng)驗(yàn)來辨析與判別病癥,因而診斷的結(jié)果不可避免地受到醫(yī)生主觀意識的影響。近年來,對中醫(yī)四診的客觀化和規(guī)范化研究方興未艾[53]。隨著人工智能的發(fā)展和多學(xué)科融合交叉并廣泛應(yīng)用于中醫(yī)證候診斷的研究,中醫(yī)診斷客觀化、規(guī)范化研究得到了有力的推動,通過機(jī)器學(xué)習(xí)可尋找中醫(yī)大數(shù)據(jù)下的隱藏知識和規(guī)律。然而面對中醫(yī)領(lǐng)域存在的數(shù)據(jù)種類繁多、結(jié)構(gòu)多樣并且缺乏統(tǒng)一標(biāo)準(zhǔn)的問題,如何保證數(shù)據(jù)集的質(zhì)量是目前面臨的巨大挑戰(zhàn)[54]。今后在促進(jìn)機(jī)器學(xué)習(xí)運(yùn)用于中醫(yī)研究領(lǐng)域時,需針對中醫(yī)診療中的各項(xiàng)問題制定統(tǒng)一的標(biāo)準(zhǔn)并規(guī)范數(shù)據(jù)收集。