李杰
摘 要:傳統(tǒng)循證醫(yī)學(xué)研究中,證據(jù)的稀缺、偏倚、不公、過時等缺陷使得循證醫(yī)學(xué)本身遭到了質(zhì)疑。大數(shù)據(jù)時代,數(shù)據(jù)的巨量、高速、多樣、價(jià)值特性彌補(bǔ)了傳統(tǒng)循證醫(yī)學(xué)的這些不足。伴隨著大數(shù)據(jù)產(chǎn)生的云存儲、數(shù)據(jù)挖掘、深度學(xué)習(xí)等技術(shù)推動了循證醫(yī)學(xué)的發(fā)展。文章介紹了云存儲、數(shù)據(jù)挖掘、深度學(xué)習(xí)等信息技術(shù),并探討了它們對循證醫(yī)學(xué)的影響。
關(guān)鍵詞:信息化 大數(shù)據(jù) 循證醫(yī)學(xué)
中圖分類號:R741 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2018)06(a)-0012-02
循證醫(yī)學(xué)是一門以數(shù)據(jù)說話的學(xué)科,證據(jù)是循證醫(yī)學(xué)的基礎(chǔ)。大數(shù)據(jù)時代,基于大數(shù)據(jù)的云存儲、非結(jié)構(gòu)化數(shù)據(jù)抽取技術(shù),有效解決了數(shù)據(jù)采集、存儲和轉(zhuǎn)化問題,數(shù)據(jù)挖掘和深度學(xué)習(xí)技術(shù)提高了證據(jù)提取和決策分析效率,這些信息化技術(shù)推動了循證醫(yī)學(xué)的變革和創(chuàng)新。
1 傳統(tǒng)循證醫(yī)學(xué)缺陷
傳統(tǒng)循證醫(yī)學(xué)在理論體系上具有先天性缺陷。研究中RCT要求的大規(guī)模樣本量,以及收集的證據(jù)必須是完全一致的實(shí)驗(yàn)環(huán)境下產(chǎn)生的結(jié)果,這在實(shí)際中很難做到。Meta分析通過合并分析各研究結(jié)果得出結(jié)論,為循證醫(yī)學(xué)提供了捷徑,但納入的文獻(xiàn)質(zhì)量良莠不齊,文獻(xiàn)研究自身的選擇性偏倚、實(shí)施偏倚、隨訪偏倚、測量偏倚和報(bào)告偏倚都將導(dǎo)致研究結(jié)果偏離真值,使得研究結(jié)果應(yīng)用價(jià)值頗受爭議。傳統(tǒng)循證醫(yī)學(xué)證據(jù)的稀缺、偏倚、不公、過時,使循證醫(yī)學(xué)發(fā)展面臨困境,理論本身遭到了質(zhì)疑。
2 大數(shù)據(jù)及其特征
大數(shù)據(jù),又稱海量數(shù)據(jù)、巨量數(shù)據(jù),是指無法在一定時間范圍內(nèi)用常規(guī)軟件進(jìn)行收集、存儲和處理的數(shù)據(jù)集合,其本身具有4V特性:Volume(巨量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)。
巨量,是指數(shù)據(jù)規(guī)模已經(jīng)不能用過去的GB、TB為單位進(jìn)行衡量,必須以PB、EB甚至ZB為單位進(jìn)行計(jì)量。
高速,是指數(shù)據(jù)創(chuàng)建、移動和處理速度快,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,并返回給用戶。
多樣,是指數(shù)據(jù)種類和來源多樣化。包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
價(jià)值,是指價(jià)值密度低,要從巨量的數(shù)據(jù)集中挖掘高價(jià)值的信息。
大數(shù)據(jù)的這些特性彌補(bǔ)了傳統(tǒng)循證醫(yī)學(xué)研究的諸多缺陷。巨量和多樣化特性解決了傳統(tǒng)循證醫(yī)學(xué)證據(jù)稀缺和偏倚問題?;诟咚偬匦缘臄?shù)據(jù)實(shí)時采集、快速傳輸和處理,有效解決了樣本量不足,樣本過時問題,并提高了證據(jù)提取和分析處理的效率。巨量數(shù)據(jù)讓循證醫(yī)學(xué)不再受小規(guī)模樣本量的限制,多樣化為研究結(jié)果驗(yàn)證提供了便利,高速采集為研究提供了即時數(shù)據(jù),這些特性都促進(jìn)了循證醫(yī)學(xué)擺脫傳統(tǒng)方法的束縛,使循證醫(yī)學(xué)在技術(shù)創(chuàng)新中打開新局面。
下面介紹大數(shù)據(jù)技術(shù)中和循證醫(yī)學(xué)相關(guān)的云存儲、數(shù)據(jù)挖掘和深度學(xué)習(xí)技術(shù)。
3 云存儲技術(shù)
云存儲是一種新興的網(wǎng)絡(luò)存儲技術(shù),它將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問服務(wù)。實(shí)際應(yīng)用中,云存儲將儲存資源放到云上供人存取,用戶可以在任何時間和地點(diǎn),透過任何可連網(wǎng)的裝置連接到云上方便地存取數(shù)據(jù)。
云存儲主要包括存儲層、基礎(chǔ)管理層、應(yīng)用接口層和訪問層。存儲層中的存儲設(shè)備數(shù)量龐大,分布廣泛,設(shè)備之間通過網(wǎng)絡(luò)連接?;A(chǔ)管理層實(shí)現(xiàn)存儲設(shè)備的協(xié)同工作,使它們能對外提供同一種服務(wù)?;A(chǔ)管理層中使用的數(shù)據(jù)加密技術(shù)和數(shù)據(jù)容災(zāi)備份技術(shù)為數(shù)據(jù)安全提供了保障,避免了數(shù)據(jù)非法訪問和丟失。應(yīng)用接口層根據(jù)用戶需要,開發(fā)不同的應(yīng)用服務(wù)接口,提供用戶所需的應(yīng)用服務(wù)。用戶通過訪問層提供的公用應(yīng)用接口訪問云存儲系統(tǒng)。
云存儲技術(shù)徹底變革了傳統(tǒng)循證醫(yī)學(xué)證據(jù)收集方式。伴隨云存儲技術(shù)產(chǎn)生的移動醫(yī)療,使用便攜式、可穿戴健康監(jiān)測設(shè)備,如健康手環(huán)、智能血壓計(jì),手機(jī)、平板電腦APP等,極大便利了院外隨訪數(shù)據(jù)收集,采集的非結(jié)構(gòu)化數(shù)據(jù)通過信息抽取,結(jié)構(gòu)化處理等技術(shù),完成了從非結(jié)構(gòu)化向結(jié)構(gòu)化的轉(zhuǎn)變。而基于這些個體化的數(shù)據(jù)形成的即時更新的大數(shù)據(jù)樣本,使循證醫(yī)學(xué)研究證據(jù)更加及時準(zhǔn)確可靠,在臨床治療中也更有針對性。此外,中醫(yī)藥研究本身周期長,難以長期、大量采集樣本的問題也得到了解決,云儲存技術(shù)將推動循證醫(yī)學(xué)在中醫(yī)領(lǐng)域的應(yīng)用與發(fā)展。
4 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘,一般是指從大量的數(shù)據(jù)中通過算法獲取隱藏于其中的信息的過程。
該過程主要包括以下步驟:⑴定義問題,明確數(shù)據(jù)挖掘目的;⑵數(shù)據(jù)準(zhǔn)備,確定目標(biāo)數(shù)據(jù),從數(shù)據(jù)源中抽取與業(yè)務(wù)相關(guān)的數(shù)據(jù)集;⑶數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集成,形成數(shù)據(jù)倉庫;⑷選擇算法,構(gòu)建模型,模型優(yōu)化;⑸部署模型,確定模型參數(shù)和輸入變量,對數(shù)據(jù)進(jìn)行挖掘;⑹結(jié)果分析。數(shù)據(jù)挖掘利用了統(tǒng)計(jì)分析和人工智能技術(shù),將這些技術(shù)封裝起來,使人們不用掌握這些技術(shù)就能完成數(shù)據(jù)的挖掘,尋找數(shù)據(jù)間的關(guān)系,解決自己關(guān)注的業(yè)務(wù)問題。
數(shù)據(jù)挖掘技術(shù)幫助研究人員從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含的有價(jià)值的信息知識,打破了研究人員面對海量的醫(yī)療大數(shù)據(jù)時,沒有方法和工具發(fā)現(xiàn)其應(yīng)用價(jià)值的尷尬境遇,為循證醫(yī)學(xué)研究人員從醫(yī)療大數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)關(guān)系,尋找醫(yī)學(xué)規(guī)律創(chuàng)造了條件。
5 深度學(xué)習(xí)
深度學(xué)習(xí)的概念來自人工神經(jīng)網(wǎng)絡(luò),通過模擬人腦的機(jī)制來識別、解釋數(shù)據(jù)。人工神經(jīng)網(wǎng)絡(luò)包含輸入層、隱藏層、輸出層三大層次,每層由許多神經(jīng)元構(gòu)成,每個神經(jīng)元與下一層所有神經(jīng)元連接。信息進(jìn)入神經(jīng)網(wǎng)絡(luò)后,經(jīng)輸入層到隱藏層,在隱藏層處理、傳遞,直到輸出層。如果輸出和輸入一致,神經(jīng)網(wǎng)絡(luò)就完成了對該信息的學(xué)習(xí)。
深度學(xué)習(xí)中,隱藏層的工作至關(guān)重要。隱藏層由若干堆疊的子層構(gòu)成,構(gòu)成了學(xué)習(xí)深度,神經(jīng)網(wǎng)絡(luò)的每次學(xué)習(xí),子層都記錄了該數(shù)據(jù)的特征值。經(jīng)過大量學(xué)習(xí)后,隱藏層通過調(diào)整特征值的權(quán)重,最終準(zhǔn)確還原了初始數(shù)據(jù)。隱藏層實(shí)現(xiàn)了對輸入的分級表達(dá),通過組合低層特征形成更加抽象的高層表示。
深度學(xué)習(xí)能夠模擬人腦識別、篩選、提取數(shù)據(jù)。自動完成海量的高維醫(yī)療數(shù)據(jù)中,患者健康指標(biāo)和環(huán)境數(shù)據(jù)的提取。深度學(xué)習(xí)與數(shù)據(jù)挖掘技術(shù)結(jié)合,將證據(jù)提取與決策分析結(jié)合起來,使循證醫(yī)學(xué)向人工智能邁出重要一步,大大提高了循證醫(yī)學(xué)研究人員的工作效率。
6 結(jié)語
循證醫(yī)學(xué)是一門重視醫(yī)學(xué)證據(jù)的學(xué)科,它實(shí)現(xiàn)了從傳統(tǒng)經(jīng)驗(yàn)醫(yī)學(xué)向證據(jù)醫(yī)學(xué)的轉(zhuǎn)變。但傳統(tǒng)循證醫(yī)學(xué)自身存在的證據(jù)稀缺、偏倚、過時、不公等缺陷,使其也面臨著重大挑戰(zhàn)。大數(shù)據(jù)時代,信息化高速發(fā)展,由此催生的云計(jì)算、云存儲、數(shù)據(jù)挖掘、深度學(xué)習(xí)等技術(shù)必將促進(jìn)傳統(tǒng)循證醫(yī)學(xué)的重大變革和創(chuàng)新。運(yùn)用云存儲技術(shù),將實(shí)現(xiàn)海量醫(yī)療數(shù)據(jù)的實(shí)時采集和存儲;運(yùn)用數(shù)據(jù)挖掘技術(shù),將幫助研究人員從醫(yī)療大數(shù)據(jù)中發(fā)現(xiàn)與研究相關(guān)的高價(jià)值信息;基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),將實(shí)現(xiàn)醫(yī)療大數(shù)據(jù)中目標(biāo)數(shù)據(jù)提取自動化,使研究人員擁有更高工作效率。大數(shù)據(jù)時代,信息化技術(shù)給循證醫(yī)學(xué)注入了強(qiáng)大活力,循證醫(yī)學(xué)必將借此翻開新的一頁。
參考文獻(xiàn)
[1] 劉建平.循證醫(yī)學(xué)進(jìn)展述評[J].重慶醫(yī)學(xué),2017,46(14):1873-1877.
[2] 呂玉紅,范維,程慶元.等.云技術(shù)與醫(yī)學(xué)信息化教育[J].現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2015(6):1126-1129.
[3] 馬光志,張曉祥,周彬,等.大數(shù)據(jù)時代的循證醫(yī)學(xué)[J].世界復(fù)合醫(yī)學(xué),2015(2):120-124.