国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國外公開乳腺影像數(shù)據(jù)集的現(xiàn)狀分析及其啟示

2021-03-29 01:47:52張燕娜劉乾宇閆思桃李金斌
中國醫(yī)學科學院學報 2021年2期
關鍵詞:乳腺乳腺癌醫(yī)療

茅 楓,張燕娜,劉乾宇,閆思桃,胡 倩,羅 妍,李金斌,付 磊,4

1中國醫(yī)學科學院 北京協(xié)和醫(yī)學院 北京協(xié)和醫(yī)院乳腺外科,北京 100730 2北京郵電大學計算機學院(國家示范性軟件學院),北京 100876 3中國人民解放軍總醫(yī)院臨床生物樣本中心,北京 100853 4國防大學聯(lián)合勤務學院聯(lián)合后勤保障系衛(wèi)勤教研室,北京 100858

自2008年以來,全球每年乳腺癌病例以超過20%的速度增長,而死亡率每年增長超過14%[1]。根據(jù)世界衛(wèi)生組織下屬的國際癌癥研究中心近幾年公布的數(shù)據(jù)顯示,乳腺癌是導致女性患癌死亡的第二大病癥,且發(fā)病率和死亡率呈逐年上升趨勢。2015年我國新發(fā)乳腺癌30.4萬例,死亡7萬例,與之伴隨的是個人、家庭和社會保障體系治療負擔的加重[2]。因此,乳腺癌的早期診斷對乳腺癌的治療、預后等具有重大意義。醫(yī)學影像診斷是乳腺癌鑒別和早診的重要手段。而利用計算機視覺技術(shù)進行醫(yī)學影像識別,輔助醫(yī)生對乳腺癌進行診斷是目前的研究熱點之一。通過對乳腺影像的自動化處理,可以幫助醫(yī)生進行乳腺癌的篩查,從而提高診斷效率。這在當前我國醫(yī)療資源整體不足、地域分布不平衡、全科醫(yī)生短缺、分級診療不理想、醫(yī)療需求持續(xù)攀升等大背景下,實現(xiàn)普惠和精準醫(yī)療,促進醫(yī)療健康事業(yè)平衡充分發(fā)展具有重大意義。深度學習模型圖像處理作為計算機視覺技術(shù)的重要組成部分,已經(jīng)在醫(yī)學影像領域得到了廣泛的應用。對于利用深度學習訓練圖像模型本身,影像數(shù)據(jù)集的樣本量是影像識別準確率的重要影響因素,樣本量缺失必定會導致模型性能的泛化能力過低。目前,國內(nèi)醫(yī)療影像公開數(shù)據(jù)集仍處于比較匱乏的階段,這會在一定程度上制約醫(yī)學影像輔助診療技術(shù)的快速發(fā)展。因此,本文以乳腺癌為例,對國外大型公開數(shù)據(jù)集如乳腺X線影像數(shù)據(jù)集、乳腺癌磁共振數(shù)據(jù)集進行廣泛調(diào)研,并對這些數(shù)據(jù)集的基本情況、具體信息、相關研究現(xiàn)狀以及共享利用四個方面進行深入的比較分析,進而總結(jié)闡述國外公開影像數(shù)據(jù)集對我國醫(yī)療健康數(shù)據(jù)開放方案的啟示。

乳腺X線影像數(shù)據(jù)集

乳腺X線數(shù)字圖像數(shù)據(jù)集

數(shù)據(jù)集基本情況:乳腺X線數(shù)字圖像數(shù)據(jù)集(Digital Database for Screening Mamography,DDSM)在美國陸軍醫(yī)學研究和材料司令部的資助下,由美國馬薩諸塞州綜合醫(yī)院、南佛羅里達大學和桑迪亞國家實驗室合作完成,已經(jīng)在乳腺影像分析研究中被廣泛使用,截止到2019年11月,DDSM在谷歌學術(shù)上已被引用995次。DDSM主要用于促進計算機輔助診斷算法的研究及教學、培訓輔助工具的開發(fā)。

數(shù)據(jù)基本信息:DDSM包含2620個病例,共計20 480張影像資料。該數(shù)據(jù)集的所有病例均為女性患者,其中大部分來自馬薩諸塞州綜合醫(yī)院,另外一部分來自維克森林大學醫(yī)學院。數(shù)據(jù)集中的每個病例均由患者基本信息、圖像基本信息和原始圖像等組成。其中,患者基本信息包括年齡、就診日期、由放射科醫(yī)生評估的美國放射學會乳房組織密度評級等,圖像基本信息包括掃描儀型號、空間分辨率等。

針對每個具體病例,DDSM提供了4張JPEG格式的壓縮的原始圖像,其大小為3000×4800像素,分辨率為42~50 μm。4張圖像分別為左右內(nèi)外斜位和頭尾位視圖,1個帶有.ics擴展名的包含患者和圖像信息的文本文件和1個僅用于快速查看圖像的PGM格式的縮略圖。此外,每個異常視圖都有一個標注框,描述了圖像中由放射科醫(yī)生標記的異常位置和邊界。并且,DDSM攜帶了癌癥、正常、良性三類數(shù)據(jù)。與大多數(shù)只包含一個感興趣區(qū)域(region of intersect,ROI)的乳腺X線影像數(shù)據(jù)集相比,該數(shù)據(jù)集含有像素水平級別的標簽和每個ROI的類型,如鈣化或腫塊。

相關研究:Yoon和Kim[3]提出了一種基于AdaBoost的多支持向量機遞歸特征消除算法,用于對DDSM中的乳腺X線影像進行分類,在有許多ROI的情況下,其提出的方法可能是支持向量機遞歸特征消除或原始多支持向量機遞歸特征消除的有效替代方案。2017年,Samala等[4]提出了一種多任務遷移學習的深度神經(jīng)網(wǎng)絡,利用DDSM數(shù)據(jù)集進行測試,實現(xiàn)了乳腺腫塊良惡性的分類。此外,Elter等[5]提出了兩種計算機輔助診斷系統(tǒng)方法用于理解決策樹對乳腺活檢結(jié)果的決策過程,在DDSM數(shù)據(jù)集上驗證得出的結(jié)果優(yōu)于醫(yī)師的診斷決策。

數(shù)據(jù)共享利用:DDSM[6]由南佛羅里達大學維護,研究者可以通過南佛羅里達大學乳腺數(shù)字影像官網(wǎng)主頁免費下載使用。該網(wǎng)站提供在線檢索工具,可以幫助研究者識別符合指定標準的病例。并且,DDSM提供一些處理數(shù)據(jù)的軟件,如compareTemplates用于將檢測算法的結(jié)果與圖像的標注框進行比較,DDSMView用于顯示用戶所選病例的圖像。此外,還提供匿名ftp訪問統(tǒng)計信息,顯示每周從DDSM匿名ftp下載的數(shù)量。

乳腺X線影像分析協(xié)會

數(shù)據(jù)集基本情況:乳腺X線影像分析協(xié)會(Mammographic Image Analysis Society,MIAS)致力于乳腺X線影像研究并建立了數(shù)字乳腺X線影像數(shù)據(jù)庫,MIAS數(shù)據(jù)集[7]是最早公開的乳腺X線影像數(shù)據(jù)集,目前被廣泛應用于乳腺相關的各類研究。截止到2019年11月,MIAS數(shù)據(jù)集在谷歌學術(shù)上被引用次數(shù)高達1408次。

數(shù)據(jù)基本信息:MIAS數(shù)據(jù)集采用英國國家乳房篩查計劃的膠片,該膠片在50 μm像素邊緣數(shù)字化,使用Joyce-Loebl掃描顯微光密度計,其光學密度為0~3.2,每個像素用8-bit表示。具體而言,該數(shù)據(jù)集包含161例病例,共計322張數(shù)字化圖片。每例病例都以成對的膠片排列,每對膠片包括患者的左(偶數(shù)文件名編號)和右乳房(奇數(shù)文件名編號)X線影像,以及放射科醫(yī)生對所有可能存在的異常位置的標記。所有影像分辨率均為1024×1024像素,可在2.3 GB8mm(ExaByte)磁帶上使用。并且,MIAS提供了該數(shù)據(jù)集的詳細信息,包括病例類別(正常影像以及良、惡性病變的多種病征影像)、嚴重程度、異常中心位置的坐標和半徑等。

相關研究:Sankar和Thomas[8]在2010年提出了一種新的快速分型建模方法,通過確定性分型編碼方法對MIAS數(shù)據(jù)集中乳腺X線影像進行建模,以檢測微鈣化病灶是否存在,相比較于傳統(tǒng)的分型圖像編碼方法,提高了建模效率。Ibrahim等[9]將團隊自身研發(fā)的計算機輔助診斷系統(tǒng)應用于MIAS數(shù)據(jù)集,對微鈣化病灶的自動檢測準確率達到了95.8%,有效提高了醫(yī)生診斷的敏感性和特異性。2018年,Chougrad等[10]將深度學習應用到乳腺癌影像的分類中,通過對預訓練的卷積神經(jīng)網(wǎng)絡進行微調(diào),在MIAS數(shù)據(jù)集進行測試獲得了98.23%的準確率。Mohanty等[11]在2019年提出一種混合計算機輔助診斷系統(tǒng)框架,用于乳腺癌影像的分類并在MIAS數(shù)據(jù)集上得到了驗證。

數(shù)據(jù)共享利用:MIAS數(shù)據(jù)集由MIAS維護,受英國版權(quán)法、國際條約規(guī)定和其他所有適用的國家法律保護。研究者可以通過MIAS數(shù)據(jù)庫網(wǎng)址[12]免費下載使用,在使用時須在出版物中明確標注參考該數(shù)據(jù)集。

DMD

數(shù)據(jù)集基本情況:DMD(Digital Mammography Dataset,DMD)是由美國乳腺癌監(jiān)測聯(lián)合會(Breast Cancer Surveillance Consortium,BCSC)根據(jù)收集的乳腺X線數(shù)字影像整理出的數(shù)據(jù)集,由美國國家癌癥研究所等機構(gòu)提供資助。

數(shù)據(jù)基本信息:DMD包括2005年1月至2008年12月的20 000個數(shù)字乳腺X線影像和20 000個膠片乳腺X線影像樣本的病理信息。該數(shù)據(jù)集提供了患者在乳腺X線檢查時的年齡、放射科醫(yī)生根據(jù)乳房成像報告和數(shù)據(jù)系統(tǒng)量表進行的評估結(jié)果、乳腺癌家族史、是否使用激素治療、乳房密度、活檢史、癌癥類型以及體質(zhì)量指數(shù)等多項信息。BCSC認為所提供的數(shù)據(jù)樣本數(shù)量仍舊相對有限,為慎重起見,其建議研究者僅將這些數(shù)據(jù)用于教學和科研數(shù)據(jù)分析。

相關研究:Hinton等[13]使用從ImageNet初始化的權(quán)重進行深度學習網(wǎng)絡的遷移學習方法,對DMD中乳腺X線影像進行測試,確定了乳腺癌前狀態(tài)下X線影像中除乳房密度以外的信息,以預測罹患乳腺癌的概率。BCSC研究員Diana Miglioretti博士于2019年4月5日向乳腺成像學會發(fā)表了主題演講,談到了風險分層篩查的潛在益處,并對BCSC免費提供的風險計算器的作用給出了肯定評價[14]。同年,Mercan等[15]使用計算機視覺的方法對乳房活檢樣品進行分類并開發(fā)了自動圖像分析的輔助診斷系統(tǒng),將輔助診斷系統(tǒng)的性能與87位病理學家的解釋進行比較,得到了預期的效果,驗證了該輔助診斷系統(tǒng)能夠幫助病理學家診斷從良性到浸潤性癌癥的全范圍乳房活檢樣品。

數(shù)據(jù)共享利用:研究者可以通過BCSC網(wǎng)站的乳腺X線影像網(wǎng)址免費下載使用該數(shù)據(jù)集,使用時須包含數(shù)據(jù)引用說明[16],下載時需提交申請信息和使用說明獲得下載鏈接。網(wǎng)站還會將有關數(shù)據(jù)更新的通知通過電子郵件發(fā)送到研究者提供的注冊郵箱。此外,BCSC網(wǎng)站還提供了多種工具,如Bcsc Risk Calculator,可用于預測女性5年內(nèi)罹患浸潤性乳腺癌的風險;Basc Data Explorer,可用于幫助用戶檢索1994至2009年的BCSC數(shù)據(jù),包括乳房X線檢查和其他乳房成像檢查表格和圖表。

乳腺癌磁共振數(shù)據(jù)集

QIN Breast DCE-MRI

數(shù)據(jù)集基本情況:QIN Breast DCE-MRI數(shù)據(jù)集由俄勒岡健康與科學大學PI Wei Huang博士提供,該數(shù)據(jù)集主要收集了縱向研究的影像資料,以評估乳腺癌對新輔助化療的反應。

數(shù)據(jù)基本信息:QIN Breast DCE-MRI數(shù)據(jù)集包含672個序列,共計76 328張乳腺癌影像圖片。所有影像圖片由西門子3T TIM Trio系統(tǒng)采集。該數(shù)據(jù)集主要包括10例病例在4個時間點(治療開始之前、第1個治療周期之后、治療過程的中點、完成治療之后)的核磁共振影像資料,共提供了DICOM+NIFTI、Matlab兩種版本格式的數(shù)據(jù)。

相關研究:Nowaková等[17]提出了一種模糊圖像檢索的新方法,使用QIN Breast DCE-MRI數(shù)據(jù)集進行測試,解決了不能捕獲圖像中ROI的問題。Weis 等[18]使用QIN Breast DCE-MRI數(shù)據(jù)集建模,以預測乳腺癌患者第一個治療周期后是否能達到病理完全緩解。

數(shù)據(jù)共享利用:QIN Breast DCE-MRI數(shù)據(jù)集保存于TCIA(The Cancer Imaging Archive),研究者可以通過訪問維基癌癥影像檔案網(wǎng)[19]免費下載使用。TCIA提供了更高級的搜索、瀏覽和過濾功能,以選擇圖像子集或從滿足搜索條件的多個集合中下載圖像。如果研究者使用此數(shù)據(jù)集,須包含數(shù)據(jù)引用[20]。

Breast-MRI-NACT-Pilot

數(shù)據(jù)集基本情況:Breast-MRI-NACT-Pilot數(shù)據(jù)集由加州大學舊金山分校的David Newitt博士和Nola Hylton博士提供。該數(shù)據(jù)集來源于加州大學舊金山分校乳腺成像研究項目,由美國國家癌癥研究所提供資助。

數(shù)據(jù)基本信息:Breast-MRI-NACT-Pilot數(shù)據(jù)集收集了包括64例接受新輔助化療治療浸潤性乳腺癌患者的縱向研究影像,共包含2228個序列,共計99 058張乳腺癌影像圖片。每個病例包括患者年齡、病變特征等。病變特征的具體內(nèi)容有腫瘤大小、組織類型、病理類型、腫瘤亞型和是否有淋巴結(jié)受侵。

相關研究:Jones 等[21]針對乳腺腫瘤周圍存在的異常基質(zhì)組織可能增加局部復發(fā)風險的問題,提出了一種新的成像方法,并利用該數(shù)據(jù)集中的病例進行測試,得出可以通過動態(tài)對比增強磁共振定量腫瘤周圍基質(zhì)組織表征的結(jié)論。Natsheh等[22]為多幀DICOM醫(yī)學圖像提供了一種簡單有效的像素數(shù)據(jù)加密方法,通過在Breast-MRI-NACT-Pilot數(shù)據(jù)集上進行測試,驗證了所提出的方法能夠縮短加密和解密時間,降低了網(wǎng)絡傳輸醫(yī)療圖像的安全風險。2019年,Samala等[23]提出了一種均質(zhì)化的方法用于減少不同成像方案和掃描儀對核磁共振影像的影響,并在Breast-MRI-NACT-Pilot數(shù)據(jù)集中得到了驗證。

數(shù)據(jù)共享利用:Breast-MRI-NACT-Pilot數(shù)據(jù)集保存于TCIA,研究者可以訪問維基癌癥影像檔案網(wǎng)[24]免費下載使用,該網(wǎng)站上還附有數(shù)據(jù)集的詳細說明及下載鏈接。如果研究者使用Breast DCE-MRI數(shù)據(jù)集,須包含數(shù)據(jù)引用[25]。

國外公開乳腺數(shù)據(jù)集的特點對我國醫(yī)療數(shù)據(jù)開放的啟示

相對于國外公開的乳腺癌影像數(shù)據(jù)集,我國公開的乳腺癌影像數(shù)據(jù)集極為匱乏。醫(yī)療數(shù)據(jù)共享程度的偏低一定程度上影響了以計算機視覺技術(shù)為代表的、能夠提高醫(yī)療健康服務效率和質(zhì)量的新技術(shù)在醫(yī)療領域的快速發(fā)展和應用。同時,我國乳腺癌數(shù)據(jù)集開放的現(xiàn)狀只是醫(yī)療健康大數(shù)據(jù)開放共享力度不足的一個縮影。受制度保障體系、建設理念先進性、技術(shù)開發(fā)水平或其他方面的影響,國內(nèi)醫(yī)療健康領域科學數(shù)據(jù)共享平臺的數(shù)據(jù)集成度和開放共享程度仍十分有限[26]。

現(xiàn)以國內(nèi)外乳腺癌數(shù)據(jù)集開放共享現(xiàn)狀調(diào)研視角,結(jié)合國外醫(yī)療數(shù)據(jù)共享利用的經(jīng)驗與不足,針對目前我國醫(yī)療健康大數(shù)據(jù)的共享利用提出以下幾點建議。

(1)完善相關政策,提高共享水平。國外公開的乳腺癌數(shù)據(jù)集大多可以免費申請使用,研究人員可以便捷地獲取高質(zhì)量數(shù)據(jù)。對比歐美發(fā)達國家對科學數(shù)據(jù)等信息資源的重視和管理,我國一直缺少國家層面的制度保障。中華人民共和國科學技術(shù)部基礎司司長葉玉江和中國科學院地理與資源研究所研究員孫九林曾指出我國科學數(shù)據(jù)的管理與應用存在著明顯不足,特別是許多高價值的科學數(shù)據(jù)并未在國內(nèi)得到充分的共享和使用就流向國外[27]。推動數(shù)據(jù)的共享利用,核心是要通過全國人大立法,建立數(shù)據(jù)開放標準、界定數(shù)據(jù)開放邊界,需要建立切實有效的數(shù)據(jù)開放共享法制基礎。雖然我國目前尚無全國人大及其常委會審議通過的數(shù)據(jù)共享方面的法律頒布,但國家、地方已有一些法規(guī)、規(guī)章頒布實施。2018年我國印發(fā)了《科學數(shù)據(jù)管理辦法》(以下簡稱《辦法》),旨在進一步加強和規(guī)范科學數(shù)據(jù)管理,保障科學數(shù)據(jù)安全,提高開放共享水平,以更好地為國家科技創(chuàng)新、經(jīng)濟社會發(fā)展和國家安全提供支撐?!掇k法》首次站在國家高度、面向多領域科學數(shù)據(jù),提出以開放為主的指導原則,其貫徹落實仍需多年探索積累。此外,基于現(xiàn)有的科學體系和數(shù)據(jù)資源量,數(shù)據(jù)政策宏觀管理體系尚待擴展,科學數(shù)據(jù)開放共享整體水平仍需提升,分散于各研究機構(gòu)的數(shù)據(jù)孤島仍客觀存在。目前,對于數(shù)據(jù)共享的具體實踐和實務操作,仍有待主管部門根據(jù)《辦法》第32條規(guī)定制定具體實施細則。同年,中華人民共和國國家衛(wèi)生健康委員會發(fā)布了《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務管理辦法(試行)》(以下簡稱《管理辦法(試行)》),進一步明確了各級衛(wèi)生健康行政部門、醫(yī)療衛(wèi)生機構(gòu)、相關應用單位及個人在健康醫(yī)療大數(shù)據(jù)標準管理、安全管理、服務管理中的責權(quán)利,雖然《管理辦法(試行)》中仍有不少問題尚待進一步明確,但其對于統(tǒng)籌標準管理、落實安全責任、規(guī)范數(shù)據(jù)服務管理等方面已經(jīng)有了明確的方向和要求。故在此基礎上,可通過進一步跟蹤《辦法》等文件實施情況,及時提煉總結(jié)文件在試行過程中出現(xiàn)的問題和經(jīng)驗,完善健康醫(yī)療大數(shù)據(jù)的標準管理、安全管理和服務管理,促進健康醫(yī)療大數(shù)據(jù)規(guī)范有序發(fā)展來提高醫(yī)療數(shù)據(jù)的共享。

(2)建立健全醫(yī)療數(shù)據(jù)隱私標準。健全的醫(yī)療數(shù)據(jù)隱私保護標準是實現(xiàn)數(shù)據(jù)開放共享的基礎與前提。隨著歐盟《一般數(shù)據(jù)保護條例》的生效,歐洲范圍內(nèi)建立起了一套在隱私管理、個人信息安全保護和數(shù)據(jù)流動之間的復合機制。《一般數(shù)據(jù)保護條例》之后,越來越多的國家開始聚焦自身隱私安全問題,我國也不例外。我國正在快速推進隱私保護工作?!吨腥A人民共和國網(wǎng)絡安全法》(以下簡稱《網(wǎng)絡安全法》)于2017年6月1日起實施,其包含一個全局性的框架,旨在監(jiān)管網(wǎng)絡安全、保護個人隱私和敏感信息以及維護國家網(wǎng)絡空間主權(quán)安全。雖然《網(wǎng)絡安全法》已經(jīng)通過并得以施行,但由于部分要求模棱兩可,定義也比較寬泛,在其使用方面仍存在不確定性。2018年5月我國正式實施了《信息安全技術(shù)個人信息安全規(guī)范》(以下簡稱《規(guī)范》),目的是規(guī)范個人信息控制者在收集、保存、使用、共享、轉(zhuǎn)讓、公開披露等信息處理環(huán)節(jié)中的相關行為,旨在遏制個人信息非法收集、濫用、泄漏等亂象,最大程度地保障個人的合法權(quán)益和社會公共利益。但該《規(guī)范》為推薦性標準而非強制性標準,不具備法律強制力,在對信息主體的個人信息保護力度上遠遠不夠。因此,根據(jù)國際醫(yī)學研究標準和我國國情,仍應進一步在立法層面上制定相應的數(shù)據(jù)安全規(guī)范、責任規(guī)范、數(shù)據(jù)審計制度,建立統(tǒng)一的數(shù)據(jù)脫敏標準,確保數(shù)據(jù)存儲、傳輸、使用過程中符合規(guī)定,落實隱私泄露等責任問題,規(guī)范數(shù)據(jù)開放共享中的審核過程,不斷完善隱私保護法律體系。

(3)加強數(shù)據(jù)的集成融合。國外公開的乳腺癌數(shù)據(jù)集有很高的數(shù)據(jù)集成度,MIAS數(shù)據(jù)集、Breast-MRI-NACT-Pilot數(shù)據(jù)集、DDSM、Breast-MRI-NACT-Pilot都提供了患者的病例信息和影像數(shù)據(jù),但提供的數(shù)據(jù)存在一些不足,如MIAS數(shù)據(jù)集提供了322個影像數(shù)據(jù),由于數(shù)量較少不能夠用于深度學習的訓練集,會造成欠擬合現(xiàn)象。各個數(shù)據(jù)集都將分散的數(shù)據(jù)進行整合、統(tǒng)一、集中管理,有利于科研人員有針對性地進行數(shù)據(jù)的分析與挖掘。我國現(xiàn)階段的醫(yī)療環(huán)境中,充斥著大量分布式的異構(gòu)數(shù)據(jù)、信息、儀器設備和系統(tǒng),為醫(yī)療信息的表達、存儲、交換、共享、系統(tǒng)協(xié)同工作帶來了諸多障礙。以市場需求為導向,根據(jù)需求整合醫(yī)療健康數(shù)據(jù)資源[28],研究構(gòu)建適用于醫(yī)學研究的關聯(lián)數(shù)據(jù)表述、組織與整合的標準化體系,加強多類型數(shù)據(jù)集成融合,不斷增加數(shù)據(jù)模態(tài),為研究人員提供便捷的數(shù)據(jù)檢索與共享服務,提供多維、動態(tài)、多層次的數(shù)據(jù)管理、分析和應用的技術(shù)平臺與環(huán)境,并且制作相關數(shù)據(jù)產(chǎn)品有利于數(shù)據(jù)的管理與使用,以提高數(shù)據(jù)的使用效率及價值。

(4)建立和制定數(shù)據(jù)集標注的標準和規(guī)范。數(shù)據(jù)集標注質(zhì)量良莠不齊是制約數(shù)據(jù)開放共享的一個重要原因?,F(xiàn)階段數(shù)據(jù)標注主要依靠人力完成,而當前國內(nèi)數(shù)據(jù)標注行業(yè)正在起步階段,行業(yè)準入、門檻標準、人員素質(zhì)、數(shù)據(jù)安全等問題迫切需要加強規(guī)范。一方面需要較完善的標注流程和規(guī)范進行質(zhì)量控制,另一方面需要建立完善的從業(yè)資格審核機制,并從行業(yè)發(fā)展、標注規(guī)范、業(yè)務標準、數(shù)據(jù)安全、保密規(guī)則等方面對標注人員做培訓以引導行業(yè)人員各方面素質(zhì)的提高。如以國家相關部門牽頭,聯(lián)合一些數(shù)據(jù)標注公司和互聯(lián)網(wǎng)巨頭參與,提供專項資金,共同做好數(shù)據(jù)標注工作,開發(fā)半自動標注工具等。

(5)探索和創(chuàng)新多機構(gòu)合作機制。國外公開乳腺數(shù)據(jù)集的創(chuàng)建多在國家相關醫(yī)療研究機構(gòu)的資助下,由醫(yī)院、大學和學術(shù)機構(gòu)等合作完成。贊助者除了政府機構(gòu),也有個人或制藥公司、學術(shù)機構(gòu)、私人組織或其他組織進行的聯(lián)合研究??梢越梃b吸收國外乳腺癌數(shù)據(jù)集的建設管理經(jīng)驗,以項目為牽引,探索不同地域、不同性質(zhì)機構(gòu)間數(shù)據(jù)共享利用的合作機制,創(chuàng)新合作模式,嘗試建立不同疾病領域國際一流、國內(nèi)領先的醫(yī)療數(shù)據(jù)集共享平臺。

(6)推進跨區(qū)域協(xié)同。政府數(shù)據(jù)資源是大數(shù)據(jù)資源的重要組成部分,其基于公共事務管理和服務采集與產(chǎn)生,具有較強的公信力,甚至可能是唯一的數(shù)據(jù)來源。國務院辦公廳印發(fā)的《進一步深化“互聯(lián)網(wǎng)+政務服務”推進政務服務“一網(wǎng)、一門、一次”改革實施方案》已明確提出要建立完善全國數(shù)據(jù)共享交換體系。除了政府部門內(nèi)部的互聯(lián)互通,還需要在一些領域建立政府與企業(yè)數(shù)據(jù)的互聯(lián)互通,從而為電子政務和數(shù)字經(jīng)濟并駕齊驅(qū)創(chuàng)造良好的條件。正如習近平總書記所強調(diào)的:“要加強政企合作、多方參與,加快公共服務領域數(shù)據(jù)集中和共享,推進同企業(yè)積累的社會數(shù)據(jù)進行平臺對接?!痹谥泄仓醒胝尉志蛥^(qū)塊鏈技術(shù)發(fā)展現(xiàn)狀和趨勢進行第十八次集體學習中,習近平總書記指出,要抓住區(qū)塊鏈技術(shù)融合、功能拓展、產(chǎn)業(yè)細分的契機,發(fā)揮區(qū)塊鏈在促進數(shù)據(jù)共享、優(yōu)化業(yè)務流程、降低運營成本、提升協(xié)同效率、建設可信體系等方面的作用。區(qū)塊鏈技術(shù)為跨地區(qū)、跨部門和跨層級的數(shù)據(jù)交換和信息共享提供了可能,其技術(shù)特征有利于建立政府部門之間的信任和共識,在確保數(shù)據(jù)安全的同時促進政府數(shù)據(jù)跨界共享。總之,在跨區(qū)域政策協(xié)同、利益補償分配等重點領域進行政策創(chuàng)新,推進跨區(qū)域數(shù)據(jù)資源、專家資源共享,同時要推進協(xié)同監(jiān)管、大數(shù)據(jù)協(xié)作,以深化數(shù)據(jù)等資源共享。

(7)完善和豐富多樣化、精準化數(shù)據(jù)服務。國外公開的乳腺癌數(shù)據(jù)集除相關數(shù)據(jù)外,還提供一系列服務和工具供研究人員使用,如數(shù)據(jù)檢索工具、數(shù)據(jù)處理工具等,為用戶創(chuàng)造了良好的科研與工作環(huán)境。除數(shù)據(jù)檢索外,可借鑒國外醫(yī)療影像數(shù)據(jù)庫的管理服務理念,針對不同的數(shù)據(jù)庫建設特點提供多元化的數(shù)據(jù)統(tǒng)計與挖掘服務,并從中探索多樣化的數(shù)據(jù)管理服務模式,從而為研究人員利用數(shù)據(jù)提供便利?;谟脩粜袨榇髷?shù)據(jù)分析,為研究人員提供精準化的信息推送服務,持續(xù)提高醫(yī)學研究人員的信息獲取效率。

綜上,我國醫(yī)療健康大數(shù)據(jù)的開放共享應從各方面著手,加快推動立法保障,不斷完善監(jiān)管制度和技術(shù)方法,逐步提高開放共享程度,全面提升數(shù)據(jù)質(zhì)量和應用環(huán)境,為醫(yī)療健康領域的發(fā)展提供高質(zhì)量的數(shù)據(jù)支撐和研究基礎。

猜你喜歡
乳腺乳腺癌醫(yī)療
絕經(jīng)了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
體檢查出乳腺增生或結(jié)節(jié),該怎么辦
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
得了乳腺增生,要怎么辦?
媽媽寶寶(2017年2期)2017-02-21 01:21:22
京張醫(yī)療聯(lián)合的成功之路
我們怎樣理解醫(yī)療創(chuàng)新
醫(yī)療扶貧至關重要
容易誤診的高回聲型乳腺病變
榆林市| 阜阳市| 友谊县| 黑龙江省| 安福县| 晋宁县| 额尔古纳市| 门源| 阿城市| 盐津县| 遂昌县| 秭归县| 壶关县| 延庆县| 莱阳市| 镇康县| 焉耆| 白城市| 扶沟县| 宜昌市| 衢州市| 和顺县| 阿合奇县| 辽阳市| 澜沧| 泾阳县| 兴宁市| 开鲁县| 营山县| 青岛市| 北川| 清丰县| 呼图壁县| 肇东市| 建宁县| 赤水市| 高平市| 内黄县| 阳新县| 合肥市| 金山区|