李 偉 孫學會 徐 萍 陳興棟 王 玥 許 麗**,
(1.中國科學院上海生命科學信息中心,中國科學院上海營養(yǎng)與健康研究所,上海 200031;2.復旦大學生命科學學院,上海 200433;3.復旦大學人類表型組研究院,上海 201203;4.復旦大學泰州健康科學研究院,泰州 225316)
美國All of Us隊列項目(All of Us Research Program,AoURP)是美國精準醫(yī)學計劃(Precision Medicine Initiative,PMI)重點布局的任務[1],目標是建立至少包含100萬美國居民的國家級大型隊列,以深入研究影響健康與疾病的遺傳、社會和環(huán)境因素。為體現(xiàn)項目的包容性與開放性,該項目名稱于2016年10月由美國精準醫(yī)學計劃隊列項目(PMI Cohort Program,PMI-CP)更改為美國 All of Us隊列項目,即美國全民隊列項目,旨在鼓勵全民參與、實現(xiàn)全民受益[2]。美國All of Us隊列項目于2015年開始籌備,2018年開始在全美全面實施,并計劃跟蹤隨訪數(shù)十年(圖1)。截至2021年初,該項目已招募約27.6萬名核心參與者(指已同意參與,并完成健康狀況問卷調(diào)查、授權(quán)共享電子健康記錄、進行體格檢查測量、并提供至少一項生物樣本等初始步驟的參與者),預計到2024年達到招募100萬名核心參與者的目標[3]。該隊列采取邊建設、邊應用的策略,目前已開放共享部分數(shù)據(jù)[4]。
圖1 All of Us隊列項目發(fā)展進程Fig.1 Timeline of the All of Us Program[4,5]
美國All of Us隊列項目是由美國政府主導建設、一體化組織和管理的大型隊列,其規(guī)劃設計完善,研究對象的選擇更注重人群的廣覆蓋和多樣性,采集資源類型更全面、豐富、精細,通過統(tǒng)一規(guī)范管理保證隊列資源的標準化、規(guī)范化和系統(tǒng)化,并充分利用前沿技術、構(gòu)建完善法律體系實現(xiàn)數(shù)據(jù)安全與開放共享等。本文從組織管理視角出發(fā),對美國All of Us隊列項目的前期規(guī)劃設計、組織與管理、經(jīng)費保障機制進行了梳理,并詳細分析了該隊列建設中的招募方式、資源采集、數(shù)據(jù)管理、數(shù)據(jù)安全與隱私保護、數(shù)據(jù)共享策略等方面,總結(jié)了該隊列建設的特點與經(jīng)驗,以期為大型隊列建設提供參考。
美國All of Us隊列項目提出之初,美國國立衛(wèi)生研究院(National Institutes of Health,NIH)即組建了“精準醫(yī)學計劃”院長咨詢專家委員會工作組,對項目進行充分論證,并制定詳細實施方案。工作組先后組織了4次研討會、2次公眾意見征集、以及多次現(xiàn)場會議和電話會議,與領域?qū)<?、政府機構(gòu)及商業(yè)組織進行磋商,廣泛征集利益相關者的意見,最終于2015年9月發(fā)布了名為《精準醫(yī)學隊列項目——建立21世紀醫(yī)學研究基礎》的項目規(guī)劃報告(圖1),闡釋了招募100萬人群目標設定的科學依據(jù),提出了隊列建設的管理機制、組織模式、招募路徑、政策體系,生物樣本和數(shù)據(jù)資源的采集、存儲與管理方式等,確立了項目實施的路線圖[6]。
同時,All of Us隊列項目還經(jīng)過嚴謹?shù)脑囘\行與預研,建立了統(tǒng)一的標準和規(guī)范的工作流程,以保證數(shù)據(jù)采集質(zhì)量和隊列建設的標準化、規(guī)范化。All of Us隊列項目完成初期籌備后,2016年8月開始招募5000名參與者啟動先導試驗,開展基礎設施建設,進行工作流程設計。2017年5月,All of Us隊列項目啟動參與者招募工作,并開展為期一年的試點項目,測試和改進工作流程。2018年5月,試點項目完成,共招募到2.7萬余名核心參與者,隨后All of Us隊列項目開始正式面向全美居民招募參與者,進入全面建設階段。
美國All of Us隊列項目建立了一體化的組織管理體系,以協(xié)調(diào)各機構(gòu)的有效合作,推動大型隊列的穩(wěn)定有序運行。All of Us隊列項目由NIH集中管理與協(xié)調(diào),NIH主任統(tǒng)籌領導,并任命項目首席執(zhí)行官負責具體事宜。項目首席執(zhí)行官負責項目的籌資、決策與協(xié)調(diào),并領導其下設的指導委員會、執(zhí)行委員會、項目辦公室、機構(gòu)審查委員會等開展具體管理工作(圖2)[7,8]。
圖2 All of Us隊列項目的管理體系[7,8]Fig.2 Governance Structure of All of Us Research Program[7,8]
其中,指導委員會負責擬定All of Us隊列項目的戰(zhàn)略方向,審查項目運作中的相關規(guī)劃,監(jiān)督項目實施過程及相關協(xié)調(diào)工作等,通過設立一系列子委員會和子理事會進行全方位監(jiān)督。指導委員會的部分成員組成了執(zhí)行委員會,協(xié)助項目首席執(zhí)行官作出相應決策以應對項目面臨的挑戰(zhàn)和障礙。此外,項目辦公室負責項目規(guī)劃和運營,且為確保All of Us隊列項目運行過程的專業(yè)性,項目首席執(zhí)行官還根據(jù)具體研究項目所屬領域來選擇相應專家建立顧問小組,負責新資助計劃審批、研究項目評估等,從而就All of Us隊列項目的愿景、科學目標和運營提供外部監(jiān)督和專家建議。同時,All of Us隊列項目重視參與者權(quán)益與參與度,一方面設置了負責統(tǒng)一監(jiān)督、保護研究參與者權(quán)益的機構(gòu)審查委員會,負責審查項目的研究方案、知情同意書以及其他針對參與者的材料;另一方面,通過引入?yún)⑴c者代表在All of Us隊列項目的多個管理機構(gòu)任職,輔助隊列項目的設計、實施和管理,實現(xiàn)參與者的深度參與。除以上管理部門外,All of Us隊列項目還通過成立跨NIH聯(lián)絡協(xié)調(diào)組與NIH下屬的其他研究所、中心及各辦公室進行溝通,協(xié)調(diào)項目的實施。
在實際運行方面,All of Us隊列項目依托全美100余家醫(yī)療機構(gòu)、研究所、高校、企業(yè)、社區(qū)等各類組織和機構(gòu)負責具體實施。All of Us隊列項目在全美建立了340余個招募站點(Recruitment Sites)開展參與者招募及資源采集工作,并設立參與者中心(Participant Center)統(tǒng)籌協(xié)調(diào)招募過程、維持參與者的長期穩(wěn)定參與。All of Us隊列項目還建立了中央生物樣本庫(Biobank)、數(shù)據(jù)與研究中心(Data and Research Center),對海量生物樣本和數(shù)據(jù)資源進行統(tǒng)一管理。同時,All of Us隊列資助美國貝勒醫(yī)學院、麻省理工學院-哈佛大學博德研究所、華盛頓大學西北基因組學中心以及阿爾法生物技術研究所建立4個基因組研究中心(Genome Centers),對生物樣本進行基因組測序和分析。
充足的經(jīng)費來源是大型隊列得以順利建設和運行的有效保障,All of Us隊列項目經(jīng)費主要由政府提供,并通過立法確保了長期穩(wěn)定支持。
美國投入了2.15億美元支持精準醫(yī)學計劃的啟動,其中60%的經(jīng)費(1.3億美元)用于支持All of Us隊列項目。此后,在2016年通過的《21世紀治愈法案》[9]中提出,在 10年(FY2017-FY2026)內(nèi)將為All of Us隊列項目撥款14.55億美元,以確保項目獲得長期穩(wěn)定的經(jīng)費支持。綜合來看,All of Us隊列項目經(jīng)費一方面來源于NIH依據(jù)《21世紀治愈法案》設立的創(chuàng)新基金(NIH Innovation CURES Act funds),另一方面來源于NIH院長辦公室共同基金(OD Common Fund)和其他基金(Other OD Funds)提供的經(jīng)費支持。截至2020年,美國政府為All of Us隊列項目撥款總額已達15.26億美元(表1),而2021財年預算為其申請的資助經(jīng)費為4.36億美元[10]。
表1 All of Us隊列項目獲得的執(zhí)行經(jīng)費[10]Tab.1 Operating Funds of All of Us Research Program[10]
為保障參與者隱私與數(shù)據(jù)安全,在All of Us隊列項目啟動之初,美國白宮即成立跨機構(gòu)工作組,參考美國國家標準與技術研究所(National Institute of Standards and Technology,NIST)的“網(wǎng)絡安全框架”(Cybersecurity Framework)制定了《精準醫(yī)學計劃:隱私和信任原則》[11]和《精準醫(yī)學計劃:數(shù)據(jù)安全政策原則與框架》[12]。All of Us隊列項目依據(jù)這兩項原則和政策指導相關活動和決策,具體措施如:1)采用問責制,開展獨立、持續(xù)的倫理審查;2)在識別和解決數(shù)據(jù)安全風險時以“參與者至上”為導向,數(shù)據(jù)管理全流程對參與者透明;3)在安全、加密的平臺上處理、存儲和共享數(shù)據(jù),且定時審核并測試其安全性和穩(wěn)定性;4)參與者數(shù)據(jù)去除個人信息標簽,并進一步適當模糊參與者數(shù)據(jù);5)數(shù)據(jù)按照保密級別進行分層級儲存、訪問和使用;6)用戶注冊訪問及受控訪問前,接受安全培訓并簽署《數(shù)據(jù)用戶行為準則》(Data User Code of Conduct,DUCC)是美國范德堡大學醫(yī)學中心和All of Us隊列項目數(shù)據(jù)授權(quán)用戶之間的協(xié)議,數(shù)據(jù)用戶必須簽署DUCC才能訪問和使用注冊層級和受控層級數(shù)據(jù))。
All of Us隊列項目于2018年5月10日正式面向全美開放,各執(zhí)行部門和招募站點采用統(tǒng)一的標準和規(guī)范化工作流程[13]開展參與者招募、生物樣本與數(shù)據(jù)資源采集、存儲和管理(圖3)。
圖3 All of us隊列項目建設和運行的工作流程[4,13]Fig.3 Workflow for Constructing and Operating the All of Us Research Program[4,13]
All of Us隊列項目強調(diào)全民參與,招募全美范圍內(nèi)不同地區(qū)、種族和社會經(jīng)濟層次的有完全行為能力的成年人。其招募對象為自然人群,即不限制特定疾病或健康狀況,并優(yōu)先招募既往生物醫(yī)學研究上代表性不足(Underrepresented in Biomedical Research,UBR)的人群。
為實現(xiàn)人群的廣覆蓋,All of Us隊列項目采取與HPO合作和直接志愿者自愿加入兩種途徑進行招募(圖4)。其中,依托HPO招募是主要的招募方式,該途徑依托社區(qū)衛(wèi)生中心、區(qū)域性醫(yī)院和退伍軍人事務部醫(yī)療中心等醫(yī)療機構(gòu),通過HPO招募站點進行招募,此方式可提高招募效率、降低隨訪難度和失訪率,保障參與者的長期參與;直接志愿者招募則通過社區(qū)宣傳等方式進行招募,由直接志愿者以個人方式通過參與者中心直接注冊參與,并在直接志愿者合作站點進行生物樣本和數(shù)據(jù)采集,這種方式有利于招募醫(yī)療服務可及性較低的人群。目前,該項目基于HPO網(wǎng)絡以及指定的診所、血庫、實驗室或醫(yī)療機構(gòu)建立了340余個站點,參與者可到各招募站點或自行通過項目網(wǎng)站、手機應用程序等方式在線完成注冊、基線健康調(diào)查及EHR共享授權(quán)等步驟,通過健康調(diào)查評估后再前往相應招募站點進行生物樣本和數(shù)據(jù)采集(圖4)。
圖4 All of Us隊列項目參與者招募、生物樣本和數(shù)據(jù)采集的途徑Fig.4 Pathway of Participant Recruitment,Biospecimen and Data Collection in All of Us Research Program
All of Us隊列項目采集的數(shù)據(jù)類型更加全面和豐富,為研究基因、行為和環(huán)境三者相互作用與健康的相關性,實現(xiàn)生物醫(yī)學研究目標提供堅實數(shù)據(jù)基礎。
All of Us隊列項目目前采集的數(shù)據(jù)和樣本資源類型包括基本健康調(diào)查數(shù)據(jù)、體格檢查數(shù)據(jù)、生物樣本、EHR以及數(shù)字化健康數(shù)據(jù)(可穿戴設備數(shù)據(jù))等,并逐步加入全基因組測序數(shù)據(jù)、醫(yī)療理賠數(shù)據(jù)、以及環(huán)境暴露數(shù)據(jù)甚至社交網(wǎng)絡信息等更多樣化的數(shù)據(jù)(表2)。該項目將開展長達十年甚至數(shù)十年的長期隨訪監(jiān)測,通過關聯(lián)EHR、醫(yī)療理賠數(shù)據(jù)等方式持續(xù)跟蹤采集動態(tài)的健康數(shù)據(jù),還將邀請參與者就具體研究目的有針對性的提供相關生物樣本和數(shù)據(jù)。
表2 All of Us隊列項目數(shù)據(jù)采集類型和來源[4]Tab.2 Data Categories and Data Sources of All of Us Research Program[4]
All of Us隊列項目依托梅奧診所(Mayo Clinic)和美國范德堡大學醫(yī)學中心等,建立了國家級中央生物樣本庫、數(shù)據(jù)與研究中心,對海量生物樣本和數(shù)據(jù)資源進行統(tǒng)一管理。
3.3.1 生物樣本集中存儲及分析
All of Us隊列項目依托梅奧診所建立了兩個生物樣本庫:主庫和第二生物樣本庫,存儲在主生物樣本庫中約25%的樣本擁有備份,存儲在第二生物樣本庫中。各招募站點通過標準操作流程,使用統(tǒng)一供應的試劑盒采集參與者的生物樣本,運送至主生物樣本庫進行集中存儲和分析[13]。之后,生物樣本經(jīng)基因組中心、臨床分析實驗室(Clinical Validation Laboratory,CVL)等部門進行測序、分析,產(chǎn)生的數(shù)據(jù)傳輸至All of Us數(shù)據(jù)與研究中心進行管理(圖5)。形成的分析報告通過遺傳咨詢資源(Genetic Counseling Resource,GCR)服務部門反饋給參與者[14]。
圖5 All of Us隊列項目遺傳分析及遺傳結(jié)果反饋流程[14]Fig.5 Workflow for Genomic Data Generation and Return of Genetic Results in All of Us Research Program[14]
3.3.2 生物數(shù)據(jù)分層級存儲和管理
隊列研究的數(shù)據(jù)來源復雜、類型豐富,需進行規(guī)范化的數(shù)據(jù)處理和完善后,再進行數(shù)據(jù)存儲和共享(圖6)。如,All of Us隊列項目采用“觀察性醫(yī)療成果合作方的通用數(shù)據(jù)模型”(OMOP Common Data Model)基礎結(jié)構(gòu)對EHR源數(shù)據(jù)進行標準化處理,隨后再進行數(shù)據(jù)核查、清洗和質(zhì)量控制,以及多源異構(gòu)數(shù)據(jù)的分析和整合,再存儲到標準數(shù)據(jù)庫中,以支持后續(xù)的數(shù)據(jù)挖掘及綜合分析。
圖6 All of Us隊列項目數(shù)據(jù)處理、存儲及共享過程Fig.6 Data Processing,Storing and Sharing Procedure in All of Us Research Program
另外,All of Us數(shù)據(jù)與研究中心利用區(qū)塊鏈技術等建立了安全的云環(huán)境,對數(shù)據(jù)進行云存儲與云共享,并通過個人信息去標識化、分層級存儲和訪問數(shù)據(jù)等措施,以有效保護參與者隱私與數(shù)據(jù)安全。All of Us隊列項目依據(jù)可開放程度,將數(shù)據(jù)分別存入公共級別和注冊級別兩個獨立數(shù)據(jù)存儲庫中,其中,公眾可通過公共數(shù)據(jù)瀏覽器(Data Browser)和數(shù)據(jù)快照(Data Snapshots)等[15]在線瀏覽部分安全級別較低的數(shù)據(jù)集,如反映參與者總體情況的數(shù)據(jù);對于更高安全級別的數(shù)據(jù)集及去除個人信息的個體數(shù)據(jù),研究人員可通過“數(shù)據(jù)通行證模式”(Data Passport Model)獲得數(shù)據(jù)訪問授權(quán),利用研究者工作平臺(Researcher Workbench)[16]在線訪問和使用[17]。
大型隊列儲備了大規(guī)模生物樣本和數(shù)據(jù)資源,為生物醫(yī)學研究和衛(wèi)生決策提供大量的科研基礎和資源支撐,其意義不斷凸顯,各國相關科技規(guī)劃也重點布局了大型隊列的建設與研究,但仍存在較多挑戰(zhàn)。因此,基于對美國All of Us隊列項目建設經(jīng)驗的分析,總結(jié)出以下特點,以期為大型隊列的建設與管理提供借鑒。
美國All of Us隊列項目是由美國政府主導建設的大型隊列,其頂層設計完善,組織相關領域?qū)<液蜋C構(gòu)進行了充分磋商與科學規(guī)劃,制定了科學可行的大型隊列建設與實施方案。其組織和管理上,建立了由NIH集中管理,協(xié)調(diào)全國各類組織和機構(gòu)共同實施的一體化組織和管理機制,充分調(diào)動和集合全國力量共同推動項目實施,提高了隊列建設的工作效率和可操作性;建立了以政府資助為主、鼓勵社會各界不同主體以資金投入和技術支持等方式參與的多元化資助機制,保障大型隊列可獲得長期穩(wěn)定的經(jīng)費支持,使其得以順利建設和運行。
在隊列建設和資源管理中,首先通過先導試驗和試點項目充分開展預研,進行工作流程設計、測試、改進和培訓,制定人群招募及數(shù)據(jù)和生物樣本資源采集、存儲、管理的統(tǒng)一規(guī)范和標準,再依托各地組織和機構(gòu)設置多個招募站點,采用規(guī)范化流程和標準進行隊列建設,確保實施流程的順暢和統(tǒng)一規(guī)范。同時,在生物樣本和數(shù)據(jù)資源管理上,建立國家級中央生物樣本庫和數(shù)據(jù)庫,采用中心化模式進行集中存儲及科學管理,并在各環(huán)節(jié)進行嚴格的質(zhì)控、清洗和標準化處理,可有效保證隊列資源的標準化、規(guī)范化和系統(tǒng)化。
隊列建設及運行中,其研究人群的招募既依托現(xiàn)有的醫(yī)療體系,又設計個人直接參與方式,保證招募人群的廣覆蓋、多樣性,以及隨訪的高應答率;同時,充分利用國家完善的EHR系統(tǒng)及個人智能穿戴設備,高效整合大量綜合醫(yī)療記錄、主動隨訪個體健康狀況,并通過加強同醫(yī)療、醫(yī)保系統(tǒng)、隊列參與者和公眾互動,極大的降低研究對象的數(shù)據(jù)采集、長期隨訪監(jiān)測以及隨后開展臨床試驗的難度。
在數(shù)據(jù)安全保護和開放共享上,一方面,充分利用大數(shù)據(jù)、區(qū)塊鏈、人工智能等技術,建立安全的云環(huán)境對海量生物樣本和數(shù)據(jù)資源進行云存儲、云訪問;另一方面,構(gòu)建完善的隱私保護和數(shù)據(jù)安全法規(guī)制度以及保護措施,采取去除個人身份識別信息等方式進行加密處理;同時,依據(jù)可開放程度對健康數(shù)據(jù)分層級存儲和訪問,公眾可瀏覽安全級別較低的數(shù)據(jù)集,科研人員可通過權(quán)限申請獲得更深層次的數(shù)據(jù)訪問權(quán),既保障了參與者隱私與數(shù)據(jù)安全,又盡可能廣泛地實現(xiàn)數(shù)據(jù)共享。