龔海,錢大雁,陳國強,許強
1.江陰市人民醫(yī)院,江蘇 江陰 214400;2.江陰市衛(wèi)生局,江蘇 江陰 214400
基于云存儲技術(shù)的區(qū)域PACS初探
龔海1,錢大雁2,陳國強1,許強1
1.江陰市人民醫(yī)院,江蘇 江陰 214400;2.江陰市衛(wèi)生局,江蘇 江陰 214400
本文介紹了云存儲的概念,分析了傳統(tǒng)存儲系統(tǒng)的不足,并詳細闡述了基于云存儲技術(shù)的區(qū)域圖片存檔及通信系統(tǒng)(Picture Archiving and Communication System,PACS)的特點、基本流程及其實現(xiàn)方式,該系統(tǒng)使得網(wǎng)絡(luò)中不同類型的存儲設(shè)備可通過應(yīng)用軟件協(xié)同工作,有效地提高了醫(yī)療服務(wù)質(zhì)量。
云存儲技術(shù);區(qū)域PACS;Hash法;管理服務(wù)器;存儲服務(wù)器;數(shù)據(jù)庫
我國在 2009 年 4 月啟動的新一輪醫(yī)療體制改革中,提出要建立實用共享的醫(yī)療衛(wèi)生信息系統(tǒng),以極力整合醫(yī)療資源。信息化的一個重要內(nèi)容就是要加速發(fā)展以居民健康檔案為基礎(chǔ)的區(qū)域衛(wèi)生信息化平臺。區(qū)域衛(wèi)生信息化系統(tǒng)具有數(shù)據(jù)量大、存儲周期長、實時性強、利用率高等特點,需要借助全新的技術(shù)平臺來實現(xiàn)。云存儲技術(shù)的出現(xiàn),為區(qū)域醫(yī)療信息化建設(shè)帶來了曙光。本文闡述了云存儲技術(shù)的發(fā)展優(yōu)勢和潛在能力,分析了新的技術(shù)環(huán)境下醫(yī)院區(qū)域圖片存檔及通信系統(tǒng)(Picture Archiving and Communication System,PACS)的建設(shè)需求,介紹了基于云存儲技術(shù)的PACS 的基本流程及實現(xiàn)方式,為醫(yī)學圖像的獲取、顯示、存儲、傳送和有效管理等問題提供了新的解決途徑。
醫(yī)學資源,特別是醫(yī)學影像數(shù)據(jù)存檔的集中存儲系統(tǒng)存在無法滿足高訪問量的問題,云存儲的出現(xiàn)為該問題的解決提供了新的方案。云存儲是在云計算概念上延伸和發(fā)展出來的,對 PACS 的實現(xiàn)非常重要。云存儲是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng),將網(wǎng)絡(luò)中不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的技術(shù)。云存儲系統(tǒng)是一個以數(shù)據(jù)存儲和管理為核心的云計算系統(tǒng):當需要對大量數(shù)據(jù)進行存儲和管理時,云計算系統(tǒng)就需要配置大量的存儲設(shè)備,那么云計算系統(tǒng)就轉(zhuǎn)變成了云存儲系統(tǒng)[1-4]。
傳統(tǒng)存儲系統(tǒng)由三部分組成:服務(wù)器、數(shù)據(jù)庫、存儲陣列。收到數(shù)據(jù)文件時,系統(tǒng)先將文件存儲的位置信息錄入數(shù)據(jù)庫,然后再將文件存儲到陣列中;讀取數(shù)據(jù)文件時,系統(tǒng)先從數(shù)據(jù)庫讀取文件位置,然后根據(jù)指定位置讀取數(shù)據(jù)文件。傳統(tǒng)存儲系統(tǒng)框架,見圖1。這種存儲系統(tǒng)存在以下缺點:
(1)隨著數(shù)據(jù)的增加,數(shù)據(jù)庫內(nèi)容也相應(yīng)增加,則訪問數(shù)據(jù)庫的速度也就越慢,數(shù)據(jù)文件的讀寫速度就越慢。
(2)系統(tǒng)的運行依賴個體設(shè)備性能,而隨著用戶的訪問量的增大,個體設(shè)備性能將無法滿足相應(yīng)需求。
(3)使用高配置的個體設(shè)備不利于系統(tǒng)的持續(xù)性能升級和數(shù)據(jù)量的擴容。
圖1 傳統(tǒng)存儲系統(tǒng)框架
3.1 特點
基于云存儲技術(shù)的區(qū)域 PACS 不使用高性能的單體設(shè)備和數(shù)據(jù)庫,而采用統(tǒng)一的普通 X86架構(gòu)的存儲服務(wù)器作為 數(shù) 據(jù) 的 載 體, 應(yīng) 用 Hash 法 來 構(gòu) 建 索 引 庫 和 文 件 庫[5-7]。接收到數(shù)據(jù)文件時,由管理服務(wù)器通過 Hash 策略將數(shù)據(jù)分散保存到各個存儲服務(wù)器上[8],然后將存儲服務(wù)器的位置信息記錄在管理服務(wù)器索引庫中;當客戶端讀取數(shù)據(jù)文件時,首先從索引庫中讀取存儲服務(wù)器位置信息,然后通過客戶端直接到存儲服務(wù)器中獲取數(shù)據(jù)。基于云存儲技術(shù)的區(qū)域 PACS 框架,見圖 2。該系統(tǒng)相對傳統(tǒng)存儲主要有以下優(yōu)點:
(1)通過 Hash 法構(gòu)建的索引庫和文件庫可以將數(shù)據(jù)均衡分散保存到各個存儲服務(wù)器中,使得數(shù)據(jù)的讀寫速度與數(shù)據(jù)量的大小無關(guān)。
(2)數(shù)據(jù)分散存儲使用戶的訪問也可以分散到各臺服務(wù)器,這樣就可以保證各服務(wù)器的處理相對均衡,使用普通的服務(wù)器就可以達到高效處理的目的。
(3)統(tǒng)一的服務(wù)器架構(gòu)可以方便的實現(xiàn)系統(tǒng)性能和數(shù)據(jù)量的升級,系統(tǒng)需要進行擴容的時候只需在原有基礎(chǔ)上追加服務(wù)器,無需調(diào)整原有環(huán)境。
(4)使用普通服務(wù)器可以大大降低數(shù)據(jù)中心的硬件成本。
圖2 基于云存儲技術(shù)的區(qū)域PACS框架
3.2 工作流程
(1)存儲流程。當管理服務(wù)收到需要存儲的數(shù)據(jù)文件時,采取 Hash 法將數(shù)據(jù)文件存儲任務(wù)分配給各存儲服務(wù)器,同時管理服務(wù)器記錄存儲服務(wù)器的索引信息,流程框架見圖3。
圖3 存儲流程框架
(2)讀取流程。當客戶端讀取數(shù)據(jù)文件時,首先從索引庫中讀取存儲服務(wù)器位置信息,然后由客戶端直接到存儲服務(wù)器中獲取相關(guān)數(shù)據(jù),具體框架見圖4。
圖4 讀取流程框架
3.3 分級存儲摸式的實現(xiàn)
(1)為了保證系統(tǒng)的正常運行,存儲服務(wù)器需要具有高效管理海量文件數(shù)據(jù)的能力,還要具備快速索引文件的能力。為了實現(xiàn)存儲服務(wù)器的高效管理及快速索引,應(yīng)用Hash 法來實現(xiàn)樹形結(jié)構(gòu)的文件、目錄的分散分級存儲摸式,具體框架見圖5。該存儲模式將圖像以檢查目錄為單位進行組織并進行分類,能夠保證在文件數(shù)量快速增加時,訪問速度不受任何影響。
圖5 分級存儲摸式框架
(2)將圖像以檢查目錄為單位進行組織并進行分類,并不能解決文件服務(wù)器海量數(shù)據(jù)存儲的問題。每天從設(shè)備上發(fā)送過來的數(shù)據(jù)巨大,不光是圖像數(shù)量多,檢查量也很大。如果將所有的檢查目錄放在同一級目錄下,隨著存放的數(shù)據(jù)量越來越多,檢查目錄有可能達到上百萬個或更多。這樣再強的操作系統(tǒng)也將無法對數(shù)據(jù)進行管理,更談不上高效存儲與索引了,較好的方法是用樹形結(jié)構(gòu)將他們分散到各級子目錄中,將各級子目錄的數(shù)據(jù)控制在一定數(shù)量內(nèi)(一般各種操作系統(tǒng)每一級目錄管理的文件或目錄數(shù)量最好<1000 個)。
對于醫(yī)學數(shù)據(jù)目錄的分級管理,多數(shù)情況下使用的方法有 :① 根據(jù)文件寫入服務(wù)器的時間來進行分組,如以年為單位作為1級目錄,年下面以月為單位作為2級目錄,月下面再以天為單位作為3級目錄,3級目錄下進行數(shù)據(jù)存儲檢查 ;② 在文件服務(wù)器上建立一個累加器,根據(jù)分級目錄存儲數(shù)據(jù)的大小進行控制。如果某一級存儲目錄數(shù)據(jù)超過了累加器控制范圍,系統(tǒng)會自動新建一個新目錄來存儲新的檢查數(shù)據(jù)。
分散存儲問題解決了,但是如何將這些數(shù)據(jù)重新讀取出來呢?由于使用以上方法創(chuàng)建的目錄都是根據(jù)文件服務(wù)器產(chǎn)生的信息為基礎(chǔ)生成的,外界無法知道數(shù)據(jù)存儲的位置,所以在保存數(shù)據(jù)的時候需要用數(shù)據(jù)庫來記錄文件索引。該方法可以解決文件服務(wù)器的基本問題,但是效果并不好,首先,文件索引信息和數(shù)據(jù)庫捆綁的很緊,如果數(shù)據(jù)需要遷移或者修改時,要同時對索引庫和數(shù)據(jù)庫進行修改;其次,由于數(shù)據(jù)的查找完全依賴數(shù)據(jù)庫的索引性能,當數(shù)據(jù)量越來越巨大的時候數(shù)據(jù)庫的索引性能將成為文件服務(wù)器性能的瓶頸。
圖6 文件讀寫操作具體流程
為了解決以上問題,我們摒棄上述方法,不使用數(shù)據(jù)庫來記錄索引信息,而是采用文件本身引入的唯一標識來計算 Hash 值,賦予每級目錄具體的語意特性。當系統(tǒng)接收到圖像文件時,先進行數(shù)據(jù)解析,然后根據(jù)解析信息對圖像文件進行分組、保存,同時通知后臺對文件進行處理;當客戶端需要讀取圖像文件時,服務(wù)器根據(jù)用戶的圖像請求確認圖像文件的檢查目錄,然后根據(jù)目錄結(jié)構(gòu)生成信息列表,接著通過服務(wù)網(wǎng)絡(luò)發(fā)送圖像文件到用戶端。文件讀寫操作具體流程,見圖6。
云存儲技術(shù)可解決 PACS實際應(yīng)用中產(chǎn)生的存儲管理和并發(fā)訪問的技術(shù)瓶頸。基于云存儲技術(shù)的區(qū)域 PACS具有明顯的優(yōu)勢 :① 具有強大的圖像后處理功能 ;② 簡便快速,改變了傳統(tǒng)的病人檢查后須花大量時間等待醫(yī)生通過膠片進行診斷的局面 ;③ 解決了醫(yī)院必須購買昂貴的大型計算機和高端存儲系統(tǒng)來管理和存儲海量醫(yī)學影像文件的困擾?;谠拼鎯夹g(shù)的區(qū)域 PACS的應(yīng)用,可有效改善醫(yī)療服務(wù)質(zhì)量,推動我國區(qū)域衛(wèi)生信息化平臺的發(fā)展[9-12]。
[1] 尹雪蓉,尹今揚.云計算模式的醫(yī)療信息管理平臺構(gòu)想[J].中國醫(yī)療設(shè)備,2012,27(6):74-76,129.
[2] 周迎,曾凡,黃昊.淺談云計算在醫(yī)療衛(wèi)生信息化建設(shè)中的應(yīng)用前景[J].中國醫(yī)學教育技術(shù),2010,24(4):350-353.
[3] 潘鳳明,張燁.醫(yī)療衛(wèi)生云計算化應(yīng)用管理[J].上海電機學院學報,2011,14(1):67-70.
[4] 陳云忠,曹定舟,許源.淺析基于云計算的區(qū)域衛(wèi)生信息系統(tǒng)的構(gòu)建[J].中國醫(yī)療設(shè)備,2011,26(9):57-60.
[5] 胡新平,張志美,董建成.基于云計算理念與技術(shù)的醫(yī)療信息化[J].醫(yī)學信息學雜志,2010,(3):6-9.
[6] 童曉渝,吳鋼,張云勇.后電信時代-產(chǎn)業(yè)生態(tài)變革與商業(yè)模式轉(zhuǎn)型[M].北京:人民郵電出版社.
[7] 王鵬,黃華峰,曹珂.云計算:中國未來的IT戰(zhàn)略[M].北京:人民郵電出版社.
[8] 朱近之,方興.智慧的云計算[M].北京:電子工業(yè)出版社.
[9] 楊宏橋,吳飛,甘仞初.構(gòu)建區(qū)域協(xié)同醫(yī)療信息系統(tǒng)的設(shè)計方案研究[J].醫(yī)療衛(wèi)生裝備,2008,29(5):50-52.
[10] 全宇,佡劍非,郭啟勇.構(gòu)建區(qū)域協(xié)同醫(yī)療平臺的探討[J].中國醫(yī)院管理,2009,(6):54-56.
[11] 張承江.醫(yī)學數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:中國中醫(yī)藥出版社.
[12] 李包羅,李皆歡.中國區(qū)域醫(yī)療衛(wèi)生信息化和云計算[J].中國數(shù)字醫(yī)學,2011,6(5):19-23.
Brief Analysis of Regional PACS Based on Cloud Storage Technology
GONG Hai1, QIAN Da-yan2, CHEN Guo-qiang1, XU Qiang1
1.The People's Hospital of Jiangyin, Jiangyin Jiangsu 214400, China; 2.Health Bureau of Jiangyin, Jiangyin Jiangsu 214400, China
This paper introduces the concept of cloud storage, analyzes the deficiencies of traditional storage system, and describes the characteristics, basic procedure and implementation method of regional PACS based on cloud storage technology in detail. Different storage devices can work collaboratively through application software with the application of regional PACS, which has improved the quality of medical service effectively.
cloud storage technology; regional PACS; Hash algorithm; management server; storage server; database
TP393.03
A
10.3969/j.issn.1674-1633.2013.11.024
1674-1633(2013)11-0070-03
2013-10-15
作者郵箱:13915237388@139.com