單華超 徐海榮 李遠(yuǎn) 牛曉輝
原發(fā)骨腫瘤流行病學(xué)數(shù)據(jù)庫的建立與使用
單華超 徐海榮 李遠(yuǎn) 牛曉輝
目的 研究原發(fā)骨腫瘤流行病學(xué)在線數(shù)據(jù)庫的建立和使用方法。方法 原始資料來自于北京積水潭醫(yī)院骨與軟組織腫瘤數(shù)據(jù)庫共 14 617 個(gè)骨與軟組織腫瘤病例,選擇其中 9200 例原發(fā)骨腫瘤,提取年齡、性別、部位和診斷作為參數(shù),數(shù)據(jù)庫系統(tǒng)采用 Word Press 開源系統(tǒng),網(wǎng)頁基于 PHP 語言,數(shù)據(jù)存儲是基于 MySQL 數(shù)據(jù)庫系統(tǒng)。結(jié)果 建立了原發(fā)骨腫瘤流行病學(xué)在線數(shù)據(jù)庫系統(tǒng) ( http://www.sarcoma-jst.org ),包含4 個(gè)搜索模塊,設(shè)計(jì)按診斷、按年齡、按部位 3 個(gè)單參數(shù)搜索模塊,以及按年齡、部位、性別和診斷 4 個(gè)參數(shù)組合的綜合搜索模塊。結(jié)論 本數(shù)據(jù)庫可以為骨腫瘤相關(guān)工作者提供一個(gè)免費(fèi)實(shí)用的流行病學(xué)研究工具。本研究描述的方法也可以給建立其它類似數(shù)據(jù)庫提供借鑒。
骨腫瘤;流行病學(xué);數(shù)據(jù)庫 ( 主題 );聯(lián)機(jī)系統(tǒng);骨腫瘤,原發(fā)性
原發(fā)骨腫瘤雖然種類比較多,但非常罕見,年發(fā)病率僅約 9 / 100 萬,僅為乳腺癌這一單一惡性腫瘤的 1 / 80[1]。同時(shí),由于其臨床表現(xiàn)和影像學(xué)表現(xiàn)也缺乏特異性,因此,即使是骨腫瘤專科大夫,想單純依靠影像學(xué)表現(xiàn),獲得準(zhǔn)確的診斷也并不容易。但是,原發(fā)骨腫瘤也有其自身的特點(diǎn),不同的腫瘤有自身的好發(fā)年齡、好發(fā)性別及好發(fā)部位[2-3]。例如,就好發(fā)年齡而言,在 10~20 歲年齡段,良性腫瘤最常見的是骨軟骨瘤,而惡性腫瘤最常見的是骨肉瘤,40 歲以上年齡段,軟骨肉瘤、骨髓瘤和淋巴瘤的發(fā)病率要明顯高于 40 歲以內(nèi)[4]。
在實(shí)際臨床工作中,醫(yī)生往往需要結(jié)合流行病學(xué)特點(diǎn)、臨床表現(xiàn)和影像學(xué)表現(xiàn)進(jìn)行綜合分析,以獲得診斷和鑒別診斷的初步信息,再行病理學(xué)檢查,最后綜合分析臨床、影像和病理表現(xiàn),獲得最終診斷[5-6]。到目前為止,還沒有理想的原發(fā)骨腫瘤流行病學(xué)數(shù)據(jù)庫查詢系統(tǒng)。本研究的目的是:描述如何建立一個(gè)免費(fèi)的在線原發(fā)骨腫瘤數(shù)據(jù)庫網(wǎng)站,并著重介紹其使用方法。
北京積水潭醫(yī)院骨腫瘤科擁有獨(dú)立的骨與軟組織腫瘤數(shù)據(jù)庫,從 1973 年至 2012 年,共有 14 617個(gè)病例,其中原發(fā)骨腫瘤有 9200 例,原始數(shù)據(jù)包括患者入院時(shí)的年齡、性別等人口統(tǒng)計(jì)學(xué)信息,以及患者的診斷、治療情況、隨訪信息。首先從獨(dú)立的骨與軟組織腫瘤數(shù)據(jù)庫中提取 9200 例原發(fā)骨腫瘤病例的相關(guān)流行性病學(xué)信息,包括年齡、性別、部位和診斷,將數(shù)據(jù)存儲在 Excel 表格中。
一、數(shù)據(jù)庫設(shè)計(jì)
數(shù)據(jù)庫系統(tǒng)采用開源工具 Word Press 進(jìn)行構(gòu)建,Word Press 的門戶網(wǎng)站含有大量免費(fèi)的主題、插件及工具,可以節(jié)省數(shù)據(jù)庫網(wǎng)站開發(fā)的費(fèi)用。本數(shù)據(jù)庫的主頁采用由 Cyper Chimps 開發(fā)的“Responsive”主題??紤]到數(shù)據(jù)的安全性和網(wǎng)站的訪問質(zhì)量對于數(shù)據(jù)庫的使用體驗(yàn)的重要性,盡管數(shù)據(jù)庫系統(tǒng)是免費(fèi)構(gòu)建的,但網(wǎng)站的域名和空間仍然由商業(yè)網(wǎng)站提供服務(wù)。
二、搜索模塊設(shè)計(jì)
Word Press 采用的是 Php 語言和 MySQL 數(shù)據(jù)庫,前面提取的 Excel 數(shù)據(jù),通過網(wǎng)站的數(shù)據(jù)庫管理后臺,可以很方便地導(dǎo)入到 MySQL 數(shù)據(jù)庫。年齡和性別分別定義為連續(xù)性數(shù)據(jù)變量和二分類變量,部位和疾病診斷定義為字符型變量。部位包括:股骨、脛骨、腓骨、肱骨等長骨,以及骨盆、肩胛骨等扁平骨。對于長骨,進(jìn)一步分為近端 ( prox )、骨干 ( shaft ) 和遠(yuǎn)端 ( dist )。根據(jù) 4 個(gè)參數(shù),設(shè)計(jì)按診斷、按年齡、按部位 3 個(gè)單參數(shù)搜索模塊,以及按年齡、部位、性別和診斷 4 個(gè)參數(shù)組合的綜合搜索模塊。
根據(jù)以上描述的方法,北京積水潭醫(yī)院建立了原發(fā)骨腫瘤流行病學(xué)在線數(shù)據(jù)庫系統(tǒng) ( http: //www. sarcoma-jst.org,圖 1 )。為了適應(yīng)對數(shù)據(jù)庫信息查詢的需求,該網(wǎng)站設(shè)計(jì)為可以為 Windows 平臺電腦、Apple 電腦,不同型號的平板電腦和智能手機(jī)友好地進(jìn)行訪問。
圖 1 原發(fā)骨腫瘤網(wǎng)站主頁面,顯示腫瘤的整體構(gòu)成情況Fig.1 Homepage of primary bone tumor website, showing the overall composition of tumors
一、按診斷搜索
可以在搜索框里輸入英文診斷名稱 ( WHO2002年骨腫瘤診斷名稱 ),為了避免拼寫錯(cuò)誤,網(wǎng)站提供了全部原發(fā)骨腫瘤的英文診斷名稱供查詢。舉例來說,如果在搜索框里輸入“osteosarcoma”,數(shù)據(jù)庫會(huì)返回一共搜索到多少骨肉瘤病例,并以圖表形式展示這些病例的年齡、性別和部位分布( 圖 2,3 )。特別的是,如果需要搜索某個(gè)骨肉瘤的亞型,如經(jīng)典型骨肉瘤,可以輸入“conventional osteosarcoma”。
圖 2 數(shù)據(jù)庫系統(tǒng)顯示的年齡和性別分布圖Fig.2 Age and gender distribution of the database
圖 3 數(shù)據(jù)庫系統(tǒng)顯示的部位分布圖Fig.3 Location distribution of the database
二、按年齡搜索
對于年齡搜索,設(shè)計(jì)為搜索輸入年齡±5 歲的所有病例。例如,在年齡框里輸入 17 歲,數(shù)據(jù)庫會(huì)顯示 12~22 歲的所有病例。同樣,系統(tǒng)會(huì)首先顯示總共搜索到多少病例,然后顯示性別、部位及診斷的分布情況 ( 圖 4 )。
三、按部位搜索
對于部位搜索,系統(tǒng)設(shè)計(jì)了下拉菜單,通過下拉菜單選擇不同的解剖部位,對于長骨,選擇解剖部位后還會(huì)自動(dòng)再出現(xiàn)一個(gè)下拉框,供選擇是近端、骨干或遠(yuǎn)端 ( 圖 5 )。例如,選擇股骨,然后選擇遠(yuǎn)端,數(shù)據(jù)庫會(huì)顯示共搜索到 2207 個(gè)病例,并在下面顯示年齡、性別和診斷的分布情況。
圖 4 數(shù)據(jù)庫系統(tǒng)顯示的診斷分布圖Fig.4 Diagnosis distribution of the database
圖 5 按部位搜索的模塊是以下拉框進(jìn)行選擇Fig.5 Drop-down box selection of location distribution
四、綜合搜索
綜合搜索模塊是為了分析一組特殊的病例集合而設(shè)計(jì)的,由于年齡、性別、部位和診斷均可以被定義 ( 圖 6 ),因此其功能最為廣泛。例如,如圖所示,選擇“股骨,遠(yuǎn)端”作為第一個(gè)條件,“股骨,近端”作為第二個(gè)條件,“股骨,骨干”作為第三個(gè)條件,其它選項(xiàng)留空,系統(tǒng)會(huì)搜索“發(fā)生于整個(gè)股骨”的所有原發(fā)骨腫瘤病例,顯示其流行病學(xué)特點(diǎn)。通過這個(gè)搜索模塊,幾乎可以完成大多數(shù)條件的檢索。
圖 6 綜合搜索的數(shù)據(jù)搜索形式Fig.6 Data search module of comprehensive search
五、實(shí)際使用舉例
患者,53 歲,就診時(shí)主訴右腹股溝區(qū)疼痛,行X 線、CT 及 MRI 檢查提示右髖臼溶骨性病變,周圍有硬化緣,考慮良性或侵襲性病變可能性大。進(jìn)行穿刺活檢,病理結(jié)果提示:內(nèi)生軟骨瘤。為了解骨盆部位內(nèi)生軟骨瘤的流行病學(xué)特點(diǎn),選用部位檢索策略,檢索位于骨盆部位的腫瘤,共 724 例,診斷分布結(jié)果顯示:192 例為原發(fā)軟骨肉瘤,62 例為骨軟骨瘤,18 例為軟骨母細(xì)胞瘤,僅有 1 例為內(nèi)生軟骨瘤,占 0.14%。因此,流行病學(xué)研究顯示骨盆部位的內(nèi)生軟骨瘤非常罕見,須再次進(jìn)行病理活檢,獲得更多組織。再次病理結(jié)果顯示為原發(fā)性軟骨肉瘤 II 級。對于有癥狀的內(nèi)生軟骨瘤一般采用刮除術(shù)治療,而骨盆軟骨肉瘤 II 級則需要切除術(shù),治療方法是完全不同的?;仡櫺苑治霰静±?,筆者認(rèn)為:( 1 ) 因?yàn)榇┐袒顧z取材有限,存在固有的局限性,有可能導(dǎo)致診斷的偏差;( 2 ) 內(nèi)生軟骨瘤和軟骨肉瘤在病理上區(qū)分也存在一定的難度,須結(jié)合疾病的流行病學(xué)特點(diǎn)、臨床和影像學(xué)特征綜合分析。因此,本病例說明流行病學(xué)數(shù)據(jù)庫網(wǎng)站可以作為一個(gè)很好的工具輔助診斷過程。
疾病的流行病學(xué)特點(diǎn)在原發(fā)骨腫瘤的臨床、影像和病理三結(jié)合診斷過程中具有重要的地位,但是,由于原發(fā)骨腫瘤其相對罕見,目前公開發(fā)表的超過 5000 例的大宗病例,僅有美國 Mayo Clinic 的《Dahlin's Bone Tumors》 ( 最新版是 2009 年出版的第 6 版 )[6],但是由于是以書的形式出版,在實(shí)際使用中并不方便。而且,美國的患者主要是以白人和黑人為主,而我國主要是黃色人種,其流行病學(xué)的數(shù)據(jù)特點(diǎn)是否符合我國人群特點(diǎn),尚未可知。本研究采用了我國的 9200 例原發(fā)骨腫瘤數(shù)據(jù),并且以免費(fèi)在線數(shù)據(jù)庫的形式提供給廣大骨腫瘤工作者,則克服了以上兩個(gè)缺點(diǎn)。
隨著科技的發(fā)展和進(jìn)步,數(shù)據(jù)庫已經(jīng)成為一個(gè)強(qiáng)大的工具服務(wù)于各個(gè)領(lǐng)域。在線數(shù)據(jù)庫的重要作用在于它能夠很好地收集、存儲和查詢相關(guān)醫(yī)學(xué)信息[7-9]。就腫瘤類數(shù)據(jù)庫而言,很重要的是基于某個(gè)目的,選擇和定義恰當(dāng)?shù)膮?shù)。這就意味著參數(shù)并不是越多越好,也不是越少越好,不相關(guān)的額外信息會(huì)降低搜索效率,信息量不夠也起不到應(yīng)有的作用。本研究建立的原發(fā)骨腫瘤流行病學(xué)數(shù)據(jù)庫,選擇了年齡、性別、部位和診斷作為基本參數(shù),這 4 個(gè)參數(shù)是最重要的流行病學(xué)特征,能夠反映原發(fā)骨腫瘤的相關(guān)流行病學(xué)特征。這也是最初建立該在線數(shù)據(jù)庫時(shí),刪除相關(guān)治療和預(yù)后等相關(guān)參數(shù)的原因。
由于是數(shù)據(jù)庫,數(shù)據(jù)量必然是很大的,數(shù)據(jù)的建立和添加如果不能很高效地進(jìn)行,顯然是一項(xiàng)很繁雜的工作。本研究 MySQL 數(shù)據(jù)庫所需的數(shù)據(jù)可以通過 Excel 數(shù)據(jù)導(dǎo)入,而 Excel 數(shù)據(jù)則可以通過大多數(shù)途徑獲得,如 Sybase,DB2,Access 及 FoxPro等數(shù)據(jù)庫轉(zhuǎn)換[10-12],還可在特殊情況下手工輸入。另外,雖然 MySQL 數(shù)據(jù)庫本身存儲信息是隨機(jī)無序的,但在后臺可以進(jìn)行定義,獲得信息按照某種特定的順序進(jìn)行排列[13],這為數(shù)據(jù)的預(yù)覽提供了方便。選擇 Word Press 作為數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)工具[14],優(yōu)勢為:( 1 ) 由于是免費(fèi)的,可以節(jié)省大量的開發(fā)成本;( 2 ) 有很多非常友好的主題、插件可以使用,因此其可以提供一個(gè)簡單有效的數(shù)據(jù)庫管理平臺,即使是非專業(yè)的數(shù)據(jù)庫工作人員也可以操作。
盡管大多數(shù)數(shù)據(jù)庫查詢操作會(huì)在 Apple 或Windows 電腦進(jìn)行,但由于平板電腦和智能手機(jī)的便攜性,目前其應(yīng)用范圍已經(jīng)非常廣泛。因此,在設(shè)計(jì)過程中,需要考慮到這一點(diǎn),整個(gè)系統(tǒng)應(yīng)該兼容移動(dòng)設(shè)備的使用。在本數(shù)據(jù)庫的建立中,采用了免費(fèi)的“Responsive”主題,則可以完全解決這個(gè)問題[15-16]。
截止 2014 年底,已經(jīng)有 9200 例原發(fā)骨腫瘤數(shù)據(jù)信息被導(dǎo)入到在線數(shù)據(jù)庫中,本在線數(shù)據(jù)庫設(shè)定為每季度更新一次。相信本研究報(bào)告可以為需要建立免費(fèi)在線數(shù)據(jù)庫的讀者提供一種數(shù)據(jù)庫建立方法;更重要的是,該數(shù)據(jù)庫可以為骨腫瘤相關(guān)工作者,提供一個(gè)重要的流行病學(xué)工具,在臨床和研究工作中,免費(fèi)使用。
[1] Siegel R, Naishadham D, Jemal A. Cancer statistics, 2013. CA Cancer J Clin, 2013, 63(1):11-30.
[2] Campanacci M. Bone and soft tissue tumors: clinical features, imaging, pathology and treatment. Springer Verlag Wien. 1999: 99-142.
[3] Unni KK, Inwards CY. Dahlin's bone tumors: general aspects and data on 10,165 cases. Lippincott Williams & Wilkins. 2010: 441-492.
[4] Anfinsen KP, Devesa SS, Bray F, et al. Age-period-cohort analysis of primary bone cancer incidence rates in the United States (1976-2005). Cancer Epidemiol Biomarkers Prev, 2011, 20(8):1770-1777.
[5] Wu JS, Hochman M. Bone tumors: A practical guide to imaging. Springer New York Dordrecht Heidelberg London. 2012: 1-50.
[6] Davies AM, Sundaram M, James SLJ. Imaging of bone tumors and tumor-like lesions: techniques and applications. Springer-Verlag Erlin Heidelberg. 2009: 31-52.
[7] Junghans TB, Sevin IF, Ionin B, et al. Cancer information resources: digital and online sources. Toxicology, 2004, 198(1-3):177-193.
[8] Lawrence DW, Laflamme L. Using online databases to find journal articles on injury prevention and safety promotion topics: How do Safety Lit subscribers use other databases? Safety Science, 2009, 47(1):1-8.
[9] Blamey RW, Hornmark-Stenstam B, Ball G, et al. ONCOPOOL -a European database for 16,944 cases of breast cancer. Eur J Cancer, 2010, 46(1):56-71.
[10] Saracco CM, Roth MA, Wolfson DC. Enabling distributed enterprise integration with WebSphere and DB2 Information Integrator. IBM Systems, 2004, 43(2):255-269.
[11] Taylor B, Adurty N, Bradley S, et al. The official new features guide to Sybase ASE 15. Wordware Publishing, Inc. 2010: 53-72.
[12] Baranyi J, Tamplin ML. Com Base: a common database on microbialresponses to food environments. J Food Prot, 2004, 67(9):1967-1971.
[13] Zawodny JD, Balling DJ. High performance MySQL: optimization, backups, replication. O'Reilly, 2008: 102-143.
[14] Jones KM, Farrington P-A. Using Word Press as a Library Content Management System. American Library Association, 2011: 8-15.
[15] Marcotte E. Responsive web design. A Book Apart, 2011: 46-78.
[16] Frain B. Responsive web design with HTML5 and CSS3. Packt Publishing, 2012: 8-34.
( 本文編輯:李貴存 )
Establishment and application of an epidemiological database of primary bone tumors
SHAN Hua-chao, XU Hai-rong, LI Yuan, NIU Xiao-hui.
Department of Oncology, Beijing Jishuitan Hospital, Beijing, 100035, PRC
Corresponding author: NIU Xiao-hui, Email: niuxiaohui@263.net
Objective To investigate the establishment and application of an online epidemiological database of primary bone tumors. Methods Original data were retrieved from the database of bone and soft tissue belonging to Beijing Jishuitan Hosptial. Database included 9200 cases of histologically confirmed primary bone tumors out of 14 617 bone and soft tissue tumors, which was featured with open source system ( Word Press ), web-based PHP language, MySQL database system-based data storage. Parameters as age, sex, location and diagnosis were collected. Results An online epidemiological database of primary bone tumors ( http://www.sarcoma-jst.org ) included 4 search modules. Three modules of one parameter were designed according to diagnosis, age, and location. One comprehensive module of four parameters was designed according to age, location, gender and diagnosis. Conclusions Database designed above is free and useful for epidemiological investigation of primary bone tumors. It can also serve as a reference for the establishment of similar tumor database.
Bone neoplasms; Epidemiology; Databases as topic; Online systems; Bone neoplasms, primary
10.3969/j.issn.2095-252X.2015.09.009
R738.1
100035 北京積水潭醫(yī)院骨腫瘤科
牛曉輝,Email: niuxiaohui@263.net
2015-03-18 )