陳新房 劉義卿
(防災(zāi)科技學(xué)院信息工程學(xué)院,河北廊坊 065201)
經(jīng)過對地震發(fā)生后地質(zhì)的研究,表明地震活動以及地質(zhì)構(gòu)造特征等與構(gòu)造應(yīng)力場密切相關(guān),不斷對構(gòu)造應(yīng)力場的深入研究能更好地認(rèn)識區(qū)域形變規(guī)律、構(gòu)造活動特征和地震孕育環(huán)境。因此,地震學(xué)家對云南及相鄰地區(qū)的震源機制以及構(gòu)造應(yīng)力場進(jìn)行研究,對來源多樣的資料和數(shù)據(jù)進(jìn)行分析處理。隨著地震數(shù)據(jù)的急劇增加,原始的在一臺機器上對數(shù)據(jù)進(jìn)行存儲、處理和分析已經(jīng)不能滿足顯示需求,需要對原始數(shù)據(jù)格式進(jìn)行整理,然后存儲到分布式系統(tǒng)中,并進(jìn)行分析、并行處理,以提高存儲能力和運算速度,并根據(jù)需要對數(shù)據(jù)進(jìn)行可視化呈現(xiàn)。
本文云南及其鄰區(qū)范圍為:北緯21°-31°,東經(jīng)96°-106°。從國家測震臺網(wǎng)數(shù)據(jù)備份中心下載了2014 年1 月1 日至2019 年7 月5 日期間發(fā)生的583 個3.5 級以上地震波形資料,其中震級在3.0-3.9 共392 個,4.0-4.9 共156 個,5.0-5.9 共29 個,大于6 級的共6 個。對地震臺站波形記錄不完整、覆蓋面不廣的數(shù)據(jù)進(jìn)行清洗,對相關(guān)系數(shù)達(dá)到65%及以上的反演結(jié)果進(jìn)行選取,取得428 個震源機制解。為測試結(jié)果可靠性是否達(dá)到研究要求,利用三維最小空間旋轉(zhuǎn)角方法定量分析不同震源機制解結(jié)果之間的異同,將本研究結(jié)果與國、內(nèi)外研究機構(gòu)和學(xué)者研究結(jié)果進(jìn)行對比,研究機構(gòu)主要有GCMT(The Global Centroid-Moment-Tensor )、NEIC(National Earthquake Information Center)、IPGP (Institut De Physique Du Globe De Paris)、USGS(United States Geological Survey)、GFZ(German Geoscience Research Center)等,對14 次發(fā)生的地震相關(guān)數(shù)據(jù)進(jìn)行了對比分析。如表1 所示。
對于表1 數(shù)據(jù)現(xiàn)有的格式無法上傳到分布式系統(tǒng)之中進(jìn)行處理,對于地震數(shù)據(jù)急劇增大的現(xiàn)狀來說,給地震發(fā)數(shù)據(jù)的存儲和處理帶來了不便,因此需要將其進(jìn)行整理,使之成為一行就是一條完整的記錄,能夠上傳到分布式系統(tǒng)中進(jìn)行存儲與分析。整理過程如下:
表1 震源機制解與其它研究結(jié)果間三維空間旋轉(zhuǎn)角列表
2.1 全選數(shù)據(jù)記錄,將其粘貼到excel 表中。
2.2 在excel 中進(jìn)行數(shù)據(jù)處理。
數(shù)據(jù)處理的方式:全選前四列->設(shè)置單元格格式->取消合并單元格->點擊F5(匹配空值)->設(shè)置函數(shù)使空格中的值與上一行的值相等->先Ctrl 再Enter,最后導(dǎo)出格式為earthquake.txt 文件,如圖1 所示。
圖1 震源機制解與其它研究結(jié)果間三維空間旋轉(zhuǎn)角列表txt 格式
有了格式規(guī)范的數(shù)據(jù)集earthquake.txt,就可以將其上傳到分布式系統(tǒng)中進(jìn)行存儲、分析處理了。
3.1 將數(shù)據(jù)集earthquake.txt 上傳到分布式集群中。
3.2 數(shù)據(jù)庫建表。在mysql 數(shù)據(jù)庫中創(chuàng)建表table_earthquake。mysql> create table table_earthquake(xuhaoint,timevarchar(20),jingdudouble,weidudouble,shendudouble,zhenjidouble,zouxiangdouble,qingjiao double,huadongjiaodouble,sanweidouble,sourcevarchar (50)) default charset=utf8;
3.3 將數(shù)據(jù)集earthquake.txt 加載到數(shù)據(jù)表table_earthquake 之中。
load data local infile '/opt/earthquake.txt' into table table_earthquake fields terminated by ' ' ignore 1 lines;
至此,數(shù)據(jù)集中的數(shù)據(jù)導(dǎo)入到mysql 數(shù)據(jù)表中,就可以根據(jù)需要進(jìn)行相關(guān)操作。
利用R 語言對數(shù)據(jù)進(jìn)行可視化顯示,進(jìn)行如下操作。
通過命令運行結(jié)果圖2 所示。由圖中可知,采用三維最小空間旋轉(zhuǎn)角定量描述不同震源機制解結(jié)果間的差異,共對比分析了14次地震,獲得30 組對比結(jié)果,與實際記錄中的結(jié)果一致。
圖2 震源機制解與其他研究結(jié)果間的三維空間旋轉(zhuǎn)角分布圖
總結(jié),本文闡述了地震數(shù)據(jù)格式統(tǒng)一化的方法及其操作,將傳統(tǒng)的數(shù)據(jù)幾輪方式轉(zhuǎn)換為分布式系統(tǒng)能夠存儲的一行是以條完整記錄的形式,以利于將地震大數(shù)據(jù)上傳到分布式系統(tǒng)進(jìn)行處理分析。采用分布式系統(tǒng)中對地震大數(shù)據(jù)進(jìn)行存儲和并行計算能取得存儲能力和運算速度的快速提高。通過實驗,反映了將數(shù)據(jù)集上傳到分布式系統(tǒng)處理分析的正確性,利用R 語言進(jìn)行可視化的可行性和準(zhǔn)確性。對于海量地震數(shù)據(jù)的處理提供了一定的借鑒作用,具有廣泛的推廣和使用價值意義。