摘要:本文簡要闡述RAID磁盤陣列在基層區(qū)縣融媒體節(jié)目制作部門的使用現(xiàn)狀,結(jié)合本部門RAID陣列數(shù)據(jù)存儲工作實(shí)踐,談?wù)勎覀儗θ绾巫龊么疟P陣列維護(hù)運(yùn)行、數(shù)據(jù)存儲方面的一些思考。
關(guān)鍵詞:RAID 數(shù)據(jù)存儲
背景:
當(dāng)今廣電科技發(fā)展日新月異,網(wǎng)絡(luò)化、信息化技術(shù)在廣播電視融媒體領(lǐng)域的應(yīng)用也日趨深入普遍,攝、錄、編、播、傳、存、顯各個環(huán)節(jié)都已經(jīng)實(shí)現(xiàn)了高清化、數(shù)字化,這里面“存”這個環(huán)節(jié)一直在后臺運(yùn)行,平時不受關(guān)注,一旦損壞卻影響巨大。而對存儲的主要設(shè)備RAID的運(yùn)行維護(hù),對基層廣電技術(shù)人員而言是個巨大挑戰(zhàn),據(jù)了解從RAID開始進(jìn)入?yún)^(qū)縣基層廣電部門,目前大多已進(jìn)入故障高發(fā)期,本文就這一課題展開討論無疑擁有很強(qiáng)的現(xiàn)實(shí)意義。
一、RAID基礎(chǔ)知識
1.1 RAID的定義及常見使用方法
RAID 即獨(dú)立磁盤冗余陣列,其實(shí)就是用多個獨(dú)立的磁盤組合在一起形成一個大的磁盤系統(tǒng),從而實(shí)現(xiàn)比單塊磁盤更好的存儲性能和更高的可靠性。按照組成磁盤的不同管理模式提供不同的存儲容量、數(shù)據(jù)校驗(yàn)容錯、數(shù)據(jù)讀寫性能。
常見外置RAID磁盤陣列使用方法有以下兩種:
1、小型桌面應(yīng)用一般采用6盤位及以下磁盤陣列盒、硬盤陣列盒通過雷電或USB接口直連一臺主機(jī),也可以共享出來供局域網(wǎng)其他機(jī)器作為一個大容量存儲使用,組成級別一般選擇RAID 5。
2、再大一些規(guī)模的RAID陣列使用,比如20臺非編的在線編輯或中心級別的媒資存儲,要求陣列存儲容量更大,數(shù)據(jù)安全性更高,一般采用12盤位以上,RAID 6級別的陣列,陣列通過FC光纖直連到非編網(wǎng)絡(luò)核心交換機(jī),供所有終端使用。
1.2 RAID的常用組成級別
RAID 0:
亦稱為帶區(qū)集,把多塊硬盤連接在一起而組成一個容量更大的存儲設(shè)備。處理數(shù)據(jù)時把數(shù)據(jù)分塊并且同時讀寫入組成RAID的磁盤,從而大大提高I/O速率。RAID0沒有冗余或錯誤修復(fù)能力。
RAID 1 :
也稱為磁盤鏡像,2n塊硬盤只能提供n塊硬盤的存儲容量。每一個磁盤都具有一個對應(yīng)的鏡像盤。只要不是一組鏡像硬盤同時損壞不影響存儲數(shù)據(jù)安全。
RAID 3:
使用一個專門的獨(dú)立磁盤存放所有的校驗(yàn)數(shù)據(jù),而在剩余的磁盤中以與RAID0相似的方式分割并讀寫數(shù)據(jù),即可視為“RAID3=RAID0+校驗(yàn)盤”。
RAID 5:
在運(yùn)行機(jī)制上,RAID 5和RAID 3完全相同,也是由幾個數(shù)據(jù)塊共享一個校驗(yàn)塊。RAID 5和RAID 3的最大區(qū)別在于RAID 5不是把所有的校驗(yàn)塊集中保存在一個專門的校驗(yàn)盤中,而是分散到所有的數(shù)據(jù)盤中。硬盤的利用率為n-1。
RAID 6:
與RAID 5相比,RAID 6增加了第二個獨(dú)立的奇偶校驗(yàn)信息塊。兩個獨(dú)立的奇偶系統(tǒng)使用不同的算法,即使兩塊磁盤同時失效也不會影響數(shù)據(jù)的使用。
二、本單位RAID磁盤陣列使用概述
2.1 本單位在線編輯RAID陣列的軟硬件配置
1、3U機(jī)架式,冗余電源,單控制器設(shè)計,控制器可快速替換,陣列控制器FC光口直連非編核心交換機(jī);
16塊西數(shù)ST3000NM0033企業(yè)級硬盤(支持熱插拔);
4個RJ451000M以太網(wǎng)口,支持多種網(wǎng)口聚合方式;
RAID0,1,3,5,6,10,50,JBOD(支持全局動態(tài)熱備盤);
管理方式支持鏈接擴(kuò)展柜進(jìn)行擴(kuò)容;
支持10臺非編,每臺兩層的GVHQ/HQX(1920x1080)文件的實(shí)時在線編輯。
2、系統(tǒng)采用安全的嵌入式Linux內(nèi)核,可有效防止病毒及木馬攻擊,并具有多網(wǎng)口聚合、斷電保護(hù)、QOS網(wǎng)絡(luò)帶寬管理,與非編終端組成了資源共享的網(wǎng)絡(luò)編輯組群。其靈活的擴(kuò)展性,便捷的文件交互、嚴(yán)格的分級權(quán)限管理為中心各制作部門提供了安全、高效的網(wǎng)絡(luò)協(xié)同工作平臺。
2.2 本單位在線編輯RAID陣列幾年來的的運(yùn)行情況
1、2015年系統(tǒng)購入時,初始陣列中16號盤位為熱備盤,其他15塊盤組RAID6,實(shí)際可用硬盤容量為13*3=39T。
2、2019年國慶假期間陣列告警,值班人員重啟后停止告警,節(jié)后登錄系統(tǒng)發(fā)現(xiàn)16號盤狀態(tài)為在線,2號、8號盤狀態(tài)為廢棄,陣列狀態(tài)為降級。聯(lián)系廠家遠(yuǎn)程指導(dǎo)換兩塊同規(guī)格企業(yè)級硬盤,陣列經(jīng)過3天的數(shù)據(jù)重構(gòu)恢復(fù)正常,8號盤狀態(tài)變?yōu)闊醾浔P,數(shù)據(jù)未受任何損失。替換下的硬盤格式化后掛到辦公電腦上正常工作至今。
3、2021年3月,陣列未告警,記者反映登錄不了在線編輯系統(tǒng),技術(shù)人員檢查發(fā)現(xiàn)3、11、12號硬盤指示燈亮紅燈,系統(tǒng)進(jìn)入保護(hù)狀態(tài)。關(guān)機(jī)插拔故障盤后3號盤亮綠燈恢復(fù)正常,11、12號盤仍然亮紅燈,聯(lián)系廠家遠(yuǎn)程指導(dǎo)處理故障恢復(fù)正常。但這一次故障徹底給我們敲響了警鐘,深刻認(rèn)識到存儲數(shù)據(jù)的寶貴,必須引以為戒,查找單位還有哪一些技術(shù)系統(tǒng)存在隱患,哪一些技術(shù)系統(tǒng)我們還不了解掌握。要先摸出個底來,分門別類采取相應(yīng)措施堵塞漏洞,讓單位技術(shù)保障能力上一個新臺階。
三、陣列使用實(shí)踐心得:
綜合兩次陣列故障處理過程,我們經(jīng)過學(xué)習(xí)分析,得出以下觀點(diǎn):
1、磁盤陣列對組成陣列的磁盤要求嚴(yán)苛,一有不符合標(biāo)準(zhǔn)的硬盤出現(xiàn),就會踢出陣列,啟用熱備盤進(jìn)行硬盤重構(gòu),再出現(xiàn)壞盤而又沒有及時換盤,陣列就會降級,數(shù)據(jù)安全性大為降低。直至出現(xiàn)陣列崩潰數(shù)據(jù)丟失的災(zāi)難性后果。
2、故障及時發(fā)現(xiàn)對解決問題極為重要,除了注意系統(tǒng)報警外,還要定期登錄巡查,觀察陣列狀態(tài),以防告警部分被關(guān)閉或故障出現(xiàn)的不告警。
3、保證同規(guī)格或高規(guī)格企業(yè)級硬盤的常態(tài)冷備,及時替換保證陣列中熱備盤正常工作。
4、陣列工作3、4年后或陣列中出現(xiàn)過壞盤,就要引起技術(shù)維護(hù)人員的高度重視。
5、數(shù)據(jù)流磁帶、光盤、離線硬盤等模式作為重要數(shù)據(jù)的異地異態(tài)勤備份,將大大提高存儲數(shù)據(jù)的安全性。
四、結(jié)束語
據(jù)了解,目前很多基層廣電部門的技術(shù)維護(hù)大都由傳統(tǒng)廣電的老技術(shù)人員承擔(dān),高水平的專業(yè)計算機(jī)人才很少能充實(shí)到區(qū)縣基層一線,對磁盤陣列這類高價值設(shè)備,學(xué)習(xí)維護(hù)又有一定風(fēng)險的領(lǐng)域確實(shí)有較高門檻,存在本領(lǐng)恐慌,但現(xiàn)實(shí)情況又要求我們正確面對,加強(qiáng)學(xué)習(xí),勇于承擔(dān)起這份挑戰(zhàn)。希望此文能對行內(nèi)同事們有所幫助,筆者水平有限文中不當(dāng)之處敬請大家指正為謝。
作者簡介:
李世鵬(1972,11——),男,漢,籍貫:山東省濟(jì)南市萊蕪區(qū),工程師,學(xué)歷:大專,研究方向:廣播電視工程。