国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

曙光機(jī)群在生產(chǎn)運行中注意的操作問題及對策

2016-05-30 09:26:40張悅趙雨晴郭金榮
科技尚品 2016年4期
關(guān)鍵詞:系統(tǒng)維護(hù)服務(wù)器

張悅 趙雨晴 郭金榮

摘 要:曙光機(jī)群服務(wù)器采用的是LINUX系統(tǒng),LINUX系統(tǒng)是針對地震數(shù)據(jù)處理設(shè)計的操作系統(tǒng),操作命令采用字符操作,設(shè)備也采用字符命令,操作不謹(jǐn)慎就會造成預(yù)想不到的后果,要么處理的地震數(shù)據(jù)丟失,要么機(jī)群系統(tǒng)癱瘓,崩潰,死機(jī),生產(chǎn)期間服務(wù)器7×24小時工作,因此服務(wù)器放置的環(huán)境很重要,符合標(biāo)準(zhǔn)存放環(huán)境有助于服務(wù)器的穩(wěn)定運行,機(jī)群服務(wù)器系統(tǒng)運行維護(hù)只有在軟件和硬件的雙重保障下才能正常穩(wěn)定地運行,故而機(jī)群操作維護(hù)需要特別小心嚴(yán)謹(jǐn)。

關(guān)鍵詞:服務(wù)器;LINUX系統(tǒng);系統(tǒng)維護(hù);小心嚴(yán)謹(jǐn)

1 前言

近年來,中石化逐年減少內(nèi)部勘探工作任務(wù)。隨著國內(nèi)外勘探市場的競爭日益激烈,國內(nèi)各大油田的物探研究中心地震數(shù)據(jù)處理設(shè)備的硬件也隨之升級,曙光機(jī)群代表著目前最先進(jìn)的地震數(shù)據(jù)處理設(shè)備在國內(nèi)外勘探市場大顯身手,在競爭日益激烈的國外市場脫穎而出,與一般的辦公生產(chǎn)電腦使用的WINDOWS操作系統(tǒng)不同的是,它采用的是LINUX系統(tǒng),操作全部采用鍵盤批命令操作,LINUX系統(tǒng)是針對地震數(shù)據(jù)處理設(shè)計的操作系統(tǒng),操作命令采用字符操作,設(shè)備也采用字符命令,地震數(shù)據(jù)處理員必須按照linux指令嚴(yán)謹(jǐn)操作,因為一不小心誤敲錯字符指令,就會造成預(yù)想不到的后果,要么處理的地震數(shù)據(jù)丟失,要么機(jī)群系統(tǒng)癱瘓,崩潰,死機(jī),重新運行需要廠家高級專業(yè)技術(shù)人員操作7~8天,嚴(yán)重影響生產(chǎn)運行,故而在實際生產(chǎn)運行中,系統(tǒng)運行維護(hù)需要特別小心嚴(yán)謹(jǐn)。曙光機(jī)群如圖1所示。

1.1 系統(tǒng)概況

本集群共32節(jié)點,存放于曙光4000A機(jī)柜,包括4臺TC2600刀片服務(wù)器(共32個刀片),以及一臺NAS存儲,網(wǎng)絡(luò)設(shè)備包括D-link、Force10。本集群包括兩套網(wǎng)絡(luò),一套連接D-Link的管理網(wǎng),另一套連接Force10交換機(jī)交換網(wǎng)。高性能計算節(jié)點要由3臺TC2600刀片服務(wù)器。TC2600使用Blade CB60-G刀片,每節(jié)點24GB內(nèi)存,6顆計算核心。每個充當(dāng)集群的計算資源。由管理節(jié)點負(fù)責(zé)統(tǒng)一調(diào)配。

1.2 機(jī)架裝配布局圖

服務(wù)器安裝在1個曙光4000A機(jī)柜中,NAS存儲設(shè)備和Force10安裝的1個4000A機(jī)柜中。服務(wù)器在機(jī)柜中均由導(dǎo)軌固定,可以根據(jù)需要靈活抽出。

1.3 節(jié)點裝配位置圖

cat可以查看文件內(nèi)容,它的作用是連接一個文件或多個文件輸出結(jié)果,默認(rèn)是顯示一次,一屏顯示more,只能向后翻,less可以前后翻屏。

Wc統(tǒng)計文件中的單詞、行和字符,-w-l-c可看字、行、字符。

File 確定文件類型。

鏈接link是對一個文件或目錄的引用。

2.5 設(shè)備管理

每個設(shè)備都有一個major(主要的)號和minor(次要的)號,設(shè)備可能是字符設(shè)備,也可能是塊設(shè)備。

設(shè)備類型:字符設(shè)備,以c表示其文件類型,數(shù)據(jù)傳輸一次一個字符。

3 曙光機(jī)群在運行中常見的故障

曙光機(jī)群在運行中出現(xiàn)的故障分為兩種:軟件故障和硬件故障。

軟件故障一般是由于操作人員不熟練Linux操作命令,誤操作引起服務(wù)器運行不暢或死機(jī)。常見的有以下幾種:

(1)錯誤設(shè)置用戶權(quán)限。

設(shè)置用戶權(quán)限應(yīng)為777(權(quán)限全部放開),服務(wù)器才能開啟運行

#chmod 777/home/download

(2)系統(tǒng)啟動時,需要掛載分區(qū)必須設(shè)為1,而且整個fstab中只允許出現(xiàn)一個1,否則系統(tǒng)不運行。

(3)配置文件里必須有mark地址(網(wǎng)卡的物理地址),修改了不生效,服務(wù)器功能開啟不了。

(4)節(jié)點服務(wù)器開機(jī)電壓不穩(wěn)定,系統(tǒng)不運行,一般是服務(wù)器電池到了使用年限(一般2年),必須更換電池。

例如 [root@bnodel9-]#data(看系統(tǒng)運行當(dāng)天時間)

[root@bnodel9-]# uptime(看系統(tǒng)運行多少時間)

(5)誤操作輕易更改服務(wù)器IP地址,一般遵照出廠時設(shè)置的IP地址固定不變。

硬件故障一般是由于操作人員粗心導(dǎo)致,常見的有以下幾種:

①插拔網(wǎng)絡(luò)線和服務(wù)器連接線不緊密,造成連線松動,誤踩光纖線,造成光纖線內(nèi)部斷線。

②帶電插拔服務(wù)器,不按照曙光機(jī)群運行操作規(guī)定運行服務(wù)器,造成服務(wù)器主板硬件損壞。

③夏季遇到停電,系統(tǒng)運維員沒有及時關(guān)機(jī),造成機(jī)群運行溫度超標(biāo),燒毀服務(wù)器。

4 曙光機(jī)群在實際運行中的對策

在日常工作中,管理員可對服務(wù)器硬件及操作系統(tǒng)進(jìn)行簡單的日常維護(hù),如遇到棘手問題,管理員可向曙光公司申請技術(shù)支持。

4.1 運行環(huán)境要求

服務(wù)器7×24小時工作,因此服務(wù)器放置的環(huán)境很重要,符合標(biāo)準(zhǔn)存放環(huán)境有助于服務(wù)器穩(wěn)定運行,可以輕松地達(dá)到甚至超過實際壽命:

(1)減少機(jī)房進(jìn)出人流量,機(jī)房保持干凈環(huán)境,定期打掃機(jī)房;

(2)機(jī)房應(yīng)處于封閉狀態(tài),室內(nèi)溫度應(yīng)保持在22攝氏度左右;

(3)機(jī)房做好防雷設(shè)施,和UPS供電,電源需要接地;

(4)機(jī)房一定要做定期巡檢,檢查是否有聲光報警,建議每周2次。

4.2 常見事項

服務(wù)器日常運行中出現(xiàn)硬件故障,基本都會有報警音提示,主要集中在RAID卡和電源報警。

服務(wù)器采用的是熱插拔硬盤,但是服務(wù)器正常運行時是不允許對硬盤進(jìn)行插拔操作的,特別是做了RAID。

電源模塊出現(xiàn)故障時,服務(wù)器會有報警音,管理員觀察電源模塊的指示燈是否處于綠燈常亮狀態(tài),如果指示燈熄滅或指示燈變成紅色,可以將該模塊電源線和模塊重新插拔,如果仍然處于熄滅狀態(tài)則需要更換模塊。為避免靜電或其他因素,建議在非緊急情況下,關(guān)機(jī)進(jìn)行模塊的插拔,以保護(hù)服務(wù)器其他硬件設(shè)備的安全。不要自行開蓋維修電源模塊。

服務(wù)器硬盤通過RAID卡與主板連接,在日常運行中,意外斷電或頻繁的I/O讀寫會導(dǎo)致RAID中所屬硬盤產(chǎn)生物理或邏輯掉盤。如果出現(xiàn)RAID掉盤的情況,管理員應(yīng)第一時間將服務(wù)器內(nèi)的數(shù)據(jù)進(jìn)行異地備份,以保證數(shù)據(jù)安全,同時應(yīng)聯(lián)系集成商或者撥打曙光報修電話,以便及時修復(fù),避免數(shù)據(jù)丟失。

5 曙光機(jī)群服務(wù)器生產(chǎn)運行的特別警告

作為Linux系統(tǒng)管理員,面對的服務(wù)器是并行的節(jié)點集群,而不是自己的個人獨立計算機(jī),所以在日常管理工作中一定要養(yǎng)成嚴(yán)謹(jǐn)?shù)牧?xí)慣。

養(yǎng)成備份的習(xí)慣

服務(wù)器上跑的數(shù)據(jù)是非常重要的,一定要注意數(shù)據(jù)的安全。一定要記得備份數(shù)據(jù),否則,一旦出錯您會后悔死。

root相當(dāng)于Windows里面的adminstrator,它任何權(quán)限都有,所以為了避免引起不必要的事故,能用普通用戶完成的任務(wù),盡量不要使用root。

Linux系統(tǒng)操作人員使用了一段時間的Linux,會越來越熟練各種命令,敲命令的速度肯定也會越來越快。每個人都會有疏忽的時候,一旦敲錯了命令那產(chǎn)生的后果是不可預(yù)知的。所以,還是慢點敲鍵盤吧,如果快也沒有關(guān)系,但是敲回車鍵的時候一定要檢查一下當(dāng)前的命令是否是想要的。

參考文獻(xiàn)

[1]何明,何茜穎.Linux培訓(xùn)教程[M].北京:清華大學(xué)出版社,2011.

[2]王加森,何大可.可擴(kuò)展并行機(jī)群系統(tǒng)與曙光2000[J].計算機(jī)應(yīng)用,2001,21(S1):270-271.

(作者單位:河南油田物探公司物研所)

猜你喜歡
系統(tǒng)維護(hù)服務(wù)器
SCHMID語音交換系統(tǒng)維護(hù)與維修案例淺析
中間站調(diào)車監(jiān)控系統(tǒng)維護(hù)臺的設(shè)計與實現(xiàn)
通信控制服務(wù)器(CCS)維護(hù)終端的設(shè)計與實現(xiàn)
得形忘意的服務(wù)器標(biāo)準(zhǔn)
短波發(fā)射天線系統(tǒng)維護(hù)方法探討
計算機(jī)網(wǎng)絡(luò)安全服務(wù)器入侵與防御
服務(wù)器操作系統(tǒng)可信加固技術(shù)研究
湖北電力(2016年10期)2016-04-25 07:55:55
降低高速公路機(jī)電系統(tǒng)維護(hù)維修成本探索
智能PDA在集抄系統(tǒng)維護(hù)中的應(yīng)用
光纖通信傳輸系統(tǒng)維護(hù)中的幾項測試
田阳县| 禄劝| 宁都县| 永吉县| 白城市| 禹城市| 凤冈县| 忻城县| 鄂伦春自治旗| 天等县| 克东县| 济源市| 禄劝| 蓝田县| 思南县| 淳化县| 稻城县| 彭山县| 扎囊县| 文登市| 镇平县| 鄢陵县| 蛟河市| 中江县| 永福县| 荣成市| 福贡县| 白山市| 潮安县| 和龙市| 雅安市| 乌兰察布市| 兴城市| 襄城县| 通城县| 永兴县| 师宗县| 云林县| 德钦县| 资兴市| 兴山县|