黃威威 郭子健
摘? 要:自從世界第一臺(tái)計(jì)算機(jī)問世將近一百年歷史了,從初代占地幾間房子到現(xiàn)在可隨身攜帶,計(jì)算機(jī)的發(fā)展大家有目共睹。計(jì)算機(jī)的進(jìn)步也方便了科學(xué)研究,變成良性循環(huán)。跟著科學(xué)的發(fā)展,計(jì)算機(jī)也將有不同的發(fā)展方向。本文主要闡述了計(jì)算機(jī)大型網(wǎng)站的技術(shù)與排錯(cuò)。
關(guān)鍵詞:大型網(wǎng)站;網(wǎng)站排錯(cuò)
大型網(wǎng)站架構(gòu)演化發(fā)展歷程
初始階段的網(wǎng)站架構(gòu)
小網(wǎng)站最開始沒有太多人訪問。架構(gòu):應(yīng)用程序、數(shù)據(jù)庫、文件等所有的資源都在一臺(tái)服務(wù)器上。
應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離
在應(yīng)用與數(shù)據(jù)分離后,整個(gè)網(wǎng)站使用了三臺(tái)服務(wù)器,對(duì)硬件資源有不同的要求:應(yīng)用服務(wù)器處理大量的業(yè)務(wù)邏輯,需要更快、更強(qiáng)大的 cpu;用于快速磁盤檢索和數(shù)據(jù)緩存的數(shù)據(jù)庫服務(wù)器需要更快的磁盤和更大的內(nèi)存;用戶上傳大量文件的文件服務(wù)器需要更大的磁盤。
大型網(wǎng)站應(yīng)用及排錯(cuò)
服務(wù)器硬件問題
1.網(wǎng)線故障--丟包--失聯(lián)? ==>更換網(wǎng)線? ethtool? 網(wǎng)卡協(xié)商速率speed:1000mb/s-100mb/s。怎么樣判斷一個(gè)服務(wù)器是否丟包??登陸服務(wù)器然后ping網(wǎng)關(guān)。(1k-5K次)ping -t 10000 -i 0.01?? x.x.x.1;ping的結(jié)果怎么計(jì)算出來的?網(wǎng)線線序:橙白 橙? 綠白 藍(lán)? 藍(lán)白 綠? 棕白 棕?? 568B或 綠白 綠? 橙白 藍(lán)? 藍(lán)白 橙? 棕白 棕?? 568A?? 1 3? 26對(duì)調(diào)ethtool 網(wǎng)卡名字
2.板載網(wǎng)卡故障---->更換主板(幾率很?。┤f兆網(wǎng)卡是外接的網(wǎng)卡-->安裝驅(qū)動(dòng)-->重啟機(jī)器 ixgbe? 使用光纖+萬兆光模塊? 無光對(duì)有光,有光對(duì)無光(怎么插光纖)萬兆網(wǎng)卡協(xié)商速率是 10000m/s? inter原廠萬兆網(wǎng)卡只識(shí)別原廠inter萬兆模塊,不識(shí)別oem(白牌)(a貨)四口bond浪費(fèi)交換機(jī)端口? 如果上完萬兆的機(jī)器不通,怎么處理?1 首先現(xiàn)場(chǎng)ip a? 看看網(wǎng)卡起沒起來,有沒有IP地址 2 登陸交換機(jī)去看看VLAN劃沒劃錯(cuò) 3 讓現(xiàn)場(chǎng)再次確認(rèn)光纖是不是插錯(cuò)了,是不是物理鏈路有問題 4 換個(gè)模塊試試,有時(shí)候模塊故障率非常高
先系統(tǒng)再硬件的方式去排查1有一些應(yīng)用服務(wù)起不來,一定要看看是不是機(jī)器沒有內(nèi)存了2內(nèi)存如果出現(xiàn)故障會(huì)導(dǎo)致什么現(xiàn)象:自動(dòng)重啟。無緣無故自動(dòng)重啟-->crontab---->rc.local--->開機(jī)啟動(dòng)的腳本--->看看內(nèi)存,現(xiàn)象2:卡在F1界面要按F1才能過去,進(jìn)入系統(tǒng)。please press F1 to解決方法? 更換內(nèi)存 或者插拔內(nèi)存(同型號(hào) 同容量)DIMM電源問題-->1單電? 2雙電???? -->冗余工作方式 不同型號(hào)及品牌的服務(wù)器電源冗余工作方式是不一樣的,電源1-->工作? 電源1-->工作? 電源2--> 工作? 電源2-->備用 1壞2頂上電源分為750W? 500W? 570W? 650W?? 瓦特? 根據(jù)舊的型號(hào)去換。不能隨便換判斷電源故障:1外觀? 燈(綠)(紅)(不亮)故障 2管理卡日志PSU1 erro PSU2 erro(電源) 3 開機(jī)自檢報(bào)錯(cuò) 故障燈--(紅) 滅 psu1 error??? psu2 error
主板故障解決
現(xiàn)象:開機(jī)黑屏或開機(jī)死機(jī),更換主板,不影響數(shù)據(jù)(這些操作由機(jī)房值守或者廠家來做)前提:a有值守 b服務(wù)器在保修期內(nèi)(專業(yè)點(diǎn):在保)。RAID卡故障(陣列卡),現(xiàn)象:無法顯示硬盤(所有)及不能CTRL+R進(jìn)入RAID卡。解決方法更換 raid卡? 或者首先插拔RAID卡。硬盤背板故障,現(xiàn)象:硬盤燈全部不亮,解決方法:更換硬盤背板及SAS線,如單個(gè)硬盤燈不亮或者為紅為硬盤故障。風(fēng)扇不轉(zhuǎn)了,管理卡日志:fan1 error fan3 error解決方法:更換? 遠(yuǎn)程管理卡(板載)如果想要使用必須進(jìn)入bios配置管理卡遠(yuǎn)程管理IP地址。如果出現(xiàn)故障,可以忽略。所有操作現(xiàn)場(chǎng)弄
IP地址及網(wǎng)卡
只要通電管理卡即可使用,管理卡有管理卡的ip地址,實(shí)現(xiàn)無人值守機(jī)房的故障處理,可實(shí)現(xiàn)設(shè)備重裝操作,重啟操作,等任何操作,不依賴內(nèi)外網(wǎng) 網(wǎng)絡(luò),依靠自己的管理卡網(wǎng)絡(luò),需提前劃分。賬號(hào)問題(sudo)升級(jí)內(nèi)核失?。▋?nèi)核調(diào)參)(內(nèi)核可以選擇)內(nèi)核調(diào)參是系統(tǒng)優(yōu)化里的東西,升級(jí)內(nèi)核,不要?jiǎng)h除其他內(nèi)核,防止內(nèi)核升級(jí)失敗,可以用其他內(nèi)核啟動(dòng)機(jī)器。網(wǎng)卡配置文件問題 ping ip 解決方法 查看及修改和重啟網(wǎng)絡(luò)? /etc/sysconfig/-----ifcfg-eth0-----ifcfg-eth3修改前備份:ifcfg-eth0.bak 單獨(dú)開啟和關(guān)閉一個(gè)網(wǎng)卡的命令:ifdown eth0? ifup eth0這是經(jīng)過修改的。如果直接使用centos鏡像安裝網(wǎng)卡名字是 ifcfg-im? 是否有IP地址 eth0 eth1 eth2 網(wǎng)絡(luò)層VLAN,系統(tǒng)(IP),本地都沒有問題,但是就是ping不通服務(wù)器。a 95%?? 機(jī)器沒有路由了,需要添加路由 b 防火墻過濾規(guī)則,不允許你的IP地址ping 服務(wù)器
路由器問題
添加路由2種方法 ?1種 臨時(shí)添加(重啟失效)2種 永久添加(永久生效)查看路由表route -n 添加靜態(tài)路由:# route add -net 10.18.45.0 netmask 255.255.255.0 gw 10.18.45.1 刪除靜態(tài)路由:# route del -net 10.18.45.0 netmask 255.255.255.0 gw 10.18.45.1路由 route -n 添加默認(rèn)路由或者靜態(tài)路由(重啟就沒了) 防火墻(默認(rèn)關(guān)閉)selinux(disabled)1 臨時(shí)添加及刪除及查看本機(jī)路由? 2? 永久添加路由? 如果做了bond 還要查看bond配置文件(/etc/modprobe.d/),eth0,eth1配置文件,及模塊加載文件modpro
PXE 網(wǎng)絡(luò)自動(dòng)化安裝系統(tǒng)的瓶頸
PXE最大的瓶頸就是網(wǎng)絡(luò)帶寬,千萬不要同時(shí)大批量一起安裝,會(huì)出現(xiàn)一批裝上,一批裝不上,非常麻煩。建議 一次安裝機(jī)器的數(shù)量:48臺(tái)以內(nèi), 20臺(tái) 20臺(tái)一起裝最好,簡單方法:20臺(tái)機(jī)器先統(tǒng)一做好RAID,然后一起安裝操作系統(tǒng)。文件系統(tǒng)損壞現(xiàn)象:卡在 control +d 界面讓你輸入ROOT密碼 解決方法:輸入root密碼,如果沒有請(qǐng)破解。輸入密碼后 請(qǐng)執(zhí)行fsck -y /dev/sda2? XFS_repire sda???? xfs磁盤分區(qū):fdisk 4主??? gdisk(2T)128主必須要有的3個(gè)分區(qū) / /boot /swap 執(zhí)行df -h
云服務(wù)器
云服務(wù)器中使用公網(wǎng)IP地址連接,但是在系統(tǒng)下查看,只有eth0,不顯示公網(wǎng)IP在云服務(wù)器上搭建任何服務(wù),必須要開放安全策略端口,否則所有服務(wù)不成功。購買的新云服務(wù)器默認(rèn)只開啟80 443 22等幾個(gè)常用端口。在搭建任何服務(wù)器前,一定要在虛擬機(jī)環(huán)境先做一遍,不要上真機(jī)直接操作。
結(jié)語
大型網(wǎng)站軟件系統(tǒng)以其并發(fā)性高、流量大、數(shù)據(jù)量大、用戶分布廣、網(wǎng)絡(luò)環(huán)境復(fù)雜、安全環(huán)境惡劣、需求快速變化、發(fā)布頻繁、發(fā)展?jié)u進(jìn)等特點(diǎn),成為現(xiàn)代科學(xué)技術(shù)不可缺少的產(chǎn)品。