服務(wù)器宕機(jī)解決方案
1.共享存儲(chǔ)集群
在單機(jī)單柜的基礎(chǔ)上,增加1臺(tái)備用主機(jī),即可構(gòu)建基于共享存儲(chǔ)的熱備集群。增加1臺(tái)物理服務(wù)器作為服務(wù)器的備機(jī),并在備機(jī)部署業(yè)務(wù)系統(tǒng),通過(guò)共享存儲(chǔ)熱備集群產(chǎn)品,實(shí)現(xiàn)對(duì)應(yīng)用的高可用保護(hù)。如主機(jī)上運(yùn)行的系統(tǒng)出現(xiàn)異常故障導(dǎo)致宕機(jī),比如應(yīng)用服務(wù)異常、硬件設(shè)備故障,可將系統(tǒng)切換至備用主機(jī),以保證網(wǎng)站連續(xù)運(yùn)營(yíng)和可訪(fǎng)問(wèn)性。
2.數(shù)據(jù)鏡像集群
部署兩臺(tái)服務(wù)器,將其中1臺(tái)服務(wù)器作為主機(jī),通過(guò)活動(dòng)IP對(duì)外提供服務(wù),主機(jī)產(chǎn)生的數(shù)據(jù)會(huì)直接寫(xiě)入主機(jī)的本地磁盤(pán),通過(guò)網(wǎng)絡(luò)實(shí)時(shí)傳輸?shù)絺錂C(jī),從而保證兩臺(tái)服務(wù)器數(shù)據(jù)的一致性。在此基礎(chǔ)上,如果主機(jī)出現(xiàn)故障(服務(wù)器宕機(jī),應(yīng)用系統(tǒng)故障,網(wǎng)絡(luò)故障等情況),主機(jī)會(huì)在保證數(shù)據(jù)一致性前提下,將數(shù)據(jù)庫(kù)切換到備機(jī)運(yùn)行,繼續(xù)對(duì)外提供服務(wù),確保生產(chǎn)管理系統(tǒng)持續(xù)運(yùn)營(yíng)工作。
3. 解析宕機(jī)切換
將解析指向多個(gè)IP,實(shí)現(xiàn)宕機(jī)切換,保障網(wǎng)站可繼續(xù)訪(fǎng)問(wèn)。中科三方智能云解析系統(tǒng)具備宕機(jī)監(jiān)測(cè)與切換功能當(dāng)發(fā)現(xiàn)其中的目標(biāo)服務(wù)器宕機(jī)時(shí),可以將解析快速切換到預(yù)先配置的備用服務(wù)器上,以維持網(wǎng)站的可用性,保證用戶(hù)可以繼續(xù)通過(guò)原域名訪(fǎng)問(wèn)到正常工作的備用服務(wù)器。
4.遠(yuǎn)程容災(zāi)
根據(jù)系統(tǒng)環(huán)境、網(wǎng)絡(luò)環(huán)境,結(jié)合容災(zāi)需求等情況,構(gòu)建遠(yuǎn)程容災(zāi)方案。將管理系統(tǒng)生產(chǎn)服務(wù)器的數(shù)據(jù)實(shí)時(shí)復(fù)制到容災(zāi)服務(wù)器上,確保兩臺(tái)機(jī)器數(shù)據(jù)一致性。當(dāng)主服務(wù)器出現(xiàn)故障時(shí),可通過(guò)備用服務(wù)器快速恢復(fù)業(yè)務(wù)系統(tǒng);當(dāng)本地機(jī)房完全癱瘓時(shí),可通過(guò)容災(zāi)機(jī)房公網(wǎng)IP將服務(wù)映射出去,對(duì)外提供服務(wù)。
5.云容災(zāi)
將生產(chǎn)中心的數(shù)據(jù)和業(yè)務(wù)實(shí)時(shí)災(zāi)備至云端,如生產(chǎn)中心出現(xiàn)事故,可迅速利用云端的容災(zāi)系統(tǒng)及時(shí)接管業(yè)務(wù)。不同區(qū)域的云之間,構(gòu)建數(shù)據(jù)和業(yè)務(wù)災(zāi)備,最大化保障業(yè)務(wù)系統(tǒng)和數(shù)據(jù)的安全。
6.雙機(jī)雙柜
采用多機(jī)雙柜解決方案,為用戶(hù)構(gòu)建高容錯(cuò)、高安全、高性能的集群容災(zāi)平臺(tái),以實(shí)現(xiàn)多個(gè)功能模塊之間相互協(xié)作和服務(wù)器、磁盤(pán)陣列、存儲(chǔ)通道等軟硬件的完全容錯(cuò),可有效解決了傳統(tǒng)高可用方案的單點(diǎn)故障,為用戶(hù)構(gòu)建零數(shù)據(jù)丟失和應(yīng)用高可用保護(hù)的高級(jí)集群容災(zāi)方案。
雖然B站在較短時(shí)間內(nèi)解決了故障,恢復(fù)了網(wǎng)站的正常訪(fǎng)問(wèn),然而此次事故還是對(duì)B站造成了嚴(yán)重影響,不但影響了用戶(hù)正常訪(fǎng)問(wèn),還導(dǎo)致B站股價(jià)短線(xiàn)走低。因此,做好服務(wù)器宕機(jī)防范預(yù)案,對(duì)于政企單位維護(hù)網(wǎng)絡(luò)安全,保障業(yè)務(wù)系統(tǒng)持續(xù)性、可訪(fǎng)問(wèn)性至關(guān)重要。