容災(zāi)漏洞致互聯(lián)網(wǎng)企業(yè)事故頻發(fā)
2015年06月08日 09:30
來(lái)源:京華時(shí)報(bào)
5月27日、28日,支付寶和攜程雙雙出現(xiàn)用戶無(wú)法正常使用的問(wèn)題,盡管事故原因并不相同,卻也為互聯(lián)網(wǎng)企業(yè)的運(yùn)行安全敲響了警鐘。之前并不怎么被人提起的容災(zāi)能力建設(shè),也重新回到人們的視野。
原標(biāo)題:容災(zāi)漏洞致互聯(lián)網(wǎng)企業(yè)事故頻發(fā)
5月27日、28日,支付寶和攜程雙雙出現(xiàn)用戶無(wú)法正常使用的問(wèn)題,盡管事故原因并不相同,卻也為互聯(lián)網(wǎng)企業(yè)的運(yùn)行安全敲響了警鐘。之前并不怎么被人提起的容災(zāi)能力建設(shè),也重新回到人們的視野。
連續(xù)兩天兩起事故
“說(shuō)起來(lái)也真是夠寸的,平時(shí)很少發(fā)生的事故這回一下就是兩起,而且連續(xù)兩天發(fā)生,應(yīng)該是很小概率的情況。”一位互聯(lián)網(wǎng)業(yè)內(nèi)人士感慨道,他所說(shuō)的小概率事件,就是上周支付寶和攜程連續(xù)發(fā)生的嚴(yán)重事故。
5月27日下午,支付寶出現(xiàn)大規(guī)模癱瘓,國(guó)內(nèi)很多支付寶用戶在PC端和移動(dòng)端均無(wú)法轉(zhuǎn)賬付款,這一事故持續(xù)了差不多兩小時(shí)。支付寶方面對(duì)外表示,造成此次事故的原因,是由于市政施工使得杭州市蕭山區(qū)某地光纜被挖斷,進(jìn)而導(dǎo)致支付寶一個(gè)主要機(jī)房受影響。
無(wú)獨(dú)有偶,第二天,攜程又出事了。從當(dāng)天中午開(kāi)始,攜程官方網(wǎng)站及APP出現(xiàn)了無(wú)法正常使用的情況,更為嚴(yán)重的是,這一事故持續(xù)了12個(gè)小時(shí)才被修復(fù),這也引發(fā)了外界對(duì)攜程的種種猜測(cè)。最終攜程方面給出的解釋是,由于員工錯(cuò)誤操作,刪除了生產(chǎn)服務(wù)器上的執(zhí)行代碼。
中國(guó)領(lǐng)先的CDN服務(wù)提供商藍(lán)汛通信的技術(shù)專(zhuān)家表示,像支付寶和攜程這么嚴(yán)重的事故確實(shí)很少見(jiàn),連續(xù)兩天發(fā)生更是罕見(jiàn)。該專(zhuān)家介紹,互聯(lián)網(wǎng)企業(yè)發(fā)生事故,可以分為機(jī)器級(jí)和機(jī)房級(jí)兩類(lèi),前者主要原因是系統(tǒng)架構(gòu)不是很好,遇到訪問(wèn)量過(guò)多會(huì)帶來(lái)“宕機(jī)”;后者則主要是外部攻擊造成的,會(huì)造成機(jī)房的癱瘓。“機(jī)器級(jí)的故障主要是實(shí)力較弱的互聯(lián)網(wǎng)企業(yè)會(huì)遇到,像支付寶、攜程這樣的大企業(yè),這一類(lèi)問(wèn)題應(yīng)該不會(huì)發(fā)生在他們身上了。能夠給這樣的企業(yè)帶來(lái)威脅的,一般就是機(jī)房級(jí)的故障了。”
機(jī)房級(jí)事故之前也是偶有發(fā)生。例如,2013年7月,由于上海一條光纜被挖斷,就導(dǎo)致微信在很多地區(qū)無(wú)法正常使用,時(shí)間長(zhǎng)達(dá)7小時(shí);2014年10月,也是因?yàn)樯虾C(jī)房出現(xiàn)故障,導(dǎo)致微信全國(guó)大面積故障2小時(shí)。
容災(zāi)建設(shè)不容忽視
“雖然這一次的兩起事故看似很偶然,可也能反映出互聯(lián)網(wǎng)企業(yè)在容災(zāi)能力上的漏洞,而漏洞的存在,又使得事故遲早會(huì)發(fā)生。”藍(lán)汛方面表示。容災(zāi)是指企業(yè)對(duì)于可能發(fā)生的系統(tǒng)故障的防范性準(zhǔn)備,比較準(zhǔn)確的解釋是“建立兩套或多套功能相同的IT系統(tǒng),當(dāng)一處系統(tǒng)停止工作時(shí),整個(gè)應(yīng)用系統(tǒng)可以切換到另一處,使得該系統(tǒng)功能可以繼續(xù)正常工作。”
據(jù)業(yè)內(nèi)人士向記者介紹,根據(jù)容災(zāi)系統(tǒng)對(duì)災(zāi)難的抵抗程度,可分為數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。數(shù)據(jù)容災(zāi)是指建立一個(gè)異地的數(shù)據(jù)系統(tǒng),對(duì)關(guān)鍵的數(shù)據(jù)進(jìn)行備份存儲(chǔ),當(dāng)故障造成本地?cái)?shù)據(jù)丟失時(shí),可以通過(guò)備份找回;應(yīng)用容災(zāi)層次更高,即在異地建立一套完整的、與本地?cái)?shù)據(jù)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng),在災(zāi)難出現(xiàn)后,遠(yuǎn)程應(yīng)用系統(tǒng)迅速接管或承擔(dān)本地應(yīng)用系統(tǒng)的業(yè)務(wù)運(yùn)行。業(yè)內(nèi)人士稱(chēng),現(xiàn)在對(duì)于數(shù)據(jù)安全的重要性,多數(shù)互聯(lián)網(wǎng)企業(yè)都有清楚的認(rèn)識(shí),數(shù)據(jù)的備份都做得比較完備,這方面出問(wèn)題的可能性不大,可能會(huì)出現(xiàn)問(wèn)題的,還主要是在應(yīng)用容災(zāi)上。
藍(lán)汛技術(shù)專(zhuān)家介紹,容災(zāi)企業(yè)建設(shè)主要有三種方式,一種是冷備份,也就是備份服務(wù)器平時(shí)并不運(yùn)行,只有發(fā)生事故后才開(kāi)機(jī)啟動(dòng),這種備份方式由于需要啟動(dòng),系統(tǒng)恢復(fù)的時(shí)間會(huì)比較長(zhǎng);一種是熱備份,備份站點(diǎn)也和主站一樣處于運(yùn)行狀態(tài),但只備份數(shù)據(jù),不承擔(dān)業(yè)務(wù),只有當(dāng)出現(xiàn)意外情況時(shí),備份站點(diǎn)才接替主站點(diǎn)的業(yè)務(wù),這種備份方式也會(huì)存在一定的時(shí)延;另外一種就是異地雙活的容災(zāi)方式,也就是在相隔較遠(yuǎn)的地方分別建立兩個(gè)機(jī)房,且都處于工作狀態(tài),共同承擔(dān)日常運(yùn)行工作,一旦其中一個(gè)出現(xiàn)意外,則另一個(gè)承擔(dān)起全部工作。直觀地說(shuō),異地雙活的方式,就好比一個(gè)人可以完成的工作,在日常卻安排兩個(gè)人來(lái)同時(shí)完成,當(dāng)其中一個(gè)人有事不能工作時(shí),另一個(gè)人可以獨(dú)立完成。相比其他方式,異地雙活的容災(zāi),對(duì)意外情況的響應(yīng)幾乎可以做到零時(shí)延,可能用戶根本就不會(huì)感覺(jué)到就實(shí)現(xiàn)切換了。
相關(guān)新聞:
網(wǎng)羅天下
頻道推薦
智能推薦
圖片新聞
視頻
-
滕醉漢醫(yī)院耍酒瘋 對(duì)醫(yī)生大打出手
播放數(shù):1133929
-
西漢海昏侯墓出土大量竹簡(jiǎn)木牘 填史料空缺
播放數(shù):4135875
-
電話詐騙44萬(wàn) 運(yùn)營(yíng)商被判賠償
播放數(shù):2845975
-
被擊落戰(zhàn)機(jī)殘骸畫(huà)面首度公布
播放數(shù):535774













