核心提示: 去年達(dá)美航空公司的宕機(jī)在平靜的航空業(yè)掀起了漣漪,而后宕機(jī)事件可謂前赴后繼。IT中斷給乘客帶來不好的用戶體驗(yàn)外,也讓航空公司遭受巨大的經(jīng)濟(jì)損失。那么航空公司有沒有從這一起起事件中獲得一些經(jīng)驗(yàn)教訓(xùn)呢?
去年達(dá)美航空公司的宕機(jī)在平靜的航空業(yè)掀起了漣漪,而后宕機(jī)事件可謂前赴后繼。IT中斷給乘客帶來不好的用戶體驗(yàn)外,也讓航空公司遭受巨大的經(jīng)濟(jì)損失。那么航空公司有沒有從這一起起事件中獲得一些經(jīng)驗(yàn)教訓(xùn)呢?
從1月底達(dá)美航空公司的停機(jī)時(shí)間來看,比去年的事故要短,且主要耗時(shí)在災(zāi)難恢復(fù)(DR)和IT復(fù)原方面,貌似應(yīng)該是從上一次事故中吸取了經(jīng)驗(yàn)。
對(duì)于航空公司來講,最大的挑戰(zhàn)是系統(tǒng)相互依賴,極為復(fù)雜,且必須全天性提供,不能進(jìn)行停機(jī)升級(jí)和維護(hù),而像航空公司這樣的傳統(tǒng)環(huán)境本就缺乏處理脆弱環(huán)境的能力。
有些公司開始將目光轉(zhuǎn)向云計(jì)算這類新的技術(shù)。作為全球最大的航空公司,美國(guó)航空公司已經(jīng)開始將一些應(yīng)用程序遷移至云端,以獲取更高的靈活性、可擴(kuò)展性和可靠性。此前它已與IBM簽訂協(xié)議,目前正在考慮其他的云業(yè)務(wù)和供應(yīng)商。
為何航空公司IT系統(tǒng)如此脆弱?
前不久,聯(lián)合航空公司數(shù)據(jù)中心也發(fā)生了中斷,而備受航空公司依賴的飛機(jī)通信處理和報(bào)告系統(tǒng)(ACARS)又罷了一次工。ACARS負(fù)責(zé)處理起飛時(shí)間、著陸時(shí)間、到達(dá)時(shí)間的數(shù)據(jù)傳輸,也涵蓋重量和平衡、天氣和風(fēng)力和飛行計(jì)劃等信息,同時(shí)還囊括聯(lián)邦航空管理局的空中交通管制數(shù)據(jù)。
這種用相對(duì)舊的語言編寫的舊系統(tǒng)運(yùn)行在舊的硬件上,本身就如風(fēng)中的稻草般脆弱。且航空公司的合并/收購致使不同系統(tǒng)進(jìn)行集成和合并,使問題更為復(fù)雜化,鑒于現(xiàn)有系統(tǒng)的復(fù)雜,耗費(fèi)大量財(cái)力物力重建IT基礎(chǔ)設(shè)施幾乎不太現(xiàn)實(shí)。
造成航空公司數(shù)據(jù)中心中斷的原因與其他行業(yè)并無二致:沒有被檢測(cè)出的故障或更新失敗。因此,變化控制和測(cè)試對(duì)保護(hù)環(huán)境健康運(yùn)作來講極為關(guān)鍵,需要更有效的變更控制用以識(shí)別和審查變更。對(duì)于常出現(xiàn)人為錯(cuò)誤的地方,自動(dòng)化可以有效地幫助解決問題。
對(duì)于航空公司來講,6-8個(gè)小時(shí)的宕機(jī)仍是不可容忍的。通過自動(dòng)化將舊的基礎(chǔ)設(shè)施與新的基礎(chǔ)設(shè)施連接起來,解決不同系統(tǒng)間手動(dòng)切換的問題。自動(dòng)化工具在堆棧中可以跨越和連接不同系統(tǒng),將其編排到一個(gè)工作流程中。而企業(yè)DR計(jì)劃也要嚴(yán)格進(jìn)行定期測(cè)試,確保問題發(fā)生時(shí)能發(fā)揮作用,若只是為了滿足政策合規(guī)那就很尷尬了。
當(dāng)然,僅擁有DR計(jì)劃還遠(yuǎn)遠(yuǎn)不夠,對(duì)新技術(shù)的采用以及保持IT人員與時(shí)俱進(jìn)也對(duì)IT系統(tǒng)的彈性有著重要影響,確保IT人員對(duì)恢復(fù)工作的了解是十分必要的。
來源:中國(guó)IDC圈
石家莊服務(wù)器托管 石家莊服務(wù)器租用 石家莊機(jī)柜租用 石家莊機(jī)房 |