品牌名稱(chēng)
海南航空
企業(yè)規(guī)模
10000人以上

ManageEngine助力海南航空IT運(yùn)維管理水平騰飛

320次閱讀

用戶(hù)概況

作為中國(guó)成長(zhǎng)速度最快的民航企業(yè)之一,海航集團(tuán)在信息化上也是航空業(yè)最具遠(yuǎn)見(jiàn)的領(lǐng)袖企業(yè)。隨著信息化的信息化建設(shè)的大力推進(jìn),海南航空已經(jīng)擁有規(guī)模龐大的數(shù)據(jù)中心以及十分先進(jìn)的業(yè)務(wù)應(yīng)用系統(tǒng),保證數(shù)據(jù)中心IT系統(tǒng)穩(wěn)定、高效運(yùn)行,成為擺在海航集團(tuán)系統(tǒng)運(yùn)維部門(mén)面前的一個(gè)嚴(yán)峻課題。

面臨問(wèn)題

海航集團(tuán)信息系統(tǒng)運(yùn)維工程師靠每天手工登錄各個(gè)服務(wù)器以輸入命令的方式檢查系統(tǒng),處理來(lái)自用戶(hù)的故障及問(wèn)題來(lái)保障系統(tǒng)的正常運(yùn)行,人員各自負(fù)責(zé)一項(xiàng)維護(hù)內(nèi)容,需要問(wèn)題相關(guān)人員一起分析處理,隨著系統(tǒng)出現(xiàn)問(wèn)題越來(lái)越多,工程師感覺(jué)工作不堪重負(fù),壓力越來(lái)越大。

總結(jié)當(dāng)前信息系統(tǒng)運(yùn)維管理面臨的主要挑戰(zhàn)有:
1.日常信息系統(tǒng)運(yùn)維管理處于救火方式,無(wú)反應(yīng)則無(wú)法第一時(shí)間發(fā)現(xiàn)系統(tǒng)問(wèn)題;
2.業(yè)務(wù)系統(tǒng)重要程度日益提升,現(xiàn)有的維護(hù)方式無(wú)法保證業(yè)務(wù)系統(tǒng)持續(xù)穩(wěn)定運(yùn)行,沒(méi)有行之有效的系統(tǒng)性能及問(wèn)題分析手段;
3.系統(tǒng)復(fù)雜度越來(lái)越高,對(duì)運(yùn)維人員需要掌握知識(shí)范圍及深度也越來(lái)越高,一個(gè)系統(tǒng)問(wèn)題,往往需要多個(gè)維護(hù)人員共同分析處理才能解決,部分經(jīng)常出現(xiàn)的問(wèn)題也不能得到有效的根治;
4.業(yè)務(wù)系統(tǒng)數(shù)量逐步增加,IT設(shè)備也隨之增長(zhǎng),現(xiàn)有設(shè)備情況沒(méi)有人完全掌握,對(duì)已有設(shè)備沒(méi)有完善管理方式,比較老舊的設(shè)備,也沒(méi)有人清楚歸誰(shuí)管理;
5.工程師日常操作均采用遠(yuǎn)程登錄方式,網(wǎng)絡(luò)設(shè)備的配置修改,系統(tǒng)軟件的變更出現(xiàn)問(wèn)題,往往不會(huì)及時(shí)顯現(xiàn)問(wèn)題,但問(wèn)題發(fā)生時(shí)影響卻可能很?chē)?yán)重;
6.工程師各自忙于個(gè)人工作,管理人員忙于協(xié)調(diào)人員救火,用戶(hù)一直抱怨系統(tǒng)經(jīng)常出現(xiàn)問(wèn)題,運(yùn)維部門(mén)解決不利。

解決方案

經(jīng)過(guò)對(duì)比和測(cè)試國(guó)際流行的IT運(yùn)維管理解決方案,海南航空最終確定選擇以卓豪ManageEngine網(wǎng)絡(luò)管理系統(tǒng)(OpManager)、應(yīng)用性能監(jiān)控系統(tǒng)(Application Manager)和存儲(chǔ)網(wǎng)絡(luò)管理系統(tǒng)(Opstor)三款產(chǎn)品為基礎(chǔ),構(gòu)建海南航空整體IT運(yùn)維管理平臺(tái)。

網(wǎng)絡(luò)故障監(jiān)控
作為整個(gè)IT系統(tǒng)的基礎(chǔ),其可用性時(shí)要優(yōu)先保障的,海南航空采用OpManager網(wǎng)絡(luò)管理模塊來(lái)實(shí)現(xiàn)此目標(biāo)。通過(guò)OpManager的實(shí)時(shí)監(jiān)控功能對(duì)每個(gè)設(shè)備的詳細(xì)性能進(jìn)行輪詢(xún)采集,并實(shí)時(shí)存儲(chǔ)于后臺(tái)數(shù)據(jù)庫(kù),管理人員可隨時(shí)對(duì)每個(gè)設(shè)備的運(yùn)行狀況和性能進(jìn)行實(shí)時(shí)查看,及時(shí)把握異常及性能下降的情況。通過(guò)OpManager直觀的網(wǎng)絡(luò)視圖、自定義視圖等展示功能,將實(shí)際網(wǎng)絡(luò)運(yùn)行情況、各設(shè)備狀態(tài)、線路狀態(tài)及流量等信息,實(shí)施展現(xiàn)在監(jiān)控屏幕上,供所有管理人員進(jìn)行隨時(shí)查看。另外,通過(guò)手機(jī)短信等手段,將各種告警、事件等及時(shí)通知給各相關(guān)人員,事先快速故障響應(yīng)、快速定位及快速故障排除,協(xié)助管理人員高效率的管理網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。

應(yīng)用性能監(jiān)控
對(duì)于中心更為重視的服務(wù)器群的管理,采用Applications Manager應(yīng)用服務(wù)管理模塊。通過(guò)直觀的業(yè)務(wù)視圖將服務(wù)器按業(yè)務(wù)進(jìn)行分組展示,并以圖形化的方式進(jìn)行展示,同時(shí)投放到監(jiān)控屏幕,由專(zhuān)業(yè)監(jiān)控人員實(shí)施監(jiān)視,確保問(wèn)題發(fā)生的同時(shí),即可有專(zhuān)業(yè)人員發(fā)現(xiàn)并進(jìn)行處理,同時(shí)結(jié)合短信的手段實(shí)現(xiàn)快速的發(fā)現(xiàn)及通知機(jī)制,以保證監(jiān)控工作沒(méi)有疏漏。借助于系統(tǒng)豐富的監(jiān)控功能,可對(duì)各個(gè)服務(wù)器及數(shù)據(jù)庫(kù)、Web服務(wù)等應(yīng)用的詳細(xì)性能進(jìn)行監(jiān)視,實(shí)現(xiàn)了性能級(jí)別的趨勢(shì)掌握以及事前管理等目標(biāo)。利用后臺(tái)繼承的數(shù)據(jù)庫(kù)進(jìn)行性能數(shù)據(jù)存儲(chǔ),并通過(guò)數(shù)十種默認(rèn)及自定制的報(bào)表進(jìn)行系統(tǒng)歷史運(yùn)行情況的匯總及報(bào)告,協(xié)助管理人員有效的進(jìn)行長(zhǎng)期規(guī)劃和工作總結(jié)等。

存儲(chǔ)網(wǎng)絡(luò)管理
利用OpStor全面監(jiān)控后臺(tái)的存儲(chǔ)網(wǎng)絡(luò),將海航數(shù)據(jù)中心中的光線交換機(jī)、磁盤(pán)陣列、磁帶庫(kù)等存儲(chǔ)網(wǎng)絡(luò)元素置于統(tǒng)一的管理平臺(tái)中,并對(duì)諸如可用性、健康狀況、接口詳情、Raid的磁盤(pán)詳情、分卷信息、控制器信息等實(shí)現(xiàn)實(shí)時(shí)的監(jiān)視。完全保證了管理人員對(duì)于后臺(tái)存儲(chǔ)網(wǎng)絡(luò)的實(shí)時(shí)管理,確保了整個(gè)存儲(chǔ)網(wǎng)絡(luò)的正常運(yùn)轉(zhuǎn)。

客戶(hù)受益

通過(guò)IT運(yùn)維管理平臺(tái)項(xiàng)目的建設(shè),實(shí)現(xiàn)了項(xiàng)目的整體預(yù)期,解決了信息系統(tǒng)面臨的多種運(yùn)維管理問(wèn)題,達(dá)到了建設(shè)目標(biāo),將國(guó)際先進(jìn)的運(yùn)維經(jīng)驗(yàn)應(yīng)用在海航集團(tuán)系統(tǒng)實(shí)際運(yùn)維工作中,實(shí)現(xiàn)了運(yùn)維管理水平的整體騰飛。