天弘基金構(gòu)建云管平臺:兼具運營分析和容災(zāi)演練能力
天弘基金的云管平臺不止于IT資產(chǎn)統(tǒng)一納管。
成立于2004年天弘基金是經(jīng)中國證監(jiān)會批準(zhǔn)設(shè)立的全國性公募基金管理公司之一。2013年,天弘基金與支付寶合作推出余額寶,是天弘余額寶貨幣市場基金管理人。
作為一家行業(yè)內(nèi)知名的公募基金管理機(jī)構(gòu),天弘基金的業(yè)務(wù)范圍已經(jīng)覆蓋了二級市場股票投資、債券投資、現(xiàn)金管理、衍生品投資、股權(quán)投資、債券投資等領(lǐng)域,管理運作的公募基金超過50只。與業(yè)務(wù)規(guī)模擴(kuò)充相對應(yīng)的,是企業(yè)IT系統(tǒng)的持續(xù)擴(kuò)張和演進(jìn)。尤其是隨著互聯(lián)網(wǎng)金融市場的高速發(fā)展,天弘基金IT系統(tǒng)向云轉(zhuǎn)型的進(jìn)程進(jìn)一步加快。
在云計算的時代,天弘基金面對的一個重要挑戰(zhàn)就是——IT運營模式從傳統(tǒng)運維模式向服務(wù)運營模式的轉(zhuǎn)變。
經(jīng)歷了十余年的建設(shè),天弘基金的IT基礎(chǔ)設(shè)施種類繁多,從數(shù)據(jù)中心的虛擬化到各種類型的公有云,云主機(jī)的數(shù)量急劇增長,與之配套的網(wǎng)絡(luò)服務(wù)、安全服務(wù)、運維監(jiān)控平臺、容災(zāi)系統(tǒng)也陸續(xù)上線。
整體看來,天弘基金面向傳統(tǒng)數(shù)據(jù)中心與云服務(wù)的綜合運維體系建設(shè)已經(jīng)相對完整,但是隨著在云服務(wù)體系下資源申請、交付、回收頻率的快速攀升,IT運維體系的建設(shè)與運營也遇到了一系列的新問題。
挑戰(zhàn):運維體系建設(shè)日臻完善,管理難度加大
作為一家行業(yè)領(lǐng)先的基金公司,天弘基金的運維體系建設(shè)十分完善,但是運維體系的各個組件或者子系統(tǒng)并沒有很強的關(guān)聯(lián)性,彼此之間獨立、分散,IT運營的整體效率難以提升。
具體來說,天弘基金面臨的現(xiàn)實的挑戰(zhàn)包括以下幾點:
■ 敏捷開發(fā)加大了資源交付的壓力。天弘基金現(xiàn)有的基礎(chǔ)設(shè)施分為云上、云下兩種場景,業(yè)務(wù)部門在申請資源時,會由云上或云下的管理員以半自動(手動+腳本)的方式進(jìn)行交付。但是隨著業(yè)務(wù)的快速發(fā)展,自動化、自助化的資源交付需求變得越來越強烈;
■ 異構(gòu)基礎(chǔ)設(shè)施帶來的管理復(fù)雜性。隨著天弘基金業(yè)務(wù)系統(tǒng)的不斷增多,IT基礎(chǔ)設(shè)施的規(guī)模和種類持續(xù)增加,從虛擬化到公有云,再到專有云,這些異構(gòu)的基礎(chǔ)設(shè)施都只能在各自的管理門戶中獨立進(jìn)行管理;
■ 多云環(huán)境下的成本控制、費用分析、預(yù)算管理難度持續(xù)增加。伴隨著越來越多的基礎(chǔ)設(shè)施建設(shè)并投入運營,以及對公有云服務(wù)的廣泛應(yīng)用,IT成本分析以及預(yù)算制定難度越來越大;
■ 容災(zāi)流程不清晰、不透明導(dǎo)致的信息有效性差,狀態(tài)更新不及時。基金業(yè)務(wù)的應(yīng)用邏輯復(fù)雜,為了保證業(yè)務(wù)的有效性和連續(xù)性,天弘基金每年都會做一次大型的容災(zāi)切換演練。但從以往的經(jīng)驗看,災(zāi)備切換演練需要耗費大量的人力物力,雖然結(jié)果令人滿意,但過程仍然存在很多瑕疵。
目標(biāo):實現(xiàn)IT服務(wù)化轉(zhuǎn)型,運維者向運營者的角色轉(zhuǎn)變
針對現(xiàn)階段IT運維面臨的種種問題,天弘基金信息技術(shù)部制定了詳細(xì)的目標(biāo)與規(guī)劃。經(jīng)過細(xì)致的調(diào)研和評估,天弘基金認(rèn)為,建設(shè)云管平臺有助于快速實現(xiàn)IT基礎(chǔ)設(shè)施的服務(wù)化,并且積極推動企業(yè)IT從傳統(tǒng)的運維模式向服務(wù)運營的方式轉(zhuǎn)變。
經(jīng)過梳理,天弘基金將云管平臺的能力建設(shè)具體到以下幾個方面的內(nèi)容:
1、構(gòu)建云管平臺,實現(xiàn)多云基礎(chǔ)設(shè)施統(tǒng)一納管,面向業(yè)務(wù)用戶提供自服務(wù)
建設(shè)獨立于異構(gòu)基礎(chǔ)設(shè)施的云管平臺,對現(xiàn)有基礎(chǔ)設(shè)施進(jìn)行統(tǒng)一納管。同時,基于云管平臺的多租戶能力,結(jié)合規(guī)范與流程,向業(yè)務(wù)用戶提供自服務(wù),進(jìn)而實現(xiàn)在一個統(tǒng)一門戶下各類型IT資源的自動化構(gòu)建與發(fā)放。
2、強化云管平臺的運營分析能力,構(gòu)建云費用分析模塊
在建設(shè)云管平臺時同步強化平臺自身的運營分析功能,從財務(wù)的角度增進(jìn)天弘基金的IT運營能力,構(gòu)建信息技術(shù)部成本收益衡量體系,量化基礎(chǔ)設(shè)施的成本與收益。這樣做的目標(biāo)是在降本增效的前提之下,提升業(yè)務(wù)的投資回報率。
3、建設(shè)邏輯鮮明、流程清晰的容災(zāi)可視化系統(tǒng)
開發(fā)具備實時展現(xiàn)能力的容災(zāi)切換大屏,提升基于應(yīng)用事件觸發(fā)工作的自動化能力。容災(zāi)大屏完整對接云上、云下的各類容災(zāi)安全產(chǎn)品,實現(xiàn)安全策略與配置流程的自動化與實時展示。
實踐:落地具備運營分析和容災(zāi)可視化能力的云管平臺
基于FIT2CLOUD云管平臺,天弘基金信息技術(shù)部構(gòu)建了符合基金業(yè)務(wù)運維與交付場景的自動化運維門戶。截止2019年年底,這一項目已經(jīng)完成兩期建設(shè)。
目前,天弘基金的云管平臺實現(xiàn)了對VMware虛擬化、阿里云、阿里金融云、螞蟻金融云等多云基礎(chǔ)設(shè)施的統(tǒng)一納管,并且完成了云管平臺與企業(yè)OA流程管理系統(tǒng)的對接,實現(xiàn)了IT資源基于現(xiàn)有流程體系的申請與發(fā)放,為業(yè)務(wù)人員和運維人員提供資源全生命周期的管理能力,并且向管理者和決策者提供細(xì)粒度的運營分析視圖。
附圖 天弘基金云管平臺建設(shè)方案
■ 借助統(tǒng)一服務(wù)門戶釋放資源管理能力
基于云管平臺的多租戶體系,運維團(tuán)隊向開發(fā)與項目部門的用戶提供多云基礎(chǔ)設(shè)施中的服務(wù)目錄。用戶可在服務(wù)目錄中自行申請所需的操作系統(tǒng)及中間件服務(wù),經(jīng)過管理員的合規(guī)性審批后,由云管平臺自動構(gòu)建相應(yīng)的服務(wù),并交付給申請者。同時,用戶還可以通過云管平臺對資源進(jìn)行全生命周期管理,實現(xiàn)云主機(jī)的啟停、配置變更、克隆等自助式運維操作;
■ 構(gòu)建云資源運營及費用管理模塊
天弘基金在基于云管平臺實現(xiàn)多云基礎(chǔ)設(shè)施統(tǒng)一納管的基礎(chǔ)之上,借助云管平臺的標(biāo)簽功能,完善云主機(jī)的各項基礎(chǔ)元數(shù)據(jù),使得原本分散的各類信息在云管平臺中進(jìn)行統(tǒng)一的展示和管理。
另一方面,充分利用云管平臺的云費用管理模塊,依托私有數(shù)據(jù)中心計量計費模型,并且同步公有云賬單,持續(xù)地對IT系統(tǒng)的資源、費用等使用情況進(jìn)行各個維度(通過資源所屬租戶與標(biāo)簽等信息)的度量、分析和優(yōu)化,從費用分析入手,明確費用分?jǐn)偂_@樣做可以更加明確地管控企業(yè)云資源整體的支出和預(yù)算,結(jié)合云管平臺的資源分析能力,制定費用優(yōu)化策略,繼而改進(jìn)預(yù)測和預(yù)算,提升云費用管理的效率和成熟度;
■ 通過云管平臺的開放性接口,整合內(nèi)部運維系統(tǒng)
云管平臺提供了開放性的接口,通過對接各類平臺,實現(xiàn)運維管理的全閉環(huán)操作,保證資源在創(chuàng)建前和創(chuàng)建后自動同步各類信息數(shù)據(jù),靈活調(diào)用各類服務(wù)。目前,天弘基金已經(jīng)通過云管平臺對接了OA系統(tǒng)、網(wǎng)絡(luò)自動化平臺、部分監(jiān)控平臺及安全服務(wù)平臺等。通過既有管理系統(tǒng)與云管平臺的集成與整合,實現(xiàn)了運維體系的自動同步與自動化配置。
收益:IaaS及IaaS+服務(wù)的智能化、自動化運營
經(jīng)過兩期云管平臺的建設(shè),天弘基金已經(jīng)實現(xiàn)了多云基礎(chǔ)設(shè)施的統(tǒng)一管理,并且在日常運營管理的過程中深度結(jié)合了費用管理的能力,至此天弘基金的IT服務(wù)化與運營的轉(zhuǎn)型目標(biāo)基本實現(xiàn)。云管平臺為天弘基金帶來的收益包括:
■ 資源交付全面轉(zhuǎn)向自動化,通過云管平臺的統(tǒng)一門戶,業(yè)務(wù)部門可按需快速申請并獲取所需的云服務(wù)資源,在釋放運維管理人力的同時,加速了業(yè)務(wù)的敏捷交付與投產(chǎn);
■ 實現(xiàn)了對異構(gòu)資源的統(tǒng)一管理與統(tǒng)計分析,管理員通過云管平臺可實時了解資源使用情況,資源利用率大幅提升;
■ IT費用全面可視化、透明化。通過多維度的費用分析與優(yōu)化建議,實現(xiàn)了IT費用的可計量、可分?jǐn)?,結(jié)合費用使用趨勢對未來的基礎(chǔ)設(shè)施建設(shè)做出合理預(yù)測;
■ 通過容災(zāi)大屏系統(tǒng)有效規(guī)范容災(zāi)流程,實現(xiàn)了容災(zāi)過程的標(biāo)準(zhǔn)化。通過前端視圖為操作者、管理者和決策者實時、動態(tài)的展示容災(zāi)進(jìn)程。
規(guī)劃:實現(xiàn)資源與服務(wù)的一站式交付,構(gòu)建IT技術(shù)中臺
結(jié)合企業(yè)IT的未來發(fā)展趨勢,天弘基金也對云管平臺提出了更高的要求,云管平臺未來在整體IT架構(gòu)中所扮演的角色也更加明確。
■ 現(xiàn)階段,天弘基金已經(jīng)基于云管平臺實現(xiàn)了IaaS及IaaS+服務(wù)的自動化交付,而業(yè)務(wù)部門對于一站式資源申請的需求日益強烈。后續(xù)會通過云管平臺實現(xiàn)對負(fù)載均衡、公有云服務(wù)(RDS、SLB、OSS等)、備份等產(chǎn)品的服務(wù)化,實現(xiàn)在資源創(chuàng)建完成后可自動創(chuàng)建相關(guān)網(wǎng)絡(luò)、安全等服務(wù)的目標(biāo);
■ 云管平臺還將成為天弘基金監(jiān)控體系的集大成者。目前天弘基金有多套監(jiān)控平臺共存,這些監(jiān)控平臺管理的對象包括服務(wù)器、存儲、網(wǎng)絡(luò)、機(jī)房及應(yīng)用等。由于監(jiān)控信息分散在不同的系統(tǒng)之中,需要統(tǒng)一的監(jiān)控視圖對不同的告警進(jìn)行展示,并且將歷史發(fā)生的事件進(jìn)行沉淀,最終形成一個方便使用者發(fā)現(xiàn)處理、方便決策者觀察評估的統(tǒng)一監(jiān)控門戶;
■ 由于IT資產(chǎn)規(guī)模龐大并快速增長,且各類資產(chǎn)都具有一定的關(guān)聯(lián)性,企業(yè)IT服務(wù)化運營的復(fù)雜性持續(xù)增加。復(fù)雜的關(guān)聯(lián)信息和邏輯管理會帶來較大的人力成本消耗,天弘基金計劃通過持續(xù)強化云管平臺在運營分析方面的能力實現(xiàn)各類型資產(chǎn)的全面可視化管理,確保多云基礎(chǔ)設(shè)施的智能化運營能力。