天弘基金構(gòu)建云管平臺(tái):兼具運(yùn)營(yíng)分析和容災(zāi)演練能力
天弘基金的云管平臺(tái)不止于IT資產(chǎn)統(tǒng)一納管。
成立于2004年天弘基金是經(jīng)中國(guó)證監(jiān)會(huì)批準(zhǔn)設(shè)立的全國(guó)性公募基金管理公司之一。2013年,天弘基金與支付寶合作推出余額寶,是天弘余額寶貨幣市場(chǎng)基金管理人。
作為一家行業(yè)內(nèi)知名的公募基金管理機(jī)構(gòu),天弘基金的業(yè)務(wù)范圍已經(jīng)覆蓋了二級(jí)市場(chǎng)股票投資、債券投資、現(xiàn)金管理、衍生品投資、股權(quán)投資、債券投資等領(lǐng)域,管理運(yùn)作的公募基金超過(guò)50只。與業(yè)務(wù)規(guī)模擴(kuò)充相對(duì)應(yīng)的,是企業(yè)IT系統(tǒng)的持續(xù)擴(kuò)張和演進(jìn)。尤其是隨著互聯(lián)網(wǎng)金融市場(chǎng)的高速發(fā)展,天弘基金IT系統(tǒng)向云轉(zhuǎn)型的進(jìn)程進(jìn)一步加快。
在云計(jì)算的時(shí)代,天弘基金面對(duì)的一個(gè)重要挑戰(zhàn)就是——IT運(yùn)營(yíng)模式從傳統(tǒng)運(yùn)維模式向服務(wù)運(yùn)營(yíng)模式的轉(zhuǎn)變。
經(jīng)歷了十余年的建設(shè),天弘基金的IT基礎(chǔ)設(shè)施種類(lèi)繁多,從數(shù)據(jù)中心的虛擬化到各種類(lèi)型的公有云,云主機(jī)的數(shù)量急劇增長(zhǎng),與之配套的網(wǎng)絡(luò)服務(wù)、安全服務(wù)、運(yùn)維監(jiān)控平臺(tái)、容災(zāi)系統(tǒng)也陸續(xù)上線(xiàn)。
整體看來(lái),天弘基金面向傳統(tǒng)數(shù)據(jù)中心與云服務(wù)的綜合運(yùn)維體系建設(shè)已經(jīng)相對(duì)完整,但是隨著在云服務(wù)體系下資源申請(qǐng)、交付、回收頻率的快速攀升,IT運(yùn)維體系的建設(shè)與運(yùn)營(yíng)也遇到了一系列的新問(wèn)題。
挑戰(zhàn):運(yùn)維體系建設(shè)日臻完善,管理難度加大
作為一家行業(yè)領(lǐng)先的基金公司,天弘基金的運(yùn)維體系建設(shè)十分完善,但是運(yùn)維體系的各個(gè)組件或者子系統(tǒng)并沒(méi)有很強(qiáng)的關(guān)聯(lián)性,彼此之間獨(dú)立、分散,IT運(yùn)營(yíng)的整體效率難以提升。
具體來(lái)說(shuō),天弘基金面臨的現(xiàn)實(shí)的挑戰(zhàn)包括以下幾點(diǎn):
■ 敏捷開(kāi)發(fā)加大了資源交付的壓力。天弘基金現(xiàn)有的基礎(chǔ)設(shè)施分為云上、云下兩種場(chǎng)景,業(yè)務(wù)部門(mén)在申請(qǐng)資源時(shí),會(huì)由云上或云下的管理員以半自動(dòng)(手動(dòng)+腳本)的方式進(jìn)行交付。但是隨著業(yè)務(wù)的快速發(fā)展,自動(dòng)化、自助化的資源交付需求變得越來(lái)越強(qiáng)烈;
■ 異構(gòu)基礎(chǔ)設(shè)施帶來(lái)的管理復(fù)雜性。隨著天弘基金業(yè)務(wù)系統(tǒng)的不斷增多,IT基礎(chǔ)設(shè)施的規(guī)模和種類(lèi)持續(xù)增加,從虛擬化到公有云,再到專(zhuān)有云,這些異構(gòu)的基礎(chǔ)設(shè)施都只能在各自的管理門(mén)戶(hù)中獨(dú)立進(jìn)行管理;
■ 多云環(huán)境下的成本控制、費(fèi)用分析、預(yù)算管理難度持續(xù)增加。伴隨著越來(lái)越多的基礎(chǔ)設(shè)施建設(shè)并投入運(yùn)營(yíng),以及對(duì)公有云服務(wù)的廣泛應(yīng)用,IT成本分析以及預(yù)算制定難度越來(lái)越大;
■ 容災(zāi)流程不清晰、不透明導(dǎo)致的信息有效性差,狀態(tài)更新不及時(shí)。基金業(yè)務(wù)的應(yīng)用邏輯復(fù)雜,為了保證業(yè)務(wù)的有效性和連續(xù)性,天弘基金每年都會(huì)做一次大型的容災(zāi)切換演練。但從以往的經(jīng)驗(yàn)看,災(zāi)備切換演練需要耗費(fèi)大量的人力物力,雖然結(jié)果令人滿(mǎn)意,但過(guò)程仍然存在很多瑕疵。
目標(biāo):實(shí)現(xiàn)IT服務(wù)化轉(zhuǎn)型,運(yùn)維者向運(yùn)營(yíng)者的角色轉(zhuǎn)變
針對(duì)現(xiàn)階段IT運(yùn)維面臨的種種問(wèn)題,天弘基金信息技術(shù)部制定了詳細(xì)的目標(biāo)與規(guī)劃。經(jīng)過(guò)細(xì)致的調(diào)研和評(píng)估,天弘基金認(rèn)為,建設(shè)云管平臺(tái)有助于快速實(shí)現(xiàn)IT基礎(chǔ)設(shè)施的服務(wù)化,并且積極推動(dòng)企業(yè)IT從傳統(tǒng)的運(yùn)維模式向服務(wù)運(yùn)營(yíng)的方式轉(zhuǎn)變。
經(jīng)過(guò)梳理,天弘基金將云管平臺(tái)的能力建設(shè)具體到以下幾個(gè)方面的內(nèi)容:
1、構(gòu)建云管平臺(tái),實(shí)現(xiàn)多云基礎(chǔ)設(shè)施統(tǒng)一納管,面向業(yè)務(wù)用戶(hù)提供自服務(wù)
建設(shè)獨(dú)立于異構(gòu)基礎(chǔ)設(shè)施的云管平臺(tái),對(duì)現(xiàn)有基礎(chǔ)設(shè)施進(jìn)行統(tǒng)一納管。同時(shí),基于云管平臺(tái)的多租戶(hù)能力,結(jié)合規(guī)范與流程,向業(yè)務(wù)用戶(hù)提供自服務(wù),進(jìn)而實(shí)現(xiàn)在一個(gè)統(tǒng)一門(mén)戶(hù)下各類(lèi)型IT資源的自動(dòng)化構(gòu)建與發(fā)放。
2、強(qiáng)化云管平臺(tái)的運(yùn)營(yíng)分析能力,構(gòu)建云費(fèi)用分析模塊
在建設(shè)云管平臺(tái)時(shí)同步強(qiáng)化平臺(tái)自身的運(yùn)營(yíng)分析功能,從財(cái)務(wù)的角度增進(jìn)天弘基金的IT運(yùn)營(yíng)能力,構(gòu)建信息技術(shù)部成本收益衡量體系,量化基礎(chǔ)設(shè)施的成本與收益。這樣做的目標(biāo)是在降本增效的前提之下,提升業(yè)務(wù)的投資回報(bào)率。
3、建設(shè)邏輯鮮明、流程清晰的容災(zāi)可視化系統(tǒng)
開(kāi)發(fā)具備實(shí)時(shí)展現(xiàn)能力的容災(zāi)切換大屏,提升基于應(yīng)用事件觸發(fā)工作的自動(dòng)化能力。容災(zāi)大屏完整對(duì)接云上、云下的各類(lèi)容災(zāi)安全產(chǎn)品,實(shí)現(xiàn)安全策略與配置流程的自動(dòng)化與實(shí)時(shí)展示。
實(shí)踐:落地具備運(yùn)營(yíng)分析和容災(zāi)可視化能力的云管平臺(tái)
基于FIT2CLOUD云管平臺(tái),天弘基金信息技術(shù)部構(gòu)建了符合基金業(yè)務(wù)運(yùn)維與交付場(chǎng)景的自動(dòng)化運(yùn)維門(mén)戶(hù)。截止2019年年底,這一項(xiàng)目已經(jīng)完成兩期建設(shè)。
目前,天弘基金的云管平臺(tái)實(shí)現(xiàn)了對(duì)VMware虛擬化、阿里云、阿里金融云、螞蟻金融云等多云基礎(chǔ)設(shè)施的統(tǒng)一納管,并且完成了云管平臺(tái)與企業(yè)OA流程管理系統(tǒng)的對(duì)接,實(shí)現(xiàn)了IT資源基于現(xiàn)有流程體系的申請(qǐng)與發(fā)放,為業(yè)務(wù)人員和運(yùn)維人員提供資源全生命周期的管理能力,并且向管理者和決策者提供細(xì)粒度的運(yùn)營(yíng)分析視圖。
■ 借助統(tǒng)一服務(wù)門(mén)戶(hù)釋放資源管理能力
基于云管平臺(tái)的多租戶(hù)體系,運(yùn)維團(tuán)隊(duì)向開(kāi)發(fā)與項(xiàng)目部門(mén)的用戶(hù)提供多云基礎(chǔ)設(shè)施中的服務(wù)目錄。用戶(hù)可在服務(wù)目錄中自行申請(qǐng)所需的操作系統(tǒng)及中間件服務(wù),經(jīng)過(guò)管理員的合規(guī)性審批后,由云管平臺(tái)自動(dòng)構(gòu)建相應(yīng)的服務(wù),并交付給申請(qǐng)者。同時(shí),用戶(hù)還可以通過(guò)云管平臺(tái)對(duì)資源進(jìn)行全生命周期管理,實(shí)現(xiàn)云主機(jī)的啟停、配置變更、克隆等自助式運(yùn)維操作;
■ 構(gòu)建云資源運(yùn)營(yíng)及費(fèi)用管理模塊
天弘基金在基于云管平臺(tái)實(shí)現(xiàn)多云基礎(chǔ)設(shè)施統(tǒng)一納管的基礎(chǔ)之上,借助云管平臺(tái)的標(biāo)簽功能,完善云主機(jī)的各項(xiàng)基礎(chǔ)元數(shù)據(jù),使得原本分散的各類(lèi)信息在云管平臺(tái)中進(jìn)行統(tǒng)一的展示和管理。
另一方面,充分利用云管平臺(tái)的云費(fèi)用管理模塊,依托私有數(shù)據(jù)中心計(jì)量計(jì)費(fèi)模型,并且同步公有云賬單,持續(xù)地對(duì)IT系統(tǒng)的資源、費(fèi)用等使用情況進(jìn)行各個(gè)維度(通過(guò)資源所屬租戶(hù)與標(biāo)簽等信息)的度量、分析和優(yōu)化,從費(fèi)用分析入手,明確費(fèi)用分?jǐn)偂_@樣做可以更加明確地管控企業(yè)云資源整體的支出和預(yù)算,結(jié)合云管平臺(tái)的資源分析能力,制定費(fèi)用優(yōu)化策略,繼而改進(jìn)預(yù)測(cè)和預(yù)算,提升云費(fèi)用管理的效率和成熟度;
■ 通過(guò)云管平臺(tái)的開(kāi)放性接口,整合內(nèi)部運(yùn)維系統(tǒng)
云管平臺(tái)提供了開(kāi)放性的接口,通過(guò)對(duì)接各類(lèi)平臺(tái),實(shí)現(xiàn)運(yùn)維管理的全閉環(huán)操作,保證資源在創(chuàng)建前和創(chuàng)建后自動(dòng)同步各類(lèi)信息數(shù)據(jù),靈活調(diào)用各類(lèi)服務(wù)。目前,天弘基金已經(jīng)通過(guò)云管平臺(tái)對(duì)接了OA系統(tǒng)、網(wǎng)絡(luò)自動(dòng)化平臺(tái)、部分監(jiān)控平臺(tái)及安全服務(wù)平臺(tái)等。通過(guò)既有管理系統(tǒng)與云管平臺(tái)的集成與整合,實(shí)現(xiàn)了運(yùn)維體系的自動(dòng)同步與自動(dòng)化配置。
收益:IaaS及IaaS+服務(wù)的智能化、自動(dòng)化運(yùn)營(yíng)
經(jīng)過(guò)兩期云管平臺(tái)的建設(shè),天弘基金已經(jīng)實(shí)現(xiàn)了多云基礎(chǔ)設(shè)施的統(tǒng)一管理,并且在日常運(yùn)營(yíng)管理的過(guò)程中深度結(jié)合了費(fèi)用管理的能力,至此天弘基金的IT服務(wù)化與運(yùn)營(yíng)的轉(zhuǎn)型目標(biāo)基本實(shí)現(xiàn)。云管平臺(tái)為天弘基金帶來(lái)的收益包括:
■ 資源交付全面轉(zhuǎn)向自動(dòng)化,通過(guò)云管平臺(tái)的統(tǒng)一門(mén)戶(hù),業(yè)務(wù)部門(mén)可按需快速申請(qǐng)并獲取所需的云服務(wù)資源,在釋放運(yùn)維管理人力的同時(shí),加速了業(yè)務(wù)的敏捷交付與投產(chǎn);
■ 實(shí)現(xiàn)了對(duì)異構(gòu)資源的統(tǒng)一管理與統(tǒng)計(jì)分析,管理員通過(guò)云管平臺(tái)可實(shí)時(shí)了解資源使用情況,資源利用率大幅提升;
■ IT費(fèi)用全面可視化、透明化。通過(guò)多維度的費(fèi)用分析與優(yōu)化建議,實(shí)現(xiàn)了IT費(fèi)用的可計(jì)量、可分?jǐn)偅Y(jié)合費(fèi)用使用趨勢(shì)對(duì)未來(lái)的基礎(chǔ)設(shè)施建設(shè)做出合理預(yù)測(cè);
■ 通過(guò)容災(zāi)大屏系統(tǒng)有效規(guī)范容災(zāi)流程,實(shí)現(xiàn)了容災(zāi)過(guò)程的標(biāo)準(zhǔn)化。通過(guò)前端視圖為操作者、管理者和決策者實(shí)時(shí)、動(dòng)態(tài)的展示容災(zāi)進(jìn)程。
規(guī)劃:實(shí)現(xiàn)資源與服務(wù)的一站式交付,構(gòu)建IT技術(shù)中臺(tái)
結(jié)合企業(yè)IT的未來(lái)發(fā)展趨勢(shì),天弘基金也對(duì)云管平臺(tái)提出了更高的要求,云管平臺(tái)未來(lái)在整體IT架構(gòu)中所扮演的角色也更加明確。
■ 現(xiàn)階段,天弘基金已經(jīng)基于云管平臺(tái)實(shí)現(xiàn)了IaaS及IaaS+服務(wù)的自動(dòng)化交付,而業(yè)務(wù)部門(mén)對(duì)于一站式資源申請(qǐng)的需求日益強(qiáng)烈。后續(xù)會(huì)通過(guò)云管平臺(tái)實(shí)現(xiàn)對(duì)負(fù)載均衡、公有云服務(wù)(RDS、SLB、OSS等)、備份等產(chǎn)品的服務(wù)化,實(shí)現(xiàn)在資源創(chuàng)建完成后可自動(dòng)創(chuàng)建相關(guān)網(wǎng)絡(luò)、安全等服務(wù)的目標(biāo);
■ 云管平臺(tái)還將成為天弘基金監(jiān)控體系的集大成者。目前天弘基金有多套監(jiān)控平臺(tái)共存,這些監(jiān)控平臺(tái)管理的對(duì)象包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、機(jī)房及應(yīng)用等。由于監(jiān)控信息分散在不同的系統(tǒng)之中,需要統(tǒng)一的監(jiān)控視圖對(duì)不同的告警進(jìn)行展示,并且將歷史發(fā)生的事件進(jìn)行沉淀,最終形成一個(gè)方便使用者發(fā)現(xiàn)處理、方便決策者觀(guān)察評(píng)估的統(tǒng)一監(jiān)控門(mén)戶(hù);
■ 由于IT資產(chǎn)規(guī)模龐大并快速增長(zhǎng),且各類(lèi)資產(chǎn)都具有一定的關(guān)聯(lián)性,企業(yè)IT服務(wù)化運(yùn)營(yíng)的復(fù)雜性持續(xù)增加。復(fù)雜的關(guān)聯(lián)信息和邏輯管理會(huì)帶來(lái)較大的人力成本消耗,天弘基金計(jì)劃通過(guò)持續(xù)強(qiáng)化云管平臺(tái)在運(yùn)營(yíng)分析方面的能力實(shí)現(xiàn)各類(lèi)型資產(chǎn)的全面可視化管理,確保多云基礎(chǔ)設(shè)施的智能化運(yùn)營(yíng)能力。
用戶(hù)說(shuō)
“天弘基金借助云管平臺(tái)實(shí)現(xiàn)了IT基礎(chǔ)設(shè)施服務(wù)化的目標(biāo),并且針對(duì)性地強(qiáng)化了其在運(yùn)營(yíng)分析和容災(zāi)演練支持等方面的能力。未來(lái),天弘基金將圍繞云管平臺(tái)展開(kāi)更加廣泛的技術(shù)實(shí)踐,深度整合各類(lèi)運(yùn)維系統(tǒng),實(shí)現(xiàn)IT運(yùn)營(yíng)服務(wù)門(mén)戶(hù)的統(tǒng)一化,以及IT資源交付的一站化。最終,云管平臺(tái)將會(huì)演變成為天弘基金IT運(yùn)維的技術(shù)中臺(tái),通過(guò)聚合運(yùn)維技術(shù)能力的方式,持續(xù)降低企業(yè)IT運(yùn)營(yíng)管理的成本。”
——天弘基金信息技術(shù)部 張斌