国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

自研數(shù)據(jù)中心專用處理器,阿里云的“芯”邏輯是什么

財經(jīng)十一人
+ 關(guān)注
2022-06-15 19:09
742次閱讀

國內(nèi)云計算產(chǎn)業(yè)走到了新的十字路口:一方面,云廠商競爭愈加關(guān)注市場、訂單、價格;此外,云計算技術(shù)正在進(jìn)入下一代架構(gòu)關(guān)鍵技術(shù)突破期

文 | 吳俊宇 陳伊凡  
編輯 | 謝麗容

國內(nèi)云計算市場經(jīng)歷過去幾年高速增長之后,正在進(jìn)入調(diào)整階段。

目前,云廠商的收入增速在回調(diào)。與此同時,云計算技術(shù)正在進(jìn)入下一代架構(gòu)關(guān)鍵技術(shù)突破期。2020年之后,亞馬遜AWS、微軟Azure、英偉達(dá)、英特爾正在加速改造云計算基礎(chǔ)設(shè)施設(shè)計方法,試圖定義下一代云計算架構(gòu)。比較通用的做法是,整合集群架構(gòu)、改善算法與管理軟件、定制芯片和硬件等,重塑基礎(chǔ)設(shè)施。

今年年初,多位云廠商高管曾對《財經(jīng)十一人》表示,國內(nèi)云市場目前存在一些偏離健康軌道的現(xiàn)象。比如,過度關(guān)注市場、訂單、價格競爭,忽略用技術(shù)創(chuàng)新引導(dǎo)客戶需求。本土、海外環(huán)境在變化,國內(nèi)云廠商走到了十字路口。

6月13日的2022年阿里云峰會上,阿里云智能總裁張建鋒表示,阿里云今年最重要策略是“Back to Basic”,回歸云計算技術(shù)本質(zhì),堅持技術(shù)“長征”。在關(guān)鍵階段,阿里云試圖為下代云架構(gòu)提前布局。

阿里云在此時發(fā)布了一款自研的云數(shù)據(jù)中心專用處理器。這款處理器被稱為CIPU(Cloud Infrastructure Processing Units 數(shù)據(jù)中心專用處理器)。CIPU相對輕量級,并不是公眾熟知的通用計算類芯片,而是專用于云計算數(shù)據(jù)中心的管控,可以綜合調(diào)度CPU(Central Processing Unit,中央處理器)、GPU(Graphics Processing Unit ,圖形處理器)、存儲硬盤、交換機(jī)等硬件。

理論上說,這款處理器會減少云廠商管理數(shù)據(jù)中心的損耗,讓數(shù)據(jù)中心算力更強(qiáng)、網(wǎng)絡(luò)更快,但算力成本不會明顯提升。阿里云基礎(chǔ)產(chǎn)品負(fù)責(zé)人蔣江偉在接受《財經(jīng)十一人》等媒體采訪時表示,該處理器已經(jīng)在阿里云數(shù)據(jù)中心規(guī)模使用。但阿里云方面并未披露硬件方面的關(guān)鍵技術(shù)指標(biāo)。

自研數(shù)據(jù)中心專用處理器,阿里云的“芯”邏輯是什么

阿里云智能總裁張建鋒表示,基于傳統(tǒng)的以CPU為中心的體系架構(gòu)已觸及瓶頸。新一代的云計算要從數(shù)據(jù)中心內(nèi)部做體系化創(chuàng)新,從以往的以CPU為中心的體系架構(gòu),進(jìn)入以CIPU為中心的體系架構(gòu)。

他解釋,這款云數(shù)據(jù)中心專用處理器CIPU是阿里云的管控中心。向下接入數(shù)據(jù)中心的計算、存儲、網(wǎng)絡(luò)資源,快速云化并進(jìn)行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬臺服務(wù)器。

阿里云推出CIPU,部署下一代云架構(gòu),要先從海外云廠商、芯片廠商的動作談起。

2020年后,海外云廠商、芯片廠商在加速設(shè)計下一代云計算基礎(chǔ)設(shè)施的架構(gòu)。新架構(gòu)中搭載云操作系統(tǒng)的處理器從CPU變成了一個新的硬件處理器。這個硬件由軟件定義、并對數(shù)據(jù)進(jìn)行硬件加速。

為什么要這樣做?本質(zhì)原因是,CPU芯片不是為了搭載云操作系統(tǒng)而設(shè)計。CPU的優(yōu)勢是單核性能強(qiáng),在指令性計算任務(wù)處理時,性能優(yōu)異,但天生的數(shù)據(jù)吞吐能力小,遇到分布式大數(shù)據(jù)系統(tǒng)就要消耗30%到50%資源用于搬運(yùn)數(shù)據(jù)。

隨著數(shù)據(jù)密集型計算變多,海量數(shù)據(jù)在不同系統(tǒng)中搬運(yùn)計算。這時,站在系統(tǒng)內(nèi)部“十字路口”中心位置的管控CPU就變成了“壞掉的紅綠燈”,數(shù)據(jù)擁堵導(dǎo)致性能下降。因此,需要引入新的芯片硬件,替換掉這個“紅綠燈”,讓數(shù)據(jù)流動通暢起來。

亞馬遜的方案是Nitro。2020年亞馬遜CTO沃納·沃格斯公開撰文稱,傳統(tǒng)架構(gòu)已經(jīng)優(yōu)化到了極限。沃格斯以AWS的客戶場景舉例,然而在傳統(tǒng)架構(gòu)下,仍然約30%的資源浪費(fèi)到了算力、網(wǎng)絡(luò)、存儲的運(yùn)營和調(diào)度管理上。這些資源沒有為客戶提供直接價值。

他提出的解決方案是,把大部分虛擬機(jī)管理程序遷移到專用硬件。早在2017年,亞馬遜AWS就試圖用Nitro系統(tǒng)取代上一代架構(gòu)。相比于CPU芯片像“牛刀”,Nitro像是“手術(shù)刀”,可以精準(zhǔn)解決云資源調(diào)度的問題。

在產(chǎn)品形態(tài)上看,Nitro既是硬件產(chǎn)品,也是軟件系統(tǒng)。作為硬件,Nitro是個盒子。其中包括若干個硬件模塊(操作系統(tǒng)芯片、安全芯片、網(wǎng)絡(luò)加速模塊等)。作為軟件,Nitro是數(shù)據(jù)中心的管理模塊,能直接調(diào)度監(jiān)控計算、存儲、網(wǎng)絡(luò)等硬件資源。

阿里云基礎(chǔ)產(chǎn)品負(fù)責(zé)人蔣江偉也強(qiáng)調(diào),阿里云的CIPU和亞馬遜AWS的Nitro定位類似。它既是硬件盒子,也是管控系統(tǒng),對接飛天云操作系統(tǒng)。CIPU主要由專用芯片和控制器構(gòu)成,形態(tài)像盒子或智能網(wǎng)卡,主要用于管理飛天云操作系統(tǒng)。

阿里云基礎(chǔ)產(chǎn)品架構(gòu)師黃瑞瑞則認(rèn)為,這款CIPU針對阿里云的神龍計算平臺、盤古存儲平臺、洛神網(wǎng)絡(luò)平臺、安全內(nèi)核進(jìn)行了深度的適配,會讓阿里云的計算、存儲、網(wǎng)絡(luò)、安全性能有更好的表現(xiàn)。但阿里云的客戶不會因為CIPU增加用云成本。

亞馬遜AWS、阿里云這些云廠商在定制云架構(gòu)的專用芯片時,芯片廠商也在同步推出相應(yīng)的芯片,試圖改造云基礎(chǔ)設(shè)施。

2020年之后英特爾、英偉達(dá)等芯片巨頭也在推出類似的數(shù)據(jù)中心產(chǎn)品。英特爾的IPU(Infrastructure Processing Units,基礎(chǔ)設(shè)施處理器)和英偉達(dá)的DPU(Data Processing Unit,數(shù)據(jù)處理器),雖然技術(shù)路徑南轅北轍,但目標(biāo)都非常一致——設(shè)計一個新的管控處理器,替換掉CPU的管控職能。

網(wǎng)絡(luò)處理器廠商博通也有相關(guān)動作,其知名產(chǎn)品是NPU(Network Processing Unit,網(wǎng)絡(luò)處理器)。博通在今年6月收購云計算與虛擬化廠商VMware,其意圖是以網(wǎng)絡(luò)芯片定制能力切入,改造數(shù)據(jù)中心。

一位半導(dǎo)體專業(yè)技術(shù)人士對《財經(jīng)十一人》表示,英特爾原本就是CPU巨頭,推出IPU是滿足數(shù)據(jù)密集型場景的高帶寬需求。英偉達(dá)則希望用DPU連接GPU,進(jìn)軍數(shù)據(jù)中心市場,彌補(bǔ)短板。

一位云計算專業(yè)技術(shù)人士告訴我們,亞馬遜AWS的Nitro、阿里云的CIPU、英特爾的IPU、英偉達(dá)的DPU各家定義和側(cè)重不同,定制芯片的產(chǎn)品職能也有部分重合。但核心在于各家不會對外透露的產(chǎn)品設(shè)計,“這個硬件不同于其他,這個位置是軟件和硬件的連接端口,要做到軟硬件完美融合,才能是個好產(chǎn)品。”

阿里云表示,CIPU不會對外出售,因為這款產(chǎn)品是專門為飛天操作系統(tǒng)量身定制,做到了軟硬一體的最佳融合。亞馬遜的Nitro也僅用在自家數(shù)據(jù)中心。而作為硬件提供方的英特爾和英偉達(dá),正在積極向其他云廠商推廣自己的IPU和DPU產(chǎn)品。

“現(xiàn)在大家都在投入的階段,誰也不信誰的,過幾年才能打出個局面來。誰贏了就能定義未來的IT產(chǎn)業(yè)鏈。”這位專業(yè)人士說。

自研數(shù)據(jù)中心專用管控芯片看起來可行。接下來的問題是,成本和戰(zhàn)略。

成本問題包括兩個層面,一是云廠商自身成本,二是客戶的用云成本。

如果云廠商向英偉達(dá)、英特爾采購專用的數(shù)據(jù)中心管控芯片,還要承擔(dān)運(yùn)營成本。此外,英偉達(dá)、英特爾提供的管控芯片仍無法完全滿足云廠商的個性化需求。

對云廠商來說,自研該芯片理論上更劃算。因為自研可滿足個性化需求,且價格可接受,還能提升管理、優(yōu)化功耗、減少云資源浪費(fèi)。

海外媒體在2022年有測算,Nitro的硬件處理器成本只需數(shù)十美元,但單片CPU芯片成本是數(shù)百或數(shù)千美元。亞馬遜AWS也曾公布,即使算上研發(fā)成本,Nitro定制芯片五年來的綜合成本仍相比CPU芯片更低。

對云計算客戶來說,他們有越來越多的數(shù)據(jù)密集型計算需求,需要價格不變的前提下,得到更高的性能。

以往Nitro定制芯片的實(shí)踐結(jié)果是,云上的計算、存儲、網(wǎng)絡(luò)資源變得更快也更安全,還不必承擔(dān)云廠商過去資源浪費(fèi)帶來的轉(zhuǎn)嫁成本。阿里云基礎(chǔ)產(chǎn)品架構(gòu)師黃瑞瑞則對《財經(jīng)十一人》表示,自研CIPU處理器不影響資源定價,對操作界面、應(yīng)用開發(fā)也沒有影響。

更關(guān)鍵的問題是戰(zhàn)略。阿里云2020年后一直沿著“做深基礎(chǔ)、做厚中臺、做強(qiáng)生態(tài)、做好服務(wù)”的戰(zhàn)略前行。“做深基礎(chǔ)”的內(nèi)涵是,做深云底座。以飛天操作系統(tǒng)向下延伸,定制芯片、數(shù)據(jù)庫、路由器、交換機(jī)等硬件,基于阿里云的特點(diǎn)構(gòu)建云基礎(chǔ)設(shè)施。

在計算芯片領(lǐng)域,阿里云的策略是,基于“一云多芯”戰(zhàn)略對X86、ARM、RISC-V等多種架構(gòu)進(jìn)行適配,兼容飛騰、鯤鵬、AMD、Ampere等多種CPU,形成標(biāo)準(zhǔn)形態(tài)的算力輸出。即是圍繞飛天操作系統(tǒng)做定制,既滿足自身個性化需求,也強(qiáng)化自主可控能力。長期以來,阿里云一直在自研和戰(zhàn)略緊密相關(guān)的芯片。如2020年發(fā)布的神龍DPU,2021年發(fā)布的服務(wù)器芯片倚天710。

此次發(fā)布的數(shù)據(jù)中心專用處理器CIPU是對阿里云核心技術(shù)布局的補(bǔ)足。強(qiáng)調(diào)“Back to Basic”,則是對“做深基礎(chǔ)”的延續(xù),也是對AWS等海外云廠商、芯片廠商改造云計算底層技術(shù)架構(gòu)的回應(yīng)。

過去十多年,云計算技術(shù)經(jīng)歷了兩個發(fā)展階段。

第一階段是分布式和虛擬化技術(shù)替代了大型機(jī)、小型機(jī),滿足了當(dāng)時企業(yè)業(yè)務(wù)擴(kuò)展帶來的算力彈性需求。

第二階段出現(xiàn)了資源池化技術(shù),通過把計算和存儲進(jìn)行分離,而后規(guī)模化編排和調(diào)度,形成了超大規(guī)模的計算和存儲資源池。

技術(shù)的迭代自然促進(jìn)了產(chǎn)業(yè)的更迭。過去三年,國內(nèi)云計算產(chǎn)業(yè)走到了十字路口。一方面,云廠商競爭愈加關(guān)注市場、訂單、價格。市場價格、商務(wù)關(guān)系上硬碰硬交戰(zhàn)正在加劇低水平競爭。頭部云廠商的收入增速普遍回調(diào)至20%-30%左右。

與此同時,在海外,云計算技術(shù)正在進(jìn)入下一代架構(gòu)關(guān)鍵技術(shù)突破期。國內(nèi)云廠商的管理層開始調(diào)整業(yè)務(wù),思考新增長路徑,及重新自我定位。這個階段更關(guān)注提高毛利率,強(qiáng)化核心競爭力,尋求健康可持續(xù)且有質(zhì)量的增長。

阿里云是國內(nèi)最大的云計算廠商。它的選擇是,繼續(xù)建設(shè)新的架構(gòu),從最底層的數(shù)據(jù)中心核心部件到最上層云原生軟件,形成完整的自研技術(shù)體系。提升技術(shù)底層能力的價值一方面在于提升基礎(chǔ)設(shè)施能力,強(qiáng)化產(chǎn)品競爭力。另一邊,還要于優(yōu)化成本結(jié)構(gòu)。在未來還可以持續(xù)研發(fā)高附加值且代表產(chǎn)業(yè)發(fā)展方向的產(chǎn)品。

多位云廠商高管此前的觀點(diǎn)是,云計算的本質(zhì)是技術(shù)創(chuàng)新,中國企業(yè)需要理解全球市場的技術(shù)變革,而非在本土市場陷入內(nèi)卷競爭。國內(nèi)市場存在部分偽需求,容易在技術(shù)上把云廠商帶入誤區(qū)。云廠商在這種環(huán)境下,需要具備規(guī)則制定能力,還要保持克制的戰(zhàn)略定力。

其中一位云廠商高管進(jìn)一步解釋,阿里云需要用技術(shù)能力牽引客戶需求,確保自身在數(shù)字化市場的前瞻理解。事實(shí)上,亞馬遜AWS和微軟云的技術(shù)能力為其制定市場規(guī)則,獲得客戶關(guān)系中的主動權(quán)起到了重要作用。

阿里2022財年(即2021年3月-2022年3月)報告顯示,阿里云在2022財年營收為746億元,經(jīng)調(diào)整EBITA利潤為11億元。阿里集團(tuán)2022財年研發(fā)支出555億元。該研發(fā)支出規(guī)模在2022年位居國內(nèi)民營科技企業(yè)第二,僅次于華為,高于騰訊。

阿里云的新一輪“芯”戰(zhàn)開始了,這一輪戰(zhàn)役的核心意圖是:試圖在新的進(jìn)展環(huán)境下強(qiáng)化技術(shù)投入,保持定力,確保戰(zhàn)略主動權(quán)。

作者為《財經(jīng)》記者

本文來自微信公眾號“財經(jīng)十一人”(ID:caijingEleven),36氪經(jīng)授權(quán)發(fā)布。

資深作者財經(jīng)十一人
0
相關(guān)話題
云存儲
相關(guān)文章
最新文章
查看更多
關(guān)注 36氪企服點(diǎn)評 公眾號
打開微信掃一掃
為您推送企服點(diǎn)評最新內(nèi)容
消息通知
咨詢?nèi)腭v
商務(wù)合作