算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速
賈浩楠 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
內(nèi)蒙古中部城市烏蘭察布,西承陰山東段,南接內(nèi)蒙古高原。
天然具有涼爽的氣候、充足的風(fēng)電等等資源,隸屬于國(guó)家“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點(diǎn)。
2022年的今日今時(shí),國(guó)內(nèi)十余家叫得上名號(hào)的一線車企、自動(dòng)駕駛公司齊聚于此。
它們來(lái)這里只辦三件事:
算力、算力、還是算力!
而把自動(dòng)駕駛行業(yè)渴求的算力帶給它們的,是阿里云。
第一個(gè)在烏蘭察布解鎖超大算力的,是小鵬汽車。
其實(shí)也是阿里云和小鵬汽車一起為智能汽車行業(yè)的未來(lái)計(jì)算需求和發(fā)展趨勢(shì)打了個(gè)樣。
阿里云和小鵬合作打造的智算中心,既是全國(guó)最大的,也是國(guó)內(nèi)第一個(gè)投入實(shí)際運(yùn)營(yíng)的,專為自動(dòng)駕駛服務(wù)的超大智能算力集群。
所謂“智算中心”,并不是傳統(tǒng)意義上的超級(jí)計(jì)算機(jī)。
自動(dòng)駕駛、或者說(shuō)智能汽車上的核心功能,其實(shí)都是AI。具體說(shuō),是大規(guī)模的深度學(xué)習(xí)算法。
而無(wú)論是訓(xùn)練,還是測(cè)試這樣的模型,扮演主角的不再是傳統(tǒng)CPU的邏輯推理能力,而是以AI加速器為主的浮點(diǎn)計(jì)算能力,GPU則是當(dāng)前AI加速器的主流。
所以,智算中心的第一個(gè)特征,就是以大規(guī)模GPU算力作為AI模型迭代的基礎(chǔ)。
第二個(gè)特征,是與汽車業(yè)務(wù)深度結(jié)合,為智算中心提供了針對(duì)自動(dòng)駕駛應(yīng)用特征的算力集群、性能加速工具和AI大數(shù)據(jù)平臺(tái),使得模型訓(xùn)練性能、GPU資源利用率和算法研發(fā)效能都大大提升。
小鵬汽車和阿里云打造的智算中心,名叫“扶搖”。“扶搖”之意,當(dāng)然是阿里云提供的超大算力和針對(duì)性工具,能讓小鵬汽車的自動(dòng)駕駛系統(tǒng)能力“直上九天”。
那么,實(shí)際果真如此嗎?
已經(jīng)建成交付的扶搖智算中心,總算力達(dá)到600PFLOPS。
這是個(gè)啥概念?
每秒進(jìn)行6*1017次浮點(diǎn)運(yùn)算,即60億億次。
整體計(jì)算效率上,扶搖實(shí)現(xiàn)了算力的線性擴(kuò)展。存儲(chǔ)吞吐比業(yè)界20GB/s的普遍水準(zhǔn)提升了40倍,數(shù)據(jù)傳輸能力相當(dāng)于從送快遞的微型面包車,換成了20多米長(zhǎng)的40噸集裝箱重卡。
小鵬汽車一個(gè)典型核心自動(dòng)駕駛模型,以前完整訓(xùn)練一遍需要7天,而如今在扶搖上,只需要一個(gè)小時(shí)。
自動(dòng)駕駛模型訓(xùn)練提速近170倍,會(huì)大力推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展速度,讓小鵬汽車的智能化程度和安全性都邁入新的階段。
迭代速度對(duì)于以智能化、自動(dòng)駕駛立身的企業(yè)來(lái)說(shuō)意味著什么,無(wú)需贅述。
大算力給自動(dòng)駕駛帶來(lái)的意義,何小鵬除了眼前的,也站在行業(yè)未來(lái)發(fā)展的角度給出另一番解讀:
未來(lái)5年,小鵬汽車可能還有百倍的算力需求增長(zhǎng)。
希望大家都看到這個(gè)趨勢(shì)。如果現(xiàn)在不以這樣的方式提前儲(chǔ)備算力,那么今后5年內(nèi),企業(yè)算力成本會(huì)從億級(jí),加到數(shù)十億級(jí)。
何小鵬為什么這么說(shuō)——
對(duì)于真正把智能化作為核心競(jìng)爭(zhēng)力和未來(lái)發(fā)展方向的企業(yè)來(lái)說(shuō),沒(méi)智算中心,未來(lái)的競(jìng)爭(zhēng)中就沒(méi)有底層根基。
行業(yè)有共識(shí)的普遍規(guī)律是:自動(dòng)駕駛每提升一個(gè)等級(jí),所需車端的算力會(huì)以一個(gè)數(shù)量級(jí)的速度增長(zhǎng)。
比如一家公司研發(fā)的L2級(jí)輔助駕駛需要20TOPS的話,那L3則需要200TOPS,L4需要2000TOPS….
背后是核心AI模型的參數(shù)、規(guī)模以同樣大規(guī)模速度增長(zhǎng)。
而企業(yè)后臺(tái)開(kāi)發(fā)端的算力需求,業(yè)內(nèi)人士估算:
車端算力增長(zhǎng)一個(gè)數(shù)量級(jí),相應(yīng)的模型在后端訓(xùn)練、驗(yàn)證,并形成常態(tài)化的迭代,所需要的算力會(huì)以兩個(gè)數(shù)量級(jí)倍增。
所以智算中心對(duì)自動(dòng)駕駛來(lái)說(shuō),最直接的意義在于提供更高的算力,訓(xùn)練更大規(guī)模模型。
相應(yīng)的,自動(dòng)駕駛能力上限也就越高,直接決定未來(lái)行業(yè)競(jìng)爭(zhēng)力高低。
但是,算力這個(gè)東西,可以通過(guò)自行購(gòu)買GPU搭建集群的方式獲取,事實(shí)上,之前幾年行業(yè)內(nèi)也是一直這么干的。
為什么到了2022年,大家不約而同開(kāi)始渴望智算中心了呢?
核心原因,在于今年頭部自動(dòng)駕駛玩家的競(jìng)速,已經(jīng)到了搶先落地城市領(lǐng)航輔助駕駛的階段。
復(fù)雜路況下的復(fù)雜決策能力,包括識(shí)別紅綠燈、路口、行車車輛等等,其實(shí)已經(jīng)進(jìn)入L3-L4級(jí)范圍。
按照這樣的迭代速度,未來(lái)3-5年,自動(dòng)駕駛研發(fā)很快會(huì)進(jìn)入較為成熟的L4級(jí)甚至是L5級(jí),迭代所需算力也會(huì)快速上升到“智算中心”級(jí)別。
如果自建數(shù)據(jù)中心的話,時(shí)間是最大的敵人。
需求算力的指數(shù)級(jí)膨脹,造成目前自動(dòng)駕駛玩家的“算力”焦慮越來(lái)越嚴(yán)重。
當(dāng)下自動(dòng)駕駛對(duì)于智算中心的需求,其實(shí)是為未來(lái)的競(jìng)爭(zhēng)力做儲(chǔ)備。
那么,實(shí)現(xiàn)智算中心,現(xiàn)在行業(yè)里有哪些方式?
成熟的例子,是特斯拉。
去年特斯拉宣布自建智算中心Dojo,算力規(guī)模達(dá)1.8EPFLOPS,引起業(yè)內(nèi)廣泛關(guān)注。
Dojo項(xiàng)目細(xì)節(jié)和進(jìn)展透露不多,但外界肉眼可見(jiàn)的是,特斯拉將超大規(guī)模模型快速迭代,以及數(shù)據(jù)閉環(huán)能力修煉的爐火純青,背后肯定少不了超大算力的支持。
這也從實(shí)際效果上證明了類似智算中心這樣的能力,對(duì)自動(dòng)駕駛的必要性。
小鵬與阿里云合作共建智算中心,又是一次重要證明。
可以說(shuō),這是一種更加貼合國(guó)內(nèi)自動(dòng)駕駛行業(yè)現(xiàn)狀的模式。
為什么?
阿里云資深專家曹政給出了詳細(xì)的解答:
自建算力中心,且不說(shuō)數(shù)十億的前期投入是不是創(chuàng)業(yè)公司能輕松承擔(dān)的,未來(lái)隨著GPU的迭代、超算架構(gòu)的升級(jí)、自身需求的調(diào)整…每一次變更,幾乎都是從零開(kāi)始的重新投入,伴隨著巨大的時(shí)間和資金成本。
建設(shè)算力中心,涉及的冗余、升級(jí)、規(guī)劃等等都需要豐富的經(jīng)驗(yàn)。但這些經(jīng)驗(yàn),卻不是現(xiàn)在自動(dòng)駕駛公司的核心KPI,它們的任務(wù)應(yīng)該是快速提高自動(dòng)駕駛的能力。
業(yè)界有種把智算中心建設(shè)等同于堆砌硬件的錯(cuò)誤認(rèn)知,忽略了智算中心的上層軟件和平臺(tái)。而恰恰上層軟件平臺(tái),是高效釋放算力并加工為生產(chǎn)力的核心,也是云廠商數(shù)年巨大研發(fā)投入的沉淀,可以幫助自動(dòng)駕駛公司站在云廠商的肩膀上,快速聚焦自動(dòng)駕駛算法的研發(fā)。
何小鵬“現(xiàn)在不做就晚了”的憂慮,看似是成本,其實(shí)是時(shí)間。
所以第二個(gè)問(wèn)題,為什么是阿里云?
自動(dòng)駕駛需要的算力,阿里云能給,其他云也能給。
但阿里云不可替代之處在于10年的技術(shù)積累,既有云的,也有AI的。
表現(xiàn)之一在成本。智算中心的方案規(guī)劃、性能參數(shù)、功能模塊、未來(lái)擴(kuò)展性等等,阿里云都有著豐富的經(jīng)驗(yàn),既保證交付時(shí)的先進(jìn)性,又兼顧未來(lái)的拓展靈活性。
節(jié)省大量企業(yè)試錯(cuò)的金錢和時(shí)間成本。
表現(xiàn)之二,在于阿里云給小鵬這樣的智能車相關(guān)企業(yè)提供的不只是通用的云服務(wù),而是為AI相關(guān)業(yè)務(wù)量身訂制的算力產(chǎn)品。
比如在扶搖智算中心項(xiàng)目中,阿里云提供的,除了600PFLOPS算力,還有超大規(guī)模高性能網(wǎng)絡(luò)RDMA。
因?yàn)榘⒗镌圃谝酝娚倘蝿?wù)經(jīng)驗(yàn)中已經(jīng)認(rèn)識(shí)到,AI是一個(gè)帶寬敏感業(yè)務(wù),需要幾百G甚至上T的一個(gè)帶寬才能滿足計(jì)算需求。
而以CPU為主的通用超算,由于單數(shù)據(jù)流的處理模式,對(duì)帶寬要求并不高。
RDMA高性能網(wǎng)絡(luò),單鏈路可以把帶寬提升到實(shí)現(xiàn)100G或200G的帶寬。另外在單個(gè)服務(wù)器上并行擴(kuò)展多張網(wǎng)卡,最高可到1.6PB帶寬。
表現(xiàn)之三,阿里云認(rèn)為,他們的產(chǎn)品與自動(dòng)駕駛、汽車工業(yè)深度契合。
自動(dòng)駕駛耦合了HPC(高性能計(jì)算)、AI、大數(shù)據(jù)一體化等等需求,不僅僅是需要AI的算力,還需要大數(shù)據(jù)的算力、HPC的算力。
這種復(fù)合性的算力需求,加上大數(shù)據(jù)、AI和HPC一體的數(shù)據(jù)業(yè)務(wù)管理的流程平臺(tái),才能達(dá)到自動(dòng)駕駛企業(yè)要求。
而阿里給小鵬汽車訂制的,就是這樣一套完整的智能汽車智算中心方案。
所以,對(duì)于中國(guó)智能汽車、自動(dòng)駕駛行業(yè)來(lái)說(shuō),“阿里云+”的合作智算中心模式,首先是一劑巨大的助力,大大節(jié)約成本的同時(shí),又大大提升了迭代進(jìn)步的速度。
從行業(yè)競(jìng)速角度講,則終結(jié)了企業(yè)獨(dú)自建超算的單打獨(dú)斗,節(jié)約資源使其聚焦核心業(yè)務(wù)。
而最大的意義,可能是讓已經(jīng)被特斯拉證明的自動(dòng)駕駛黃金之路,在國(guó)內(nèi)可以低成本實(shí)現(xiàn)。
這一點(diǎn),沒(méi)有人比第一個(gè)吃螃蟹的何小鵬說(shuō)得更明白:
智算中心讓小鵬擁有體系化能力、競(jìng)爭(zhēng)力。2025年,充分利用云端算力的中國(guó)頭部玩家,有希望率先把“輔助自動(dòng)駕駛”的“輔助”二字去掉。
本文來(lái)自微信公眾號(hào)“量子位”(ID:QbitAI),36氪經(jīng)授權(quán)發(fā)布。
