国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

量子位
+ 關(guān)注
2022-08-03 11:19
623次閱讀
賈浩楠 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI

內(nèi)蒙古中部城市烏蘭察布,西承陰山東段,南接內(nèi)蒙古高原。

天然具有涼爽的氣候、充足的風(fēng)電等等資源,隸屬于國(guó)家“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點(diǎn)。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

2022年的今日今時(shí),國(guó)內(nèi)十余家叫得上名號(hào)的一線車企、自動(dòng)駕駛公司齊聚于此。

它們來(lái)這里只辦三件事:

算力、算力、還是算力!

而把自動(dòng)駕駛行業(yè)渴求的算力帶給它們的,是阿里云

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

第一個(gè)在烏蘭察布解鎖超大算力的,是小鵬汽車。

其實(shí)也是阿里云和小鵬汽車一起為智能汽車行業(yè)的未來(lái)計(jì)算需求和發(fā)展趨勢(shì)打了個(gè)樣。

阿里云和小鵬合作打造的智算中心,既是全國(guó)最大的,也是國(guó)內(nèi)第一個(gè)投入實(shí)際運(yùn)營(yíng)的,專為自動(dòng)駕駛服務(wù)的超大智能算力集群。

所謂“智算中心”,并不是傳統(tǒng)意義上的超級(jí)計(jì)算機(jī)。

自動(dòng)駕駛、或者說(shuō)智能汽車上的核心功能,其實(shí)都是AI。具體說(shuō),是大規(guī)模的深度學(xué)習(xí)算法。

而無(wú)論是訓(xùn)練,還是測(cè)試這樣的模型,扮演主角的不再是傳統(tǒng)CPU的邏輯推理能力,而是以AI加速器為主的浮點(diǎn)計(jì)算能力,GPU則是當(dāng)前AI加速器的主流。

所以,智算中心的第一個(gè)特征,就是以大規(guī)模GPU算力作為AI模型迭代的基礎(chǔ)。

第二個(gè)特征,是與汽車業(yè)務(wù)深度結(jié)合,為智算中心提供了針對(duì)自動(dòng)駕駛應(yīng)用特征的算力集群、性能加速工具和AI大數(shù)據(jù)平臺(tái),使得模型訓(xùn)練性能、GPU資源利用率和算法研發(fā)效能都大大提升。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

小鵬汽車和阿里云打造的智算中心,名叫“扶搖”。“扶搖”之意,當(dāng)然是阿里云提供的超大算力和針對(duì)性工具,能讓小鵬汽車的自動(dòng)駕駛系統(tǒng)能力“直上九天”。

那么,實(shí)際果真如此嗎?

已經(jīng)建成交付的扶搖智算中心,總算力達(dá)到600PFLOPS。

這是個(gè)啥概念?

每秒進(jìn)行6*1017次浮點(diǎn)運(yùn)算,即60億億次。

整體計(jì)算效率上,扶搖實(shí)現(xiàn)了算力的線性擴(kuò)展。存儲(chǔ)吞吐比業(yè)界20GB/s的普遍水準(zhǔn)提升了40倍,數(shù)據(jù)傳輸能力相當(dāng)于從送快遞的微型面包車,換成了20多米長(zhǎng)的40噸集裝箱重卡。

小鵬汽車一個(gè)典型核心自動(dòng)駕駛模型,以前完整訓(xùn)練一遍需要7天,而如今在扶搖上,只需要一個(gè)小時(shí)。

自動(dòng)駕駛模型訓(xùn)練提速近170倍,會(huì)大力推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展速度,讓小鵬汽車的智能化程度和安全性都邁入新的階段。

迭代速度對(duì)于以智能化、自動(dòng)駕駛立身的企業(yè)來(lái)說(shuō)意味著什么,無(wú)需贅述。

大算力給自動(dòng)駕駛帶來(lái)的意義,何小鵬除了眼前的,也站在行業(yè)未來(lái)發(fā)展的角度給出另一番解讀:

未來(lái)5年,小鵬汽車可能還有百倍的算力需求增長(zhǎng)。

希望大家都看到這個(gè)趨勢(shì)。如果現(xiàn)在不以這樣的方式提前儲(chǔ)備算力,那么今后5年內(nèi),企業(yè)算力成本會(huì)從億級(jí),加到數(shù)十億級(jí)。

何小鵬為什么這么說(shuō)——

對(duì)于真正把智能化作為核心競(jìng)爭(zhēng)力和未來(lái)發(fā)展方向的企業(yè)來(lái)說(shuō),沒(méi)智算中心,未來(lái)的競(jìng)爭(zhēng)中就沒(méi)有底層根基。

行業(yè)有共識(shí)的普遍規(guī)律是:自動(dòng)駕駛每提升一個(gè)等級(jí),所需車端的算力會(huì)以一個(gè)數(shù)量級(jí)的速度增長(zhǎng)。

比如一家公司研發(fā)的L2級(jí)輔助駕駛需要20TOPS的話,那L3則需要200TOPS,L4需要2000TOPS….

背后是核心AI模型的參數(shù)、規(guī)模以同樣大規(guī)模速度增長(zhǎng)。

企業(yè)后臺(tái)開(kāi)發(fā)端的算力需求,業(yè)內(nèi)人士估算:

車端算力增長(zhǎng)一個(gè)數(shù)量級(jí),相應(yīng)的模型在后端訓(xùn)練、驗(yàn)證,并形成常態(tài)化的迭代,所需要的算力會(huì)以兩個(gè)數(shù)量級(jí)倍增。

所以智算中心對(duì)自動(dòng)駕駛來(lái)說(shuō),最直接的意義在于提供更高的算力,訓(xùn)練更大規(guī)模模型

相應(yīng)的,自動(dòng)駕駛能力上限也就越高,直接決定未來(lái)行業(yè)競(jìng)爭(zhēng)力高低。

但是,算力這個(gè)東西,可以通過(guò)自行購(gòu)買GPU搭建集群的方式獲取,事實(shí)上,之前幾年行業(yè)內(nèi)也是一直這么干的。

為什么到了2022年,大家不約而同開(kāi)始渴望智算中心了呢?

核心原因,在于今年頭部自動(dòng)駕駛玩家的競(jìng)速,已經(jīng)到了搶先落地城市領(lǐng)航輔助駕駛的階段。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

復(fù)雜路況下的復(fù)雜決策能力,包括識(shí)別紅燈、路口、行車車輛等等,其實(shí)已經(jīng)進(jìn)入L3-L4級(jí)范圍。

按照這樣的迭代速度,未來(lái)3-5年,自動(dòng)駕駛研發(fā)很快會(huì)進(jìn)入較為成熟的L4級(jí)甚至是L5級(jí),迭代所需算力也會(huì)快速上升到“智算中心”級(jí)別。

如果自建數(shù)據(jù)中心的話,時(shí)間是最大的敵人。

需求算力的指數(shù)級(jí)膨脹,造成目前自動(dòng)駕駛玩家的“算力”焦慮越來(lái)越嚴(yán)重。

當(dāng)下自動(dòng)駕駛對(duì)于智算中心的需求,其實(shí)是為未來(lái)的競(jìng)爭(zhēng)力做儲(chǔ)備。

那么,實(shí)現(xiàn)智算中心,現(xiàn)在行業(yè)里有哪些方式?

成熟的例子,是特斯拉。

去年特斯拉宣布自建智算中心Dojo,算力規(guī)模達(dá)1.8EPFLOPS,引起業(yè)內(nèi)廣泛關(guān)注。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

Dojo項(xiàng)目細(xì)節(jié)和進(jìn)展透露不多,但外界肉眼可見(jiàn)的是,特斯拉將超大規(guī)模模型快速迭代,以及數(shù)據(jù)閉環(huán)能力修煉的爐火純青,背后肯定少不了超大算力的支持。

這也從實(shí)際效果上證明了類似智算中心這樣的能力,對(duì)自動(dòng)駕駛的必要性。

小鵬與阿里云合作共建智算中心,又是一次重要證明。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

可以說(shuō),這是一種更加貼合國(guó)內(nèi)自動(dòng)駕駛行業(yè)現(xiàn)狀的模式。

為什么?

阿里云資深專家曹政給出了詳細(xì)的解答:

自建算力中心,且不說(shuō)數(shù)十億的前期投入是不是創(chuàng)業(yè)公司能輕松承擔(dān)的,未來(lái)隨著GPU的迭代、超算架構(gòu)的升級(jí)、自身需求的調(diào)整…每一次變更,幾乎都是從零開(kāi)始的重新投入,伴隨著巨大的時(shí)間和資金成本。

建設(shè)算力中心,涉及的冗余、升級(jí)、規(guī)劃等等都需要豐富的經(jīng)驗(yàn)。但這些經(jīng)驗(yàn),卻不是現(xiàn)在自動(dòng)駕駛公司的核心KPI,它們的任務(wù)應(yīng)該是快速提高自動(dòng)駕駛的能力。

業(yè)界有種把智算中心建設(shè)等同于堆砌硬件的錯(cuò)誤認(rèn)知,忽略了智算中心的上層軟件和平臺(tái)。而恰恰上層軟件平臺(tái),是高效釋放算力并加工為生產(chǎn)力的核心,也是云廠商數(shù)年巨大研發(fā)投入的沉淀,可以幫助自動(dòng)駕駛公司站在云廠商的肩膀上,快速聚焦自動(dòng)駕駛算法的研發(fā)。

何小鵬“現(xiàn)在不做就晚了”的憂慮,看似是成本,其實(shí)是時(shí)間。

所以第二個(gè)問(wèn)題,為什么是阿里云?

自動(dòng)駕駛需要的算力,阿里云能給,其他云也能給。

但阿里云不可替代之處在于10年的技術(shù)積累,既有云的,也有AI的。

表現(xiàn)之一成本。智算中心的方案規(guī)劃、性能參數(shù)、功能模塊、未來(lái)擴(kuò)展性等等,阿里云都有著豐富的經(jīng)驗(yàn),既保證交付時(shí)的先進(jìn)性,又兼顧未來(lái)的拓展靈活性。

節(jié)省大量企業(yè)試錯(cuò)的金錢和時(shí)間成本。

表現(xiàn)之二,在于阿里云給小鵬這樣的智能車相關(guān)企業(yè)提供的不只是通用的云服務(wù),而是為AI相關(guān)業(yè)務(wù)量身訂制的算力產(chǎn)品。

比如在扶搖智算中心項(xiàng)目中,阿里云提供的,除了600PFLOPS算力,還有超大規(guī)模高性能網(wǎng)絡(luò)RDMA。

因?yàn)榘⒗镌圃谝酝娚倘蝿?wù)經(jīng)驗(yàn)中已經(jīng)認(rèn)識(shí)到,AI是一個(gè)帶寬敏感業(yè)務(wù),需要幾百G甚至上T的一個(gè)帶寬才能滿足計(jì)算需求。

而以CPU為主的通用超算,由于單數(shù)據(jù)流的處理模式,對(duì)帶寬要求并不高。

RDMA高性能網(wǎng)絡(luò),單鏈路可以把帶寬提升到實(shí)現(xiàn)100G或200G的帶寬。另外在單個(gè)服務(wù)器上并行擴(kuò)展多張網(wǎng)卡,最高可到1.6PB帶寬。

表現(xiàn)之三,阿里云認(rèn)為,他們的產(chǎn)品與自動(dòng)駕駛、汽車工業(yè)深度契合。

自動(dòng)駕駛耦合了HPC(高性能計(jì)算)、AI、大數(shù)據(jù)一體化等等需求,不僅僅是需要AI的算力,還需要大數(shù)據(jù)的算力、HPC的算力。

這種復(fù)合性的算力需求,加上大數(shù)據(jù)、AI和HPC一體的數(shù)據(jù)業(yè)務(wù)管理的流程平臺(tái),才能達(dá)到自動(dòng)駕駛企業(yè)要求。

而阿里給小鵬汽車訂制的,就是這樣一套完整的智能汽車智算中心方案。

算力,算力!風(fēng)起烏蘭察布,中國(guó)自動(dòng)駕駛迎來(lái)170倍提速

所以,對(duì)于中國(guó)智能汽車、自動(dòng)駕駛行業(yè)來(lái)說(shuō),“阿里云+”的合作智算中心模式,首先是一劑巨大的助力,大大節(jié)約成本的同時(shí),又大大提升了迭代進(jìn)步的速度。

從行業(yè)競(jìng)速角度講,則終結(jié)了企業(yè)獨(dú)自建超算的單打獨(dú)斗,節(jié)約資源使其聚焦核心業(yè)務(wù)。

而最大的意義,可能是讓已經(jīng)被特斯拉證明的自動(dòng)駕駛黃金之路,在國(guó)內(nèi)可以低成本實(shí)現(xiàn)。

這一點(diǎn),沒(méi)有人比第一個(gè)吃螃蟹的何小鵬說(shuō)得更明白:

智算中心讓小鵬擁有體系化能力、競(jìng)爭(zhēng)力。2025年,充分利用云端算力的中國(guó)頭部玩家,有希望率先把“輔助自動(dòng)駕駛”的“輔助”二字去掉。

本文來(lái)自微信公眾號(hào)“量子位”(ID:QbitAI),36氪經(jīng)授權(quán)發(fā)布。

資深作者量子位
0
相關(guān)話題
云計(jì)算
相關(guān)文章
最新文章
查看更多
關(guān)注 36氪企服點(diǎn)評(píng) 公眾號(hào)
打開(kāi)微信掃一掃
為您推送企服點(diǎn)評(píng)最新內(nèi)容
消息通知
咨詢?nèi)腭v
商務(wù)合作