超越TensorFlow、PyTorch,百度飛槳登頂中國市場應(yīng)用規(guī)模第一
金磊 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
百度飛槳又一次被“點名”了:
中國深度學(xué)習(xí)市場應(yīng)用規(guī)模第一!
這就是中國信通院與深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心聯(lián)合發(fā)布的《深度學(xué)習(xí)平臺發(fā)展報告(2022年)》(下文簡稱報告)中,所給出的最新結(jié)論。
而且還是和老牌深度學(xué)習(xí)框架選手,谷歌家的TensorFlow、Meta家的PyTorch一較高下后的結(jié)果。
不僅如此,報告中還指出,中國已經(jīng)成為全球開發(fā)框架生態(tài)發(fā)展最快的國家。
單是在社區(qū)生態(tài)這一塊,以飛槳為代表的“中國隊”便在GitHub中交出了一組亮眼的數(shù)據(jù):
-
項目貢獻(xiàn)人數(shù)(Contributors)增速:是TensorFlow的5.2倍,PyTorch的1.6倍;
-
關(guān)注度(Stars)增速:是TensorFlow的3.8倍,PyTorch的1.3倍。
而與信通院這次發(fā)出的“信號”類似,在更早之前,IDC和弗若斯特沙利文等研究機(jī)構(gòu)也給出了值得關(guān)注的結(jié)論。
它們分別在報告中指出:
飛槳在中國深度學(xué)習(xí)市場中的綜合份額已超越其他國際巨頭,成為中國第一。
飛槳在中國深度學(xué)習(xí)軟件框架市場綜合競爭力領(lǐng)跑行業(yè)。
不難看出,百度飛槳在多家研究機(jī)構(gòu)調(diào)研下,已然成為佼佼者的存在。
那么問題就來了:
人工智能發(fā)展至今,可以說是已經(jīng)成為最具活躍度的創(chuàng)新領(lǐng)域。
并且隨著其不斷在產(chǎn)業(yè)乃至生活中的應(yīng)用,不僅是對技術(shù)本身,對社會經(jīng)濟(jì)的發(fā)展起到了推動作用。
而縱觀近十幾年來的發(fā)展軌跡,較為顯著的一點是:深度學(xué)習(xí)仍舊是當(dāng)下進(jìn)程中的那個“主旋律”。
因此,與之對應(yīng)的深度學(xué)習(xí)框架,也就成為了類似于AI時代下操作系統(tǒng)般的存在——下接芯片,上承各種業(yè)務(wù)模型、行業(yè)應(yīng)用。
這也就是國內(nèi)外科技巨頭不遺余力地在此發(fā)力的原因了。
值得一提的是,在飛槳于2016年率先開源之后,2020年成為國內(nèi)深度學(xué)習(xí)框架發(fā)展歷程中值得被“標(biāo)記”的一年。
因為在這一年,國內(nèi)外深度學(xué)習(xí)框架的全球格局,發(fā)生了顯著的變化:
從圖中不難看出,在2020年之前,深度學(xué)習(xí)框架仍舊是TensorFlow和PyTorch等主流“玩家”來主導(dǎo),國內(nèi)僅有百度飛槳一枝獨秀。
但在此之后,國內(nèi)深度學(xué)習(xí)框架異軍突起,呈現(xiàn)了第一波集中式的爆發(fā)。
產(chǎn)業(yè)界方面,獨角獸曠視拿出了工業(yè)級深度學(xué)習(xí)框架天元(MegEngine),一流科技OneFlow、華為昇思(MindSpore)也在同年登場。
學(xué)術(shù)界方面,清華大學(xué)則是開源了支持即時編譯的深度學(xué)習(xí)框架計圖(Jittor)。
而信通院此番研究結(jié)果,正是基于國內(nèi)外現(xiàn)如今“百家爭鳴”般的深度學(xué)習(xí)框架。
從報告中來看,信通院這次將百度飛槳定位為“中國深度學(xué)習(xí)市場應(yīng)用規(guī)模第一”,主要是從三個維度進(jìn)行的考量。
首先,是技術(shù)應(yīng)用能力。
報告認(rèn)為,在全球范圍來看TensorFlow和PyTorch仍是深度學(xué)習(xí)框架的主流“玩家”,但與此同時,也認(rèn)可了百度飛槳自2016年以來的成績。
例如在GitHub和Papers with Code的趨勢榜單中,飛槳的PaddleClas、PaddleDetection、PaddleGAN等多個套件便登頂榜單。
并且從技術(shù)專利數(shù)量來看,百度在深度學(xué)習(xí)方面已經(jīng)取得全球第一的成績。
值得一提的是,飛槳還做到了“因地制宜”,針對國內(nèi)市場的需求變化,不僅提供了大量“有經(jīng)驗”的產(chǎn)業(yè)模型庫,還支持中文環(huán)境的算法和API:
相較于TensorFlow和PyTorch成為更滿足國內(nèi)技術(shù)應(yīng)用需求的開發(fā)框架。
其次,是社區(qū)生態(tài)構(gòu)建。
正如剛才我們提到的,報告指出“我國已成為全球開發(fā)框架生態(tài)發(fā)展最快的國家”。
報告統(tǒng)計了近一年半以來,我國以飛槳為代表的深度學(xué)習(xí)框架在貢獻(xiàn)人數(shù)、關(guān)注等方面,與主流“玩家”的增速對比。
基于此,報告認(rèn)為:
整體來看,目前飛槳社區(qū)生態(tài)僅次于PyTorch,位居國內(nèi)市場次席。
而且報告針對國內(nèi)玩家,圍繞“活躍度”、“關(guān)注度”和“貢獻(xiàn)人數(shù)”也做了數(shù)據(jù)的對比統(tǒng)計:
不難看出,百度飛槳在各項數(shù)據(jù)上的表現(xiàn),都處于遙遙領(lǐng)先的狀態(tài)。
最后,是平臺服務(wù)規(guī)模。
報告指出,目前國內(nèi)在深度學(xué)習(xí)框架開發(fā)者群體規(guī)模最大的便是百度飛槳,已經(jīng)達(dá)到了477萬、服務(wù)18萬個企事業(yè)單位,并且通過飛槳所打造出來的AI模型數(shù)量已經(jīng)達(dá)到了56萬個。
綜上數(shù)據(jù),報告得出了如下了結(jié)論:
飛槳已經(jīng)超越TensorFlow和PyTorch,成為國內(nèi)服務(wù)規(guī)模最為廣泛的框架工具。
至于為什么信通院要通過這三個維度來做評判,在報告中也道出了其緣由。
報告認(rèn)為,要構(gòu)建面向產(chǎn)業(yè)的深度學(xué)習(xí)平臺,不僅僅是打造一個框架這么簡單,更需要兼顧模型研發(fā)到部署的服務(wù)體系。
總體而言,需要包含這三個要素:開發(fā)框架、算法模型和開發(fā)工具及能力平臺。
基于如此要素的深度學(xué)習(xí)平臺,方可實現(xiàn)其基礎(chǔ)核心:
通過打造易用、高效、可拓展的框架引擎,解決產(chǎn)業(yè)級應(yīng)用的一系列問題,涉及編程范式、大規(guī)模分布式訓(xùn)練、軟硬件適配等關(guān)鍵技術(shù)。
無獨有偶,在IDC和沙利文的研究報告中,對百度飛槳“市場第一”的評判維度,同樣也是圍繞著易用、高效和落地等關(guān)鍵詞展開。
那么基于這樣的結(jié)果,還有一個更為深入的問題值得探討:
從多方研究機(jī)構(gòu)的報告來看,國內(nèi)深度學(xué)習(xí)框架的市場著實有“厚積薄發(fā)”的味道。
而百度飛槳作為國內(nèi)最先發(fā)力且目前成績最佳的那一個,或許多方給予的“第一”殊榮,正是意味著飛槳在“如何把深度學(xué)習(xí)用起來”這件事上,提交了一個“高分作業(yè)”。
這份“作業(yè)”,我們不妨將其定義為“飛槳模式”。
若是將其拆解開來,大致可以分為三個關(guān)鍵詞,分別是深度學(xué)習(xí)、產(chǎn)業(yè)級和開源開放。
“深度學(xué)習(xí)”這個關(guān)鍵詞,不僅指的是人工智能核心基礎(chǔ)技術(shù)本身,還應(yīng)當(dāng)囊括深度學(xué)習(xí)框架,讓開發(fā)者能夠面對不同需求,不用再從0到1地去搭建,更應(yīng)該像是搭積木一樣簡單。
為此,“易用”從始至今都是百度飛槳在發(fā)展、迭代中的一條主線路,也是能夠在國內(nèi)市場規(guī)模拿下第一的“致勝法寶”。
比如,飛槳企業(yè)版零門檻AI開發(fā)平臺EasyDL一站式支持智能標(biāo)注、模型訓(xùn)練、服務(wù)部署等功能,內(nèi)置豐富的預(yù)訓(xùn)練模型,支持公有云/本地服務(wù)器/設(shè)備端等靈活部署,已在工業(yè)、零售、制造、醫(yī)療等領(lǐng)域落地。
有開發(fā)者評價:就像廚師無需親自制作菜刀一樣,碼農(nóng)們可以按需調(diào)用,開發(fā)AI程序、做出AI硬件,無論是PC、平板、電視還是安卓、iOS,都可以適配。
這就讓開發(fā)者可以在不挑算法的情況下,“絲滑”地去做開發(fā)。
除此之外,現(xiàn)在飛槳的核心框架做到了貫穿開發(fā)、訓(xùn)練、推理部署三個環(huán)節(jié),基礎(chǔ)模型庫更是覆蓋CV、NLP、推薦、語音、知識增強(qiáng)的文心大模型。
而開發(fā)者所要做的,僅僅是根據(jù)自身業(yè)務(wù)的需求,把數(shù)據(jù)導(dǎo)進(jìn)來訓(xùn)練即可,最終就可以快速實現(xiàn)部署。
用百度CTO王海峰在最近百度世界大會上,與撒貝寧的一段對話來形容就是:
百度飛槳像是一道完成了九成的菜,主料、佐料全都準(zhǔn)備好了,只需要拿回去往鍋里放就行了。
“產(chǎn)業(yè)級”則指的是,飛槳平臺上的所有技術(shù),并不是一張張PPT,而是用真金不怕火煉的方式,在現(xiàn)實場景中歷練過的那種。
根據(jù)最新數(shù)據(jù)顯示,飛槳提供超過500個精選算法和預(yù)訓(xùn)練模型,其中就包含了經(jīng)過產(chǎn)業(yè)實踐長期打磨的主流模型;飛槳還結(jié)合產(chǎn)業(yè)實際場景、精心打造了精度與性能平衡PP系列特色模型,覆蓋目標(biāo)檢測、OCR、語音理解等多個高頻應(yīng)用場景,可以讓AI產(chǎn)業(yè)應(yīng)用時達(dá)到事半功倍的效果。
飛槳產(chǎn)業(yè)范例庫和產(chǎn)業(yè)模型選型工具則以真實產(chǎn)業(yè)場景和數(shù)據(jù)為藍(lán)本進(jìn)行研發(fā),涵蓋智慧城市、智能制造等多個領(lǐng)域,助力企業(yè)靈活運用模型和開發(fā)套件構(gòu)建完整的落地方案,直達(dá)項目落地,降低AI產(chǎn)業(yè)落地難度。
正所謂“實踐是檢驗真理的唯一標(biāo)準(zhǔn)”,飛槳的技術(shù)也真真實實地已經(jīng)用來在各行各業(yè)當(dāng)中。
例如百度世界大會上最新展現(xiàn)的這些故事:飛槳走進(jìn)過內(nèi)蒙古大草原,相關(guān)高校團(tuán)隊借助飛槳,針對牧民在養(yǎng)羊上的痛點,打造了母羊分娩預(yù)測和預(yù)警系統(tǒng),提高羊羔成活率。
再如農(nóng)業(yè)場景之下,飛槳還曾幫助農(nóng)業(yè)科研人員開展農(nóng)田地塊分割和農(nóng)田障礙物識別。
從結(jié)果上來看,即使在形狀不規(guī)則、環(huán)境復(fù)雜的農(nóng)田地塊里,也能快速獲取高精度農(nóng)田場景模型,保障了農(nóng)機(jī)的精準(zhǔn)作業(yè)。
最后的“開源開放”,指的就是百度把多年來積累下來的經(jīng)驗,一口氣毫無保留地釋放出來,和各界共同打造更強(qiáng)大的AI生態(tài)。
至于這么做的理由,其實也無需再多贅述,畢竟開源的力量,大家都是有目共睹的。
正如王海峰所說:
作為“智能時代的操作系統(tǒng)”,百度飛槳集深度學(xué)習(xí)框架、產(chǎn)業(yè)級模型庫,以及豐富的開發(fā)套件和工具組件為一體,持續(xù)降低門檻,支持企業(yè)和廣大開發(fā)者開展技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用。
飛槳的技術(shù)生態(tài)繁榮,也從一個側(cè)面反映出中國人工智能技術(shù)、產(chǎn)業(yè)、人才正在蓬勃發(fā)展。
……
以上便是“飛槳模式”的主要內(nèi)容了,至于這種模式的正確與否,還需要時間來慢慢考驗。
但能夠明確的一點是,起碼“飛槳模式”現(xiàn)在所發(fā)力的關(guān)鍵節(jié)點,是與此次信通院報告中對于深度學(xué)習(xí)未來展望所契合的,即:
深度學(xué)習(xí)平臺能力將圍繞技術(shù)實力、功能體驗、生態(tài)模式三個維度演進(jìn)迭代。
并且單單是做到落地“格局”還是小了,深度學(xué)習(xí)框架還肩負(fù)更加深遠(yuǎn)的價值,正如報告中所述:
從更長周期和更廣視野來看,深度學(xué)習(xí)平臺將持續(xù)提升傳統(tǒng)行業(yè)高附加值產(chǎn)品的比重,進(jìn)一步優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),增強(qiáng)國家產(chǎn)業(yè)經(jīng)濟(jì)韌性和抗風(fēng)險能力,已成為一項具有戰(zhàn)略性、全局性、時代性、現(xiàn)實性的緊迫任務(wù),需要政府、科研機(jī)構(gòu)、人工智能企業(yè)和傳統(tǒng)行業(yè)企業(yè)等各方通力協(xié)作配合,共同營造積極健康的產(chǎn)業(yè)生態(tài)。
本文來自微信公眾號“量子位”(ID:QbitAI),36氪經(jīng)授權(quán)發(fā)布。
