深度學(xué)習(xí)框架,不只是技術(shù)問題。
3月25日,曠視宣布開源新一代AI生產(chǎn)力平臺(tái)Brain++的核心深度學(xué)習(xí)框架曠視天元(MegEngine),其前身是曠視內(nèi)部自用的算法訓(xùn)練推理引擎MegEngine,由曠視3名實(shí)習(xí)生在2013年啟動(dòng)研發(fā),于2014年正式完成上線,支撐曠視6年以來在國際AI競賽的表現(xiàn),以及公司產(chǎn)品和業(yè)務(wù)的落地,目前服務(wù)于曠視研究院1400余名AI開發(fā)者。
Brain++是曠視自主研發(fā)的端到端人工智能算法平臺(tái),具備大規(guī)模算法研發(fā)能力。針對(duì)框架、算力和數(shù)據(jù)三個(gè)核心要素,曠視Brain++在總體架構(gòu)上分為三部分,包括深度學(xué)習(xí)框架MegEngine、深度學(xué)習(xí)云計(jì)算平臺(tái)MegCompute、以及數(shù)據(jù)管理平臺(tái)MegData,天元是曠視Brain++最核心的組件。
有媒體報(bào)道稱曠視天元(MegEngine)“重新定義AI基礎(chǔ)設(shè)施”,因?yàn)椤皣a(chǎn)自主可控的深度學(xué)習(xí)框架,將是中國打造數(shù)字基建中AI核心能力的底座,釋放更多生產(chǎn)力。”那么,作為后來者的天元(MegEngine),真的可以趕上谷歌Tensorflow和百度PaddlePaddle等先行者嗎?
01
技術(shù)層面,已經(jīng)達(dá)到世界領(lǐng)先嗎?
深度學(xué)習(xí)框架不是什么新鮮事物。所謂深度學(xué)習(xí)框架,相當(dāng)于是AI操作系統(tǒng),有了這個(gè)框架,機(jī)器視覺、語音和知識(shí)圖譜等AI技術(shù)都可基于框架研發(fā),避免后來者重復(fù)造輪子。早在2010年AI方興未艾時(shí),深度學(xué)習(xí)框架就已開始火熱,谷歌和Facebook是先行者,2015年開源的谷歌Tensorflow流行于工業(yè)界,擁有業(yè)界最完善的工具鏈和生態(tài);Facebook Pytorch則以易用性著稱,在科研界有較高占有率。在兩者外,還有Amazon、微軟、百度等科技巨頭擁有自主深度學(xué)習(xí)框架。如今,深度學(xué)習(xí)框架在AI領(lǐng)域已經(jīng)是基礎(chǔ)設(shè)施。
科技巨頭的深度學(xué)習(xí)框架的研發(fā)與開源的啟動(dòng)時(shí)間均比MegEngine早多年,MegEngine公布的資料顯示,其在自動(dòng)求導(dǎo)、預(yù)訓(xùn)練模型、訓(xùn)練速度、部署效率、異構(gòu)設(shè)備支持等深度學(xué)習(xí)框架的關(guān)鍵能力上,與發(fā)展多年的Tensorflow全都在一個(gè)級(jí)別,在一些維度比Facebook Pytorch、百度PaddlePaddle等均表現(xiàn)更好,從技術(shù)實(shí)現(xiàn)來看這樣的可能性不大。深度學(xué)習(xí)框架本質(zhì)是將很多底層基礎(chǔ)代碼抽離出來,需要日積月累的研發(fā),后來者除非有數(shù)倍于先行者的人力與研發(fā)資源投入,才有可能趕上。MegEngine雖然源自于獨(dú)角獸曠視,但其研發(fā)資源顯然不如世界級(jí)科技巨頭充沛。
深度學(xué)習(xí)框架的模型支持十分重要,模型意味著框架適應(yīng)不同場(chǎng)景下AI實(shí)現(xiàn)的能力,比如機(jī)器視覺、語音識(shí)別等不同場(chǎng)景,而MegEngine目前自有模型跟先行者比少且缺乏亮點(diǎn),只有少數(shù)幾個(gè)視覺模型,或許正是因?yàn)樽杂心P蛿?shù)量相對(duì)較少,MegEngine宣稱“為了解決模型復(fù)現(xiàn)困難的問題,天元支持PyTorch Module 導(dǎo)入,可針對(duì)計(jì)算機(jī)視覺任務(wù)進(jìn)行優(yōu)化。”從MegEngine公布的路線圖來看,Beta 版本的推出尚在6月份,不論是異構(gòu)設(shè)備支持還是部署能力都還有待觀察。
02
自主層面,真的是國產(chǎn)之光嗎?
有媒體報(bào)道稱,“曠視的加入,讓國產(chǎn)自主深度學(xué)習(xí)框架再添一員,使中國的人工智能開發(fā)工具可以在國際上與谷歌的TensorFlow、Facebook的PyTorch對(duì)壘,相比國外的框架和平臺(tái),誕生于中國應(yīng)用場(chǎng)景的深度學(xué)習(xí)框架與中國產(chǎn)業(yè)轉(zhuǎn)型更適配,有望讓更多中國的企業(yè)更快捷的獲得AI研發(fā)能力。”看上去,似乎想把曠視MegEngine打造成國產(chǎn)之光。
如果了解過中國深度學(xué)習(xí)框架的發(fā)展,可能會(huì)有不同看法。AI產(chǎn)業(yè)化時(shí)代,我國已經(jīng)將AI上升為國家科技戰(zhàn)略,作為AI基礎(chǔ)設(shè)施的深度學(xué)習(xí)框架確實(shí)具有戰(zhàn)略價(jià)值,特別是在技術(shù)自主的大趨勢(shì)下。正是因?yàn)榇耍鳛锳I技術(shù)領(lǐng)先者的百度,在2013年就已成立深度學(xué)習(xí)實(shí)驗(yàn)室,研發(fā)深度學(xué)習(xí)框架PaddlePaddle,百度的語音技術(shù)、自然語言處理技術(shù)、計(jì)算機(jī)視覺技術(shù)等等,均是基于PaddlePaddle研發(fā)。
作為百度AI“壓箱底技術(shù)”,PaddlePadde在2016年就已開源,經(jīng)過四年發(fā)展已經(jīng)在行業(yè)中占據(jù)一席之地,且在中國的深度學(xué)習(xí)框架市場(chǎng)具有優(yōu)勢(shì),IDC 在2019年6月發(fā)布的報(bào)告顯示,在國內(nèi)深度學(xué)習(xí)綜合市場(chǎng)中,谷歌、Facebook、百度三家共占據(jù)超過一半的市場(chǎng)份額,谷歌TensorFlow占據(jù)著主要市場(chǎng),百度飛槳(PaddlePaddle)占據(jù)第三,增長勢(shì)頭明顯。2019年P(guān)addlePaddle入圍世界互聯(lián)網(wǎng)大會(huì)“世界互聯(lián)網(wǎng)界領(lǐng)先成果”時(shí),已服務(wù)150多萬開發(fā)者,廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、服務(wù)業(yè)等,從工廠中的質(zhì)量檢測(cè)和安全管理,到田野里的農(nóng)藥控制和蟲情監(jiān)測(cè),到商品數(shù)據(jù)分析、診療輔助決策,PaddlePaddle成為各行各業(yè)技術(shù)創(chuàng)新、智能化升級(jí)的基礎(chǔ)底座。
在技術(shù)層面曠視天元(MegEngine)相對(duì)于百度PaddlePaddle而言并沒有什么明顯優(yōu)勢(shì),一方面百度在AI技術(shù)上布局更早,投入力度更大,且不只是聚焦機(jī)器視覺技術(shù),而是較為全面地覆蓋了自然語言處理、知識(shí)圖譜、語音識(shí)別等關(guān)鍵AI技術(shù),在這一過程中百度在百度大腦、PaddlePaddle等底層AI技術(shù)上一直在戰(zhàn)略投入。另一方面百度擁有搜索、小度、Apollo等核心應(yīng)用場(chǎng)景,且通過百度智能云構(gòu)建了一個(gè)AI產(chǎn)業(yè)生態(tài),給PaddlePaddle的普及奠定了很好的基礎(chǔ),反過來錘煉了PaddlePaddle的技術(shù)能力。實(shí)際上,天元(MegEngine)提出的“動(dòng)靜合一”、“訓(xùn)練推理一體化”這樣的亮點(diǎn),也一直是PaddlePaddle的重要特點(diǎn)。
不可否認(rèn),深度學(xué)習(xí)框架就像自主芯片或者操作系統(tǒng)一樣對(duì)我國科技產(chǎn)業(yè)具有重要戰(zhàn)略意義,正是因?yàn)榇耍俣群螅⒗铩缫暋⑷A為等玩家布局深度學(xué)習(xí)框架都值得鼓勵(lì),不過不管誰來做框架,都應(yīng)該憑技術(shù)實(shí)力和開源社區(qū)服務(wù)來吸引開發(fā)者。深度學(xué)習(xí)框架開源后,產(chǎn)品好用與否,開發(fā)者一看代碼或者在社區(qū)一交流就知道。
03
生態(tài)層面,真的可以一蹴而就嗎?
今天開發(fā)者可選的深度學(xué)習(xí)框架越來越多,同時(shí)隨著AI產(chǎn)業(yè)化加速AI研發(fā)越來越復(fù)雜,因此開發(fā)者對(duì)深度學(xué)習(xí)框架的要求越來越苛刻:要易用上手、要功能模板豐富、更性能強(qiáng)大,要部署方案全面,要有前沿技術(shù)支持。可以說深度學(xué)習(xí)框架的門檻越來越高,任何框架要實(shí)現(xiàn)這些都不能一蹴而就,唯有花時(shí)間、投資源打磨積累,一行行堆代碼才能滿足開發(fā)者需求。這跟手機(jī)芯片的發(fā)展很相似:我們看到很多手機(jī)公司都在做芯片,但真正做得好的只有蘋果、華為這樣的領(lǐng)先對(duì)手十年甚至更早布局的公司,當(dāng)它們建立技術(shù)壁壘后,后來者即便是砸錢也已無法趕超。
還有一點(diǎn)至關(guān)重要:任何開源技術(shù)的競爭核心都不只是技術(shù)本身,最終一定會(huì)落到開源社區(qū)生態(tài)上。開發(fā)者的支持,上下游產(chǎn)業(yè)鏈伙伴支持,都是開源深度學(xué)習(xí)框架普及的關(guān)鍵。這一點(diǎn)就像操作系統(tǒng),當(dāng)華為手機(jī)面臨安卓斷炊問題時(shí),最大的挑戰(zhàn)不是代碼本身,雖然華為推出了鴻蒙系統(tǒng),但應(yīng)用生態(tài)卻很難一朝一夕建立,正是因?yàn)榇巳A為正在力推HMS。同樣,任何深度學(xué)習(xí)框架開源都要花時(shí)間去培育開發(fā)者生態(tài),去獲取開發(fā)者與產(chǎn)業(yè)的支持。
在開源社區(qū)生態(tài)上,具有科技巨頭背景的框架具有顯著優(yōu)勢(shì):
1、巨頭背景意味著更多的社區(qū)資源支持,它們的深度學(xué)習(xí)框架團(tuán)隊(duì)可以把握技術(shù)趨勢(shì)快速轉(zhuǎn)化成產(chǎn)品,可以給予開發(fā)者教育、文檔、工具、社區(qū)等方面更加全面的支持,初創(chuàng)公司很難具備這樣的資源投入能力。
2、巨頭背景意味著更多的場(chǎng)景支持,巨頭一方面有海量自有場(chǎng)景,另一方面擁有繁榮的開放生態(tài),本身就有大量的開發(fā)者,因此具有各種業(yè)務(wù)場(chǎng)景來對(duì)框架進(jìn)行打磨錘煉,初創(chuàng)公司應(yīng)用場(chǎng)景則相對(duì)單一。
3、巨頭背景對(duì)開發(fā)者來說意味著一種“保險(xiǎn)”,初創(chuàng)公司的開源平臺(tái)意味著更大的不確定性,開發(fā)者未來可能會(huì)面臨支持資源匱乏等問題,切換成本會(huì)很高,而巨頭的框架則可以給予開發(fā)者更大的選擇信心。
全球范圍內(nèi),真正在持續(xù)投入深度學(xué)習(xí)框架的企業(yè),正是谷歌、Facebook、微軟、百度這樣的科技巨頭,且它們均是真正戰(zhàn)略重視AI的科技巨頭,它們?nèi)刖諥I時(shí)間早,同步布局深度學(xué)習(xí)框架時(shí)積累了較好的開源生態(tài)基礎(chǔ),后來者要想走捷徑一夜趕超,幾乎沒有可能。
聯(lián)系客服