某種意義上說,過往科技行業的競爭是操作系統的競爭,誰擁有了操作系統的話語權,誰就掌握了生態、開發者以及應用。從 PC 到智能手機,掌握操作系統的幾家美國公司不僅成為這個星球上最賺錢公司,還緊緊握著全球科技發展的「命脈」。而在 AI 時代,深度學習正在推動人工智能進入工業大生產階段,深度學習框架則是智能時代的操作系統。
近幾年來,深度學習的研究和應用的熱潮持續高漲,各種開源深度學習框架層出不窮,包括TensorFlow、Keras、MXNet、PyTorch、CNTK、Theano、Caffe、DeepLearning4、Neon 等。谷歌、微軟、亞馬遜、Facebook等商業巨頭都加入了這場深度學習框架大戰,國內的百度、曠視也在研發使用自主開發的深度學習框架。
在當下工業革命和人工智能發展的大背景下,深度學習的通用性特點,加上深度學習框架及平臺的發展,正在推動人工智能標準化、自動化和模塊化,進入工業大生產階段,有望推動人工智能產業落地進入“井噴期”。我們正身處人工智能為核心驅動力量的第四次工業革命浪潮之中,人工智能正將人類社會帶入智能時代。
在智能時代,深度學習框架起到了承上啟下的作用,下接芯片、大型計算機系統,上承各種業務模型、行業應用。因此,它是“智能時代的操作系統”。
以百度PaddlePaddle為例,作為國內完整、全套的深度學習平臺,PaddlePaddle包括核心框架、工具組件和服務平臺三大部分。在核心框架層面,它可以提供開發、訓練和預測一整套的技術能力;在此之上,又提供了包括視覺、自然語言等在內的豐富模型,形成完整的模型庫,通過模塊化的方式提供給使用者。
除此以外,適應工業大生產階段的“標準化、自動化和模塊化”,PaddlePaddle還提供了包括遷移學習、強化學習、自動化網絡結構設計、訓練可視化工具、彈性深度學習計算等在內的工具組件。而在服務平臺層面,PaddlePaddle則提供了零基礎定制化訓練和服務平臺EasyDL和一站式開發平臺AIStudio。這一整套的框架和服務,可以幫助廣大開發者和企業利用工具化、平臺化的方式,進一步降低深度學習應用門檻,加速推動產業智能化變革。
在深度學習框架領域,國外具有很大的領先優勢。無論是谷歌、亞馬遜、微軟、IBM 等互聯網巨頭,還是美國各大科研院所,都為開源世界貢獻了品類繁多的機器學習工具。當前比較主流的當屬TensorFlow、Keras、MXNet、PyTorch。
TensorFlow是Google Brain基于DistBelief進行研發的第二代人工智能學習系統,其命名來源于本身的運行原理,于2015年11月9日在Apache 2.0開源許可證下發布,并于2017年12月份預發布動態圖機制Eager Execution;Keras是一個用Python編寫的開源神經網絡庫,它能夠在TensorFlow,CNTK,Theano或MXNet上運行,旨在實現深度神經網絡的快速實驗,它專注于用戶友好,模塊化和可擴展性,其主要作者和維護者是Google工程師Fran?oisChollet。
MXNet是DMLC(Distributed?Machine?Learning?Community)開發的一款開源的、輕量級、可移植的、靈活的深度學習庫,它讓用戶可以混合使用符號編程模式和指令式編程模式來最大化效率和靈活性,目前已經是AWS官方推薦的深度學習框架,其很多作者都是中國人;PyTorch是Facebook于2017年1月18日發布的python端的開源的深度學習庫,基于Torch,可支持動態計算圖,提供很好的靈活性。在今年(2018年)五月份的開發者大會上,Facebook宣布實現PyTorch與Caffe2無縫結合的PyTorch1.0版本將馬上到來。
面對國外深度學習框架的來勢洶洶,所幸的是,國內還是有公司意識到了在深度學習上高度依賴國外公司所潛在的風險,從而埋下了一招先手棋,避免了我國AI技術在關鍵時刻被國外公司卡脖子、打七寸。
除了百度之外,2018年10月10日,華為在上海全聯接大會上首次發布華為AI戰略與全棧全場景AI解決方案就包括MindSpore深度學習框架;2018年11月,阿里巴巴宣布,其大數據營銷平臺阿里媽媽將把其應用于自身廣告業務的算法框架XDL(X-Deep Learning)進行開源,正式加入開源學習框架的激烈競爭;2018年6月28日,小米首席架構師、人工智能與云平臺副總裁崔寶秋宣布正式開源小米自研的移動端深度學習框架(MACE) Mobile AI Compute Engine。
而人工智能領軍企業曠視早在2014年就開始自主研發深度學習平臺Brain++,雖然還未開源,但是是所有創業公司中唯一一家自研深度學習引擎并且全員使用的公司。到現在為止,曠視全員使用的版本已經是8.0版本,頗為值得關注。
曠視Brain++是訓練算法的核心深度學習框架,可幫助算法訓練及模型改進過程流程化,減少人員參與而不犧牲訓練質量,大幅提高算法訓練效率。
根據灼識咨詢報告,曠視是全球為數不多的擁有自研深度學習框架的公司(包括Alphabet及Facebook等科技巨頭)之一。它具備以下獨特優勢:
針對視覺任務定制化優化。Brain++深度學習框架針對視覺任務做出了定制化的優化,使處理圖像與影像更高效。經過優化的Brain++特別適合大量圖像和視頻訓練,以及完成復雜的視覺任務,如圖像分類、物體檢測、物體╱場景分割、影像分析等。
配備AutoML技術。Brain++將深度神經網絡設計、參數調整及設備適配等過程自動化,顯著降低人力成本并大幅提高開發效率,構建出一條不斷自我改進、不斷變得更加高效的半自動的算法開發生產線。
強大的多任務及多用戶調度能力。Brain++可智能地調度信息技術基礎設施的計算能力,可以支持數百名研究人員同時在數千個GPU芯片上執行逾萬個訓練任務,從而顯著提高訓練效率。
得益于其高效及良好的適應性,曠視研發人員及軟件工程師全員可直接使用Brain++搭建深度學習模型并訓練算法,而無需依賴第三方開發的深度學習框架。此外,擁有自研的深度學習框架還使曠視可以面向其算法訓練及解決方案開發過程中快速進行定制化的優化。