“最近一個月,你見過盲人嗎?”12月12日,由深度學習技術及應用國家工程實驗室主辦的WAVE SUMMIT+2021深度學習開發者峰會上,東北大學大四學生高鴻志向在場觀眾拋出一個問題。
中國14億人口中有1700萬視障人士,占總人口比例達1.2%,但在大街上卻很少看到他們的身影。“變色”和被阻礙的盲道,成了他們出行的障礙,而全國經過訓練的導盲犬只有200多只,每只導盲犬訓練需3-5年,與需求相比,杯水車薪。
“我們用不到半個月的時間訓練出一只機器導盲犬。”利用飛漿深度學習開源開放平臺和社區,高鴻志和他的團隊讓一只機器導盲犬實現了基于視覺的盲道導航、常見障礙物檢測、紅綠燈識別引導過馬路等功能,而未來,通過AI訓練,除了引導避障,機器導盲犬還可以為主人提供更溫暖、更安全的語音陪伴,很多現有導盲犬無法做到的事情,都將通過它變成現實。
年輕的高鴻志是一名飛槳開發者技術專家(PPDE),406萬飛槳開發者之一。作為我國首個自主研發的產業級深度學習平臺,截至目前,飛漿已經創建了47.6萬個模型,服務于15.7萬企事業單位,在中國深度學習平臺綜合市場份額第一。
“人工智能呈現出'融合創新’和'降低門檻’的特點。”百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰認為,一方面,AI技術及產業的融合創新越來越多;另一方面,雖然AI技術越來越復雜,但AI開發與應用的門檻卻越來越低。
這意味著,深度學習正推動人工智能進入工業大生產階段。
峰會上,飛槳發布包括飛槳新版全景圖—產業級模型庫新增文心大模型、業界首個產業實踐范例庫、飛槳“大航海”2.0共創計劃等在內的十大最新技術和生態進展。
一個人也可以完成的AI項目
25歲的李桑郁,是襄陽鐵路段的一名鐵路工人,通過自學飛漿開發套件,他開發出一套“鐵路貨車車身字符及標識自動檢測系統”,實現了鐵路貨運車號的自動識別。整個項目,
僅憑他一己之力。以前需要人工核對幾個小時的工作,如今只需要3分鐘就能完成,為襄陽車輛段省了20多萬元成本。
在飛漿平臺上,和高鴻志、李桑郁一樣的開發者,有406萬。飛漿是國內首個開源開放、功能完備的產業級深度學習平臺,它將大量基礎的、需要重復的代碼固化為模型,利用預先構建和優化好的組件集合定義模型,深度學習研究者不需要深入了解底層算法,便可以自主快速實現從建設數據集、到模型訓練、再到模型部署的整套流程,從而大大降低人工智能的使用門檻。
峰會現場,百度AI產品研發部總監忻舟現場演示了一只機器狗的5分鐘。飛漿全新發布的智能邊緣控制臺,僅僅需要5分鐘,便讓一只機器狗學會了識別手勢的新技能。對于高鴻志而言,一款更人性化的機器導盲犬“出街”的時間,又可以縮短了。
值得一提的是,通過多層次、低成本的硬件適配方案,大大降低了框架與芯片的適配成本。以寒武紀MLU適配為例,飛漿方案相比原方案,代碼行數減少69.4%,修改的代碼文件減少62.3%,人力投入成本降低60%。截至目前,飛漿和22家國內外硬件廠商完成了31款芯片的適配和聯合優化工作。
AI進入工業化大生產期
2019年4月第一屆WAVE SUMMIT+2021峰會上,王海峰曾將深度學習框架定義為“智能時代的操作系統”,它下接芯片,上承應用,尤其在大生產階段,能夠將AI技術以標準化、自動化和模塊化的方式輸出給各行各業,實現規模化應用;同時以平臺為基礎促進融合創新、共同發展,凝聚各方,通過賦能廣大開發者,有力支撐AI工業大生產,促進技術創新和產業智能化升級。
飛漿源起于2018年7月,開源框架 v0.14發布,百度官方首次開源CV/NLP/語音/強化學習等10個模型,提供了從數據預處理到模型部署在內的深度學習全流程的底層能力支持。
經過三年的發展,飛槳持續突破了核心框架的創新。全新發布的開源框架v2.2,新增大量科學計算API,高效支持超大模型訓練的端到端自適應大規模分布式訓練技術;全流程加速文本任務,解決文本領域開發在性能和訓推一體方面的痛點問題,在飛槳產業級模型庫里,新增的知識增強文心大模型,可以讓大模型真正進入產業應用。
峰會現場,國家電網上海電力公司調度中心副主任肖飛講述了國家電網對于“人工智能”的渴望。基于雙碳的目標,風能和太陽能等可再生能源在電網中的占比正在逐步提升,但對整個電網的系統管理提出了非常大的挑戰,尤其是因自然條件變化產生的不確定性,可能會對整個電網產生災難性影響。這就需要利用深度學習、監督學習、非監督等模型,對可再生能源的消納、負荷等資源的配比精準預測。
肖飛介紹,通過百度飛漿平臺,國家電網的新能源預測準確性提高了85%,智能安排從分鐘級提高到了秒級,為整個電網運行奠定了非常好的基礎。
百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜指出,近年來,全國各城市的AI開發者規模逐年增長,應用人工智能的企業數量,呈現出多地開花、多行業繁榮的景象。從推薦等通用場景,到客服系統智能派單等行業衍生場景,再到發電預測等行業關鍵場景……類似這樣技術與產業的融合創新案例在飛漿平臺上越來越多,也越來越專業,截至目前,飛槳服務了15.7萬企事業單位,有力促進了產業智能化升級。
培育復合型AI人才
對于人工智能產業而言,人才是永遠不過時的話題。隨著AI與產業的深度融合,需要越來越多既懂AI,又具備產業經驗的復合型AI人才。
“大學不要用昨天的知識教今天的學生,讓他們去面對明天的需求。”上海大學計算機工程與科學學院院長謝少榮一直在思考,如何將產業界最新研發的產品及時納入到人才的專業培養中。在他看來,對于本科生,在低年級需要做的是系統知識的培養,但到了高年級,有了一定共性的專業基礎后,便可以和百度這樣的互聯網公司合作,將先進的算法模型和開源平臺引入高校,提升人才培養的聯動效應。
類似的思考,存在于國內大多數院校中,對于新一代AI人才的培養,不同高校也都在探索。
西安交通大學是國內知名的工科高等院校,早在十年前,便開始探索“菁英班”模式,和科技與產業前沿的龍頭企業合作,由校企雙方共同制定培養方案,共建課程體系,企業的導師參與學校的理論課程教學,指導學生的項目設計、科創計劃,目前合作的企業包括百度、華為、中興、360等。
通過采用多學科交叉、本碩博貫通的選拔方式,西安交通大學選擇一些學有余力的好學生,成立“菁英班”后進行小班制教學,并且將學生原學習的專業和“菁英班”的前沿方向有機地融合起來進行培養。截至目前,全校已經建立了23個“菁英班”。從結果來看,參加“菁英班”學習的應屆畢業生普遍認為自身的創新意識、工程設計與開發實踐能力都得到了極大地提升。
互聯網公司對于這樣的復合型AI人才,也是無比渴望。一直以來,飛槳致力于復合型AI人才培養,與多家知名院校達成了多項人才培養計劃。自2018年開始舉辦“全國人工智能師資培訓班”以來,百度飛槳已累計培養了2900多位高校教師,覆蓋690多所高校。2021年推出《AI人才產教融合培養方案》,從內容、專項合作、服務層面,為AI人才培養提供了可供參考的產學研實踐方案。