2018 年中國(guó)自動(dòng)駕駛儼然進(jìn)入一個(gè)快車道。在各地利好政策的推動(dòng)下,自今年 4 月開(kāi)始,上海、北京、重慶、深圳先后開(kāi)啟了自動(dòng)駕駛城市道路測(cè)試;今年 7 月的百度開(kāi)發(fā)者大會(huì)上,李彥宏也兌現(xiàn)了一年前的承諾,基于 Apollo 平臺(tái),百度和金龍客車合作的全球首款L4級(jí)量產(chǎn)自動(dòng)駕駛巴士「阿波龍」正式量產(chǎn)下線。
到了 8 月份,Apollo 繼續(xù)霸占中國(guó)自動(dòng)駕駛的新聞。比如和神州優(yōu)車的合作,雙方將探索 10 萬(wàn)輛級(jí)自動(dòng)駕駛車隊(duì)的商業(yè)化運(yùn)營(yíng),開(kāi)始推行「自動(dòng)駕駛+共享出行」的商業(yè)模式;而與長(zhǎng)城汽車的合作,雙方將于2020年底實(shí)現(xiàn)自動(dòng)駕駛汽車的量產(chǎn),百度也成為長(zhǎng)城WEY品牌的自動(dòng)駕駛高精地圖和自定位技術(shù)的指定合作伙伴,這意味著百度成為國(guó)內(nèi)首個(gè)真正實(shí)現(xiàn)了L3級(jí)自動(dòng)駕駛高精地圖商業(yè)化量產(chǎn)的地圖提供商。此外,繼比亞迪后,長(zhǎng)城汽車也加入Apollo開(kāi)放車輛認(rèn)證平臺(tái)。
事實(shí)上,Apollo 自誕生到現(xiàn)在不過(guò)一年半的時(shí)間,能在如此短的時(shí)間里,不僅開(kāi)放平臺(tái)更新迭代到 3.0,更是在技術(shù)、生態(tài)和商業(yè)化探索上取得不少令行業(yè)激動(dòng)的進(jìn)展,這當(dāng)然得力于百度過(guò)去多年在自動(dòng)駕駛領(lǐng)域的人力、物力投入,但鮮為人知的是,支撐 Apollo 平臺(tái)底層技術(shù)的“基礎(chǔ)設(shè)施”——百度大腦——發(fā)揮了巨大作用。
技術(shù):從一輛車到一個(gè)平臺(tái)自第一輛福特 T 型車下線后一百多年里,人類從未放棄自動(dòng)駕駛的夢(mèng)想,而在本世紀(jì)初的幾年時(shí)間,人類似乎看到了實(shí)現(xiàn)這個(gè)夢(mèng)想的機(jī)會(huì)。
2004 年開(kāi)始,美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)連續(xù)三年組織了多次自動(dòng)駕駛比賽,比賽吸引了來(lái)自全美多所名校的教授、學(xué)生。盡管有些組裝的汽車最終完成了挑戰(zhàn),但人們也發(fā)現(xiàn)了自動(dòng)駕駛落地的真正難點(diǎn)并非是研發(fā)出一輛汽車,更大的困難還包括如何降低成本,汽車廠商不可能讓一輛 200 萬(wàn)美元研發(fā)成本的汽車成為大眾可以接受的車型;再比如如何實(shí)現(xiàn)量產(chǎn),汽車作為一款交通工具,其首要考量的是安全性,那么自動(dòng)駕駛汽車是否能夠完全符合汽車行業(yè)對(duì)于安全的要求,所有這些都是未知數(shù)。
作為國(guó)內(nèi)自動(dòng)駕駛研究的先行者,隨著 2017 年 Apollo 平臺(tái)的成立,百度的自動(dòng)駕駛開(kāi)始了從一輛車到一個(gè)平臺(tái)的戰(zhàn)略轉(zhuǎn)變。
戰(zhàn)略的轉(zhuǎn)變也需要強(qiáng)大的技術(shù)支撐,百度大腦在這個(gè)過(guò)程中扮演了重要的角色。百度深耕AI多年,百度大腦首次亮相于 2016 年的百度世界大會(huì),可以說(shuō)是百度大腦是百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成,包括視覺(jué)、語(yǔ)音、自然語(yǔ)言處理、知識(shí)圖譜、深度學(xué)習(xí)等AI核心技術(shù)和AI開(kāi)放平臺(tái)。
首先,自動(dòng)駕駛汽車絕非「攝像頭+傳感器+傳統(tǒng)汽車」這么簡(jiǎn)單,而是一種駕駛理念的顛覆,如何讓汽車學(xué)會(huì)感知、學(xué)會(huì)規(guī)劃以及學(xué)會(huì)對(duì)不斷變化環(huán)境的反饋,這需要這個(gè)頂層系統(tǒng)的支持,也是擺在任何自動(dòng)駕駛研發(fā)者面前的首要難題。
依托百度大腦,Apollo 平臺(tái)已經(jīng)可以提供環(huán)境感知、行為預(yù)測(cè)、到規(guī)劃控制、高精地圖、高精定位等一整套完整的技術(shù)解決方案,這凸顯了百度大腦在AI核心技術(shù)的全面布局和深厚積累。
其次,Apollo 作為一個(gè)開(kāi)放平臺(tái),需要承載不同廠商、不同車型的技術(shù)要求,這也要求底層的百度大腦具有更靈活、也更彈性的系統(tǒng)設(shè)計(jì),尤其是,百度大腦如何應(yīng)對(duì)平臺(tái)級(jí)別的技術(shù)調(diào)用需求。
不久前的開(kāi)發(fā)者大會(huì)上,百度不僅發(fā)布了百度大腦 3.0,提供了「多模態(tài)深度語(yǔ)義理解」的技術(shù)升級(jí),還提出一個(gè)「用腦量」的概念,這是一個(gè)類似于今天用電量來(lái)形容一個(gè)產(chǎn)業(yè)的繁榮狀況一樣,「用腦量」也會(huì)成為判斷一個(gè)行業(yè)智能水平的標(biāo)準(zhǔn)。
百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰在今年的百度AI大會(huì)上介紹說(shuō),百度大腦現(xiàn)在每天的調(diào)用次數(shù)已超過(guò)4000億次,自去年 11 月到今年 6 月,百度大腦的技術(shù)調(diào)用量,也就是「用腦量」有顯著的增長(zhǎng),其中,語(yǔ)音技術(shù)日調(diào)用量增長(zhǎng)94%,視覺(jué)技術(shù)日調(diào)用量增長(zhǎng)了416%,人臉識(shí)別技術(shù)調(diào)用次數(shù)增長(zhǎng)近8倍,NLP(自然語(yǔ)言處理)技術(shù)日調(diào)用量增長(zhǎng)了180%。
上述這組數(shù)字展現(xiàn)了百度大腦的開(kāi)放賦能能力,實(shí)現(xiàn)了從一輛車到一個(gè)平臺(tái)的巨大跳躍,而另一組數(shù)字則顯示了百度大腦以及所支撐的各種應(yīng)用的進(jìn)化速度。
速度:「中國(guó)速度」背后的底層支撐2017年7月5日,百度Apollo平臺(tái)正式亮相并發(fā)布1.0版本,兩個(gè)月后,Apollo1.5發(fā)布。
2018 年 CES 期間,發(fā)布僅八個(gè)月的自動(dòng)駕駛平臺(tái) Apollo 迎來(lái) 2.0 版本升級(jí),從整體架構(gòu)、安全性、感知能力以及模擬器方面都得到提升和優(yōu)化。
七個(gè)月后,Apollo 3.0 在百度開(kāi)發(fā)者大會(huì)上亮相,帶來(lái)了一個(gè)新架構(gòu)、兩個(gè)新平臺(tái)以及四個(gè)量產(chǎn)解決方案的升級(jí)。
這一系列被稱之為「中國(guó)速度」的創(chuàng)新迭代之快令行業(yè)震驚,伴隨快速迭代的系統(tǒng)版本,Apollo 生態(tài)也從無(wú)到有、從一到多,快速成長(zhǎng)為世界級(jí)的自動(dòng)駕駛開(kāi)放平臺(tái)。公開(kāi)資料顯示,Apollo 平臺(tái)已經(jīng)開(kāi)放了 22W+ 行代碼,其托管在 GitHub 上的開(kāi)放代碼數(shù)量在一年之內(nèi)增長(zhǎng)了 6 倍;而且,還被超過(guò) 10000+ 的開(kāi)發(fā)者推薦使用;目前已經(jīng)擁有 119家生態(tài)伙伴。
要支撐如此快速的自動(dòng)駕駛發(fā)展需求,百度大腦是如何應(yīng)對(duì)的?
其一,持續(xù)推動(dòng)基礎(chǔ)技術(shù)創(chuàng)新。以不久前發(fā)布百度大腦 3.0 為例,其核心「多模態(tài)深度語(yǔ)義理解」,就是對(duì)文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進(jìn)行深層次多維度的語(yǔ)義理解,涵蓋了數(shù)據(jù)語(yǔ)義、知識(shí)語(yǔ)義、視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言語(yǔ)義等多方面的語(yǔ)義理解技術(shù)。
這也意味著,通過(guò)「多模態(tài)深度語(yǔ)義理解」,機(jī)器可以在聽(tīng)清、看清的基礎(chǔ)之上,更深入理解它背后的含義,深度地理解真實(shí)世界。
其二,進(jìn)一步提升算力。某種意義上說(shuō),自動(dòng)駕駛汽車就是一個(gè)「移動(dòng)的數(shù)據(jù)生成器」,海量的數(shù)據(jù)需要實(shí)時(shí)計(jì)算,更需要低成本計(jì)算。今年,百度大腦在過(guò)往計(jì)算能力基礎(chǔ)上推出云端 AI 芯片「昆侖」,專門針對(duì)語(yǔ)音、圖像、NLP 等計(jì)算需求,不僅能夠大幅提升計(jì)算能力,還能將大大降低計(jì)算成本,官方給出的數(shù)字是降低 10 倍。未來(lái)百度還將推出專門針對(duì)自動(dòng)駕駛場(chǎng)景的AI芯片。
這些基礎(chǔ)技術(shù)創(chuàng)新對(duì)自動(dòng)駕駛發(fā)展的意義重大。正是利用上述基礎(chǔ)技術(shù),Apollo將打通語(yǔ)音交互和視覺(jué)交互體系,打造出業(yè)內(nèi)首創(chuàng)多模交互的小度車載系統(tǒng)。根據(jù)百度官方透露,目前可以在 30 天內(nèi)完成小度車載 OS 在車上的一站式部署,直接讓傳統(tǒng)汽車升級(jí)為智能汽車。
進(jìn)化:正在成為全行業(yè)的 AI 基礎(chǔ)設(shè)施新技術(shù)之于互聯(lián)網(wǎng)公司,都要經(jīng)歷從內(nèi)部?jī)?yōu)化到外部賦能的過(guò)程。百度大腦很早就成為百度內(nèi)部眾多產(chǎn)品,如搜索、地圖等產(chǎn)品的底層技術(shù)實(shí)施,將人工智能的各項(xiàng)能力注入到這些產(chǎn)品之中。
過(guò)去一年多時(shí)間,不管是自動(dòng)駕駛平臺(tái) Apollo 還是對(duì)話式操作平臺(tái) DuerOS,其技術(shù)難度之大、行業(yè)影響之深以及快速迭代的需求,都是早先行業(yè)所沒(méi)有遇到的難題,也正如上文所言,在過(guò)去一年多的時(shí)間里,基于百度大腦的 Apollo 在技術(shù)、商業(yè)和生態(tài)上取得的成績(jī),恰恰反映了百度大腦作為人工智能基礎(chǔ)設(shè)施的可行性。
如果將視線放在整個(gè)人工智能領(lǐng)域,百度大腦還有諸多進(jìn)化的可能性。尤其是 3.0 版本的百度大腦構(gòu)建了從芯片到深度學(xué)習(xí)框架、平臺(tái)、生態(tài)的 AI 全棧技術(shù)布局。
除了上文提到的芯片,百度大腦上的深度學(xué)習(xí)開(kāi)源框架 PaddlePaddle 也更新到 3.0 版本,新版本在服務(wù)器和移動(dòng)端進(jìn)行了全面優(yōu)化,可以適配更廣泛的開(kāi)發(fā)需求。
其次,基于 PaddlePaddle 增加了三個(gè)平臺(tái) AI Studio、AutoDL、EasyDL,進(jìn)一步降低了開(kāi)發(fā)者進(jìn)入人工智能領(lǐng)域的門檻,比如 AutoDL 的目的是向開(kāi)發(fā)者提供更普惠也更自動(dòng)化的神經(jīng)網(wǎng)絡(luò)架構(gòu),而EasyDL可以幫助開(kāi)發(fā)者零算法基礎(chǔ)訓(xùn)練業(yè)務(wù)定制模型,并提供可視化的操作。
第三,正如王海峰所言「我們研發(fā)最頂尖的AI技術(shù),我們也致力于開(kāi)放最頂尖的AI技術(shù)」,百度大腦已對(duì)外開(kāi)放110多項(xiàng)領(lǐng)先的AI場(chǎng)景化能力與解決方案,這些能力和解決方案為各行各業(yè)的開(kāi)發(fā)者甚至毫無(wú)編程經(jīng)驗(yàn)的入門者提供了一個(gè)可以改變世界的可能。
如果說(shuō) Appllo、DuerOS 是百度大腦面向汽車、人機(jī)交互提出的進(jìn)化方向,那么基于百度大腦,越來(lái)越多的開(kāi)發(fā)者、大中小企業(yè),完全可以結(jié)合自己的優(yōu)勢(shì)和領(lǐng)域,開(kāi)發(fā)出更多面向某個(gè)特定行業(yè)、領(lǐng)域應(yīng)用,只有越來(lái)越多的應(yīng)用落地,才能推動(dòng)人工智能,尤其是中國(guó)人工智能的快速發(fā)展。
寫(xiě)在最后李彥宏不久前曾說(shuō)過(guò)這么一句話:「我們希望,今天,無(wú)論你在哪里,無(wú)論你是誰(shuí),都能夠通過(guò)百度平等便捷地獲得AI能力。」如果把這句話放在百度人工智能發(fā)展的大框架里看,我們會(huì)發(fā)現(xiàn)自動(dòng)駕駛平臺(tái) Apollo 是讓賦能自動(dòng)駕駛行業(yè),讓汽車領(lǐng)域的開(kāi)發(fā)者、廠商平等接入自動(dòng)駕駛,對(duì)話時(shí)平臺(tái) DuerOS 則是要讓語(yǔ)音交互變成人人可以開(kāi)發(fā)以及構(gòu)建全新商業(yè)模式的底層技術(shù)。
百度大腦則更進(jìn)一步,它在驅(qū)動(dòng)上述兩個(gè)世界級(jí)的平臺(tái),同時(shí)又在向全世界的人工智能開(kāi)發(fā)者們開(kāi)放新的能力和技能,這個(gè)全新的人工智能基礎(chǔ)設(shè)施正在讓自動(dòng)駕駛的夢(mèng)想成真,同時(shí)還將承載更多人類邁向智能未來(lái)的新夢(mèng)想。
聯(lián)系客服