造就Talk | 余凱:十年后,AI Inside無處不在
我是余凱,過去有一段時間在百度工作,創立了百度深度學習研究院,曾發起百度的無人駕駛項目。去年7月開始,我和一群小伙伴耐不住寂寞,一起創業了。現在是創業公司地平線機器人的創始人和CEO。今晚的演講主題叫做“無處不在的AI Inside”。我認為在未來,我們用的所有產品,可能都是AI Inside(智能的內在)。我們已經在不知不覺間進入到一個新的時代,這個時代叫“人工智能的革命”,或者叫“機器人的革命”。回顧人類歷史,有過三次產業革命:第一次是蒸汽機時代帶來的產業革命,第二次是電氣時代,第三次是信息時代。這一次人工智能的革命,讓包括我在內的很多人感到激動不已。在我看來,前面三次的革命實際上都是以人為中心,延展人的體力和腦力。它讓人可以跑得更快,飛得更高,看得更遠。人工智能的革命體現則非常不一樣。我們看VR、AR,感受到的是一個虛實融合或者虛跟實沒有明確界線的世界。現在坐在我對面,跟我下棋PK、可以自主做決策的是AlphaGo。未來我們會看到更多自主開車、自主飛行,甚至自主地跟你講故事。
它已不僅僅是以你的體力和腦力為延伸,它可以自主做決策。這樣一個尤其鮮明的特征,實際上就定義了在新的世界里,有一個可與人類共存的物種。
說到這個物種,“Robot”在中文語境中被翻譯成“機器人”,我認為這是有一定偏差的。這種偏差可能會讓我們在創業、制訂課題、投一個項目的時候,產生誤解。《劍橋字典》對“Robot”的解釋是:Robot是一個在計算機的控制下,可以自主去完成一定任務的機器。它實際沒有人的概念,Robot是智能的機器。這里不得不說“安卓”這個詞,英文里叫“Android”,它不只是一個品牌,它有具體的意義——長得像人的Robot,所以Android實際上是機器人。
未來的世界里,還會有很多很多Robot,有一部分是Android,但絕大部分Robot不一定長著人的形狀,卻有著智能的內在能力,就是AI Inside。
這個白色機器人叫Pepper,由孫正義的日本軟銀集團和法國Aldebaran Robotics研發。它是一個有自主反應的機器,而且長得像人形。所以它是一個Android,當然更是一個Robot。日本大阪大學的石黑浩教授,專注于制造人形機器人。他每年都會來到中國,展示他的一些機器人作品,像這樣長得非常漂亮、惟妙惟肖的美女機器人。對背景知識稍有些了解的話,你會發現,實際在舞臺后面某個小房間里,有個小女孩坐在電腦前控制著這個機器人,控制著所有的人機交互。你與機器人對話,回應的都是那個小女孩所做的理解,并非機器本身。所以這個東西我能叫它“機器人”嗎?它其實跟木偶沒什么差別。谷歌發布的Google Home,亞馬遜的Echo,Misa展示的他的桌面機器人Rokid,它們能夠自主跟人交互,甚至幫助你完成一些任務,它們都是Robot,但長得不像人,所以它們不是Android。現階段應用領域,我們看到的大部分都不是Robot。比如汽車,基于我的操控,它可快可慢,可左可右,但它自己不會自主地做任何事情。如果,我們在汽車或這類產品上裝上傳感器,裝上處理器,結合智能的算法,未來它就能自主決策。它們都會變成Robot。
今天的無人機已經具有自主定位、導航、避障等功能;Nest Labs公司的這款學習型恒溫器,可以自動控制暖氣、通風及空氣調節設備,讓室內溫度恒定在你設定的溫度。所以我們的未來,實際上是無處不在的Robot,無處不在的AI Inside。一個路線是,我們去造這樣的Robot,它具有非常敏捷的機械能力,并且長得像人的樣子;另一條路線是,不斷地提高它的智能水平和能力,以及它對知識處理的能力。以人類和人類的近親為例,猩猩的骨骼比人類更強大,肌肉也更發達,甚至更加的靈活,但它現在只能生活在叢林,找香蕉果腹。而人類不斷地拓展自己的知識境界,已經在征服宇宙、太空。這里面的差別在于什么呢?相較于猩猩強健的骨骼、靈活的軀體,人類擁有非凡的大腦。與驚動世界的、AlphaGo第一次打敗人類最強大圍棋手信息發布同期,也是谷歌的新聞,谷歌打算賣掉旗下一個名叫Boston Dynamics的著名子公司,該公司是世界上最先進的人形機器人開發公司。資源龐大如谷歌,它更愿意去開發像AlphaGo或是Google Home這樣具有非凡大腦的科技產品,而不是有強健體格的人形機器人。大腦的系統里面,具有感知、認知、決策這方面的能力。比如感知,它的本質是算法,在過去的十年時間里面,不斷推動算法進步的實際上是深度學習技術。深度學習是從模仿大腦神經系統最簡單的單個神經元開始,去構造一個更加復雜的網絡結構。通常它們有分層的結構,還有前后時間序列的結構,使得它能夠處理復雜的語音識別問題和圖像問題,包括AlphaGo下象棋的問題。數據大爆炸時代,深度學習正逢其時的主要原因是,深度學習與傳統算法相比,更加適合大數據。在數據不斷增長的時候,效果得到不斷地提高。以AlphaGo為例,它在上一次戰勝歐洲冠軍的時候,還只是職業二段的水平。經歷四個月的自我對決,產生幾千萬盤的棋局的數據,再通過這些數據訓練系統,使得它從二段跨越到遠高于九段的水平。事后媒體披露,就在它跟李世石比賽之前,用最新系統和當時職業二段所用系統來比的話,讓四個子,它還能贏。要知道,職業九段如果讓四個子,他是根本贏不了職業二段的。今天的深度學習已經從感知進入到決策時代。這個決策的核心框架就是我們所講的增強學習。增強學習要解決的問題是,怎么樣連續做決策,以期優化你的長期收益。過去,我們看到互聯網和云計算的強大,把所有計算都放到云端。但是這樣有一個問題,自動駕駛時,突然前面有一個小孩橫穿馬路,你該怎么辦?把信號傳到云端,等待處理以后再做決策,萬一網絡不行呢?更好的架構是云端與本地相結合。提及本地實現、云端實現,我們一定會談到處理器。CPU?通用處理器?我們要說的是人工智能芯片這種特殊的處理器,專門處理感知、認知和決策控制的問題。為什么大腦芯片不用通用處理器,而需要專用處理器,人類的大腦就是“通用處理器”啊?我們有很多的理由可以告訴你,人類大腦其實是“專用處理器”。過去很多人問我,地平線機器人為什么要做人工智能的處理器?這是一個挺難回答的問題,但是最近看新聞,說谷歌也在做人工智能的處理器(專用的深度神經網絡處理器),而且已經做出來了。這還能成為問題嗎?“地平線”希望去構建這種人工智能的大腦系統。基于這個處理器和操作系統,它會成為一個平臺,以便讓更多的開發者和公司,在上面開發各種各樣的人工智能應用,包括語音、圖像、自然語言理解、對話、決策控制、投資、自動駕駛等。目前我們思考的產品線主要在兩個領域:安徒生平臺,是一個通用的平臺,主要面向智能家居領域;雨果平臺面向自動駕駛,它對性能的要求更高,而對功耗的要求相對較低。
它像實時的4G一樣,能感知整個路面所發生的情況。在一個非常復雜的街區,它能夠識別行人、騎摩托車的人,各種各樣的車輛。自動駕駛可根據這個判斷進行規劃和控制。
這背后實際上是一個深度神經網絡。基于單目攝像頭,運行在一個芯片上面所實現的較強能力。智能手機在移動互聯網世界,從上到下催生了一個巨大的產業機會。它不光有芯片的應用,還承載了那么多的移動應用。未來會是怎樣?在我們看來,從現在開始,一直到2025年,10年時間,每個人的周遭以及你所使用的工具里,都會具有AI Inside設備。我們即將面對一個無處不在的AI Inside世界。從體量上來講,它會是智能手機時代所產生的經濟體量的10倍以上。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。