(原標題:年度重磅│沒有任何行業可以忽視人工智能——《麻省理工科技評論》 EmTech Digital 峰會干貨整理)
60年前的夏天,4名電腦科學教授一起啟動了一個目標為創造"人工智能”的夏季課題。這是這個名詞第一次出現在世界上。此課題的目標是:探索如何讓機器運用語言和抽象思維。
當時的項目提議是:“我們認為,一組精挑細選的科學家在一起工作一整個夏天就可以實現重大突破。”這在現在看來簡直是樂觀的傲慢。我們直到現在都沒有可以媲美人類語言或者可以實現抽象思維的軟件。
但是,最近的幾年里,人工智能軟件已經實現了曾經被認為是不可能的功能。例如識別圖像和語音,或者像谷歌最近給他們的電子郵件服務添加的功能:通過人工智能對語言的理解來寫出短郵件回復。
《麻省理工科技評論》主編Jason Pontin
5月23日在舊金山舉辦的為期2天的《麻省理工科技評論》Emtech Digital峰會上,來自各行業的精英們探討了這項科技是如何開啟人類生活及工作的新可能。
GE軟件研發副總裁Colin Parris:將人工智能引入工業互聯網
GE的“數字雙胞胎模型”(Digital Twin)靈感來源于長期應用于工業生產的產品和設備,拿航空制造業來說,引擎發動機在此行業中生產了將近40年。工業中的設備和產品技術投入巨大,效率的提高是工業生產發展的核心課題,而模型的提出是為了解決如何使得我們更加高效地使用和制造這些東西。
2005到2010年,工業增長率達到4%,而2010到2015卻只有1%,這是生產力的退步么?GE Software就此提出構想,我們能否從生產設備出發,合理規劃生產環節,將生產效率提高。
“數字雙胞胎模型”的設計理念源自于商業應中用的“數字信息轉化模型”(Digital Transformation),其中最出名的就是這三家公司的產品:蘋果,亞馬遜以及谷歌。它們有兩個共同點,一個是它們對于數字信息轉化的方案大同小異,而且公司市值的增速也都相當驚人,蘋果公司在2004年的市值才80億,而現在已經高達2340億。
讓我們說回數字模型,拿亞馬遜來說,他們首先建立“單位模型(Model of One)”來統計用戶的全面信息。這些信息來源于每一個用戶,并且有一系列數據標簽,包括年齡、性別和收入。用戶信息在你逛亞馬遜網站的時候就已經悄無聲息地收集了,例如你查看的商品、付款方式、送貨地址以及你購物車里的東西。而初代模型其實就反應了我們的購物心理,即喜歡買什么以及怎樣購買。亞馬遜然后將初代模型進行數據分類以及數據分析,得到能應用于商業的輸出信息。
而將用戶的購買興趣和購買力進行分類在這里是十分關鍵的,例如我如果被分在“型男區”,而此區的用戶大部分都買了“男人裝”,那網站就會向我推薦。除此之外,亞馬遜還將各個用戶的信息編纂起來,并向他們定向推薦商品和個性化服務,例如我已經在亞馬遜上訂購了年末的滑雪雙飛旅程,網站會以此為基礎向我推薦一些滑雪的裝備例如滑雪頭盔之類的。我購買完商品之后又會向網站提供反饋,點贊或者差評之類。我買得越多,他們提供的信息就越來越完備,這是一個正反饋的流程。
這樣的機制就是“單位信息處理(P&L of One)”。用不了多久,依靠此模型,亞馬遜就會知道我會花多少錢購物,以及怎樣讓我多花錢。從初代模型到用戶信息模型,商業價值就產生了。除此之外,一個收集信息的平臺也將推出,用來更方便地收集信息,例如亞馬遜的購物網站、蘋果的iTunes以及谷歌的搜索引擎。
那么“數字雙胞胎模型”的機制也十分類似,只是將上述商業模型直接搬到了工業上來,持續對生產設備的各個部件進行監控和分析,并期望得到特定的商業價值。我們同樣需要收集數據,例如收集引擎的生產數據、維修數據以及運轉數據,然后構建“單位模型”以及“單位信息處理”,而相應的輸出數據則從購物推薦、個性化服務以及評價系統變成“效率評估”、“性能評估”以及“產品商業評估”。
具體來說,就是將具有物理實體的機器所有信息收集起來,數據化,建立一個數字模型,就像它們的“雙胞胎”一樣,然后運用這個模型來預測機器會遭遇的問題或者來調試機器參數,使得它的效率更高。舉個例子,GE90飛機引擎的問題預測,如圖所示是經常途徑炎熱地區的飛機的引擎,其中的扇片上有防熱涂層(TB Coating)。這樣的涂層一旦損壞,就會影響發動機的性能,嚴重的話會造成人員傷亡。航空公司對此也是十分慎重,也發現了一些規律,往往200天這樣的引擎就會出現問題,所以200天期限一到,就要進行引擎的檢修。
這樣的經驗可能會靈驗幾次,但往往誤差很大,如果200天中有很多天氣溫并不是很高則會減緩涂層損壞的速度,或者是濕度過大加速涂層的損壞。這樣簡單粗暴地將引擎送往檢修,往往可能檢測不出損壞,而此期間飛機也不能使用,白白增加了維修成本也降低了商業價值的產生。如果針對此涂層建立“數字雙胞胎模型”,在每次飛行之后根據此次飛行的氣溫濕度等相關數據進行模擬分析,到了模型中損壞快出現的時候提前檢修,這就使得維修顯得十分及時了。
其實“數字雙胞胎模型”能提供的服務還有很多,例如上述的“維修服務優化”、“工作方案優化”、“生產優化”、“服務優化”、“輔助設計優化”以及“新服務方案設計”。只要你提供數據,我們就能提供巨大的商業價值回報。
“數字雙胞胎模型”中還應用了很多機器學習的理念,在這里我介紹其中的三個。
第一個是我們如何正確取得我們想要的數據,其中引入了計算機視覺采集技術;
第二項技術是我們怎樣將數據進行過濾,并找到正確的我們想要的數據;
最后是如何建立我們的“數字雙胞胎模型”。
問答環節:
主持人:我們都知道,雙胞胎的基因十分相似,但是他們之間還是有這樣那樣的差別,那么你們所謂的“數字雙胞胎模型”和它們現實中對應的物體之間也是有差別的吧。我的問題是,這種差別有多大,并且你們怎樣應對這樣的差別?
科倫帕里斯:我們的應對呢,總的來說有兩種,而差別一般分為三類。那么我們對不同的差別有不同的應對方案。第一種差別是有人對產品做了改變然而并沒有告訴我們,這其實是我們最常遭遇的,那么我們則需要反復對比實際以及校對參數來保證模型的擬真程度。
第二種是新變量的產生,比如我們觀測到的一個很詭異的現象——地球的“高空急流”實際上會變化——而當這樣的變化產生時,地球上炎熱地區的氣候也會發生改變。而一旦我們觀測到這樣的新變量,數字雙胞胎模型也要自然地做出相應的改良。
有些情況下,我們得到的數據并不完整,當你的數據缺失大到某種程度的時候,你的模型與現實的差異就比較明顯了。這種情況下,我們一般采取的措施是,首先核對實際數據,或者采用其他相關數據分析,比如大氣層的變化或其他我們觀測到的與氣候變化相關的數據,然后開始全面地學習和分析差異性的成因和影響。因為我們看待的是一整個綜合的問題,其中的各個組成部分中也會存在差異產生的因素,當我們把這些因素都整合到一起,問題就基本解決了。
主持人:那“高空急流”的改變發生過幾次呢?
科倫帕里斯:我們就觀測到過一次,你也知道研究“全球變暖問題”是一個無法預測的事情。
Founders Fund聯合創始人Luke Nosek:醫生將被人工智能取代
Founders Fund是一家投資公司,專門投資高新科技公司,這些公司一定是能對人類文明做出巨大貢獻的,如Airbnb、Stripe、LinkedIn、SpaceX、Yelp等高科技創新公司。Luke Nosek也是DeepMind的董事會成員,此前在韓國取得重大成功的AlphaGo就是他們的杰作。
主持人:像電影里那樣,人們對人工智能都有或多或少的恐慌。你們認為人工智能對于人類工作機會的影響有哪些?
Luke:我覺得,人工智能既在創造人類的工作機會也在減少人類的工作機會。那我就舉一個常見的例子:優步(Uber)。優步的出現就創造了全民司機的世界,雖然這不是傳統意義的人工智能,其實也是基于計算機技術的軟件應用。而如果真正的人工智能駕駛系統建立完備,司機這種職業將不復存在。這就是我說的,工作種類的變革變得越來越快,一些工種消失,一些對應的工種就要出現。這也需要當下經濟狀況良好,有著這樣那樣的公司出現來承載這樣的新職業,如此新的工種才能創造經濟價值。
主持人:那么對于那些特殊工種而言呢?比如醫生,他們接受了長期的培訓,就為了與人治病救死扶傷,現在如果機器能比他們更加準確,那么他們也將被替換,你是這樣認為的么?
Luke:恩,這是一個很難回答的問題。這些人一生都在接受培訓,做一些特殊的事情。我并不這樣認為。我覺得人工智能能在臨床醫學做的就只有處理數據的部分,因為醫生往往不能記住繁多的病人病歷還有最近最新發表的醫學論文,而機器卻十分擅長。但是機器也有做不來的地方,它們不能陪伴病人,使他們得到安慰,也不能照顧病人,而這些都是人類能做的。也就是說,我覺得機器和人類都能在其中找到自己最擅長的工作部分。
主持人:我不敢對整個醫學界妄加評論,但是你貌似覺得在醫護人員中只有一部分能繼續留下來,不被機器搶了飯碗,例如護士、康復師以及物理治療師。是這樣么?
Luke:我覺得最終會是這樣的。不過也許需要數十年吧。
主持人:不過最近的研究表明,人工智能的出現不會產生新的雇傭關系,也不太會改變現有的雇傭關系結構,而只是會在此基礎上加入一點新元素:工作之中越來越頻繁的人機交流。這樣的場景相信大家都在電影中看見過,那么你是怎么看待這樣的景象的呢?能為我們描述一下你心中的那個場景么?
Luke:我還是以臨床醫學為例子,這樣的情況下,醫生就有更多的時間花在病人身上了。教育中的情況也十分類似,人工智能將一些負責一些重復性的工作,例如評分系統,以及設計課程。而老師的角色就在于分析每一個學生的信息,然后加入情感方面的判斷,建立學生和人工智能之間的聯系,讓人工智能給學生的幫助更加恰當。
主持人:我這幾天都在看到這樣那樣的新聞和呼聲,人們呼吁對人工智能的發展和研究設定一個標準。我個人覺得,規定人工智能的發展標準是十分困難的,因為有些事情并不能預測。那么你作為投資者,覺得人工智能的發展需不需要受到限制呢?
Luke:我覺得是十分困難的。而且就算要設立標準這個范圍也是很廣的,你也無從下手。最關鍵的是這種新型科技的發展本來就是未知的,標準就更加難以定義了,就好比我們古代的醫學,也是顯得十分粗鄙,但是還是一步一步發展過來,但是那時候也沒有任何人規定手術時不能用某種剪刀吧。這是不可能的。
主持人:你覺得DeepMind的不足在哪里以及制約DeepMind發展的因素是什么?
Luke:我覺得現在的機器學習的表現是令人咋舌的,不過發展也就只是機器算法而已。如果我們想繼續發展下去,我們必須加入很多其他學科的理念和理論,例如神經學、心理學、哲學以及等等。這樣我們才能發展處下一代的人工智能,不然好的算法也終將是算法。
觀眾互動:
觀眾:您剛剛談論的人工智能和工作之間的影響,我想展開一下。您剛剛只討論了某些高新的特殊職業例如醫生,那么對于那些底層的藍領工作者,比如麥當勞的員工以及快遞員,這些人群也是十分巨大的。在人工智能替代人類工作的趨勢中,醫生能輕松轉型成為治療師之類的,而底層工作者的機會卻不這么多,您怎么看待這個問題呢?
Luke:我覺得只要是人,就能找到工作,而能力不是存在于你的簡歷或者學歷。技能可以繼續學習,工作能否盡快找到就在于當下你學習技能的快慢,以及順應潮流。
主持人:我的想法也差不多。舉個例子,就是伊隆馬斯克找到的一個工程師并讓他參與Tesla ModelX的設計,他曾經是一個機器人專家,馬斯克找到他時,他毫無自信說:“我都沒有參與工業界項目的經驗,我恐難當大任。”馬斯克卻說:“要的就是你這樣的人,毫無經驗,你就不會被條條框框所限制,就能發現我們看不見的東西。”
觀眾:就像你們正在做的事情,就是對各行各業的高新科技進行評估然后投資。那么一定有某家公司或者某位研發者的某個金點子讓你瞬間爆炸,你能告訴我們是怎樣的點子么?
主持人:哈哈哈,誰能讓Luke Nosek瞬間爆炸呢?
Luke:(開始打太極)如果真的是讓我瞬間爆炸的點子,因為我在投資公司,這也許是商業機密,所以也不能告訴你。
主持人:(開始救場)那你就抽象地說說唄。
Luke:(什么鬼……)但是硬要說的話,我只能很抽象地描述一下。想出這樣點子的公司一定是我們能看到他們有十分有創造力的前景,比如自動駕駛系統,我們就能看出它有很多閃光點能在未來為我們人類做出很大貢獻。
觀眾:(就是不放過你)恩,我打斷一下,這個真的確實十分抽象。
主持人:(救不了你了)哈哈哈哈~
觀眾:你就直說一些你覺得很贊的理念或者想法唄,不一定要是某些公司的案例。
Luke:那我就說一下吧。最讓我感到驚訝的就是人類的思維理念,而現在我們正處于理解人類思維以及怎樣提升人類思維的十字路口。而人類思維的潛力我相信是巨大的,也許也比我們想象中人工智能的潛力還要大。這個課題貫穿很多門學科例如教育學、心理學還有很多實際應用中的工作,我對此十分興奮。
亞馬遜機器人首席技術官Tye Brady:我對機器人的五點感悟
照片上開拖拉機的是我父親,他是密西西西比的一位伐木工。大蕭條時期,剛十二歲的他不得不進入叢林去努力工作來養活家人。
我本人在技術領域工作了25年,遇到那些經歷過大蕭條時期的人們,我總愛問他們一個問題:“你覺得對你人生影響最大的一項技術是什么?”我父親的回答是:“拖拉機、冰箱,還有飛機。”比如照片中的那臺拖拉機,有了它,不需要再用人力或牲口犁地;至于冰箱,能讓肉儲存更長的時間,這對食物短缺的時代是至關重要的。所以,大家可以看到,這些技術對生活的影響都是非常直接的。
但至于飛機,我覺得很奇怪,又問道:“我說的是影響你自己生活的技術!”,他沉默了一會,答道:“兒子,當我四十歲的時候,我第一次從報紙上聽說飛機這種東西,我當時很難相信一部機器載上人就可以像鳥一樣飛到天上。”直到他親眼看見一架飛機,看見它如何起飛降落。“我雖然說不好飛機對我的日常生活產生什么樣的影響,但我知道,它將改變這個世界。”
由已實現的非凡科技所帶來的的巨大的變革,我將這種現象稱為“完美的邊界“(the Boundary of Awesome)。技術是用來滿足人類需求的,包括機器人。
我個人對機器人的定義是:一種安裝了計算、傳感、驅動系統的物理裝置,以在物理環境中完成一項或多項的智力行為。
高等智力行為表現在對未建成環境的改造,輔以快速做出高級決策的能力。這種智力行為在初期的時候是預先設定好優先級的,后來發展到完全自動化。
機器人非常酷,我很高興我自己的工作是每天和他們打交道。作為亞馬遜機器人部門的首席技術官,我的責任是發掘、改進、應用相關技術,來使我們的員工、公司業務獲益,當然,最重要的通過技術和新產品來改善用戶體驗。
我們的總體目標是通過應用智能技術制造吃更好的機器人,并以此擴展人類的能力,同時改善我們的工作、生活、娛樂環境。這個目標貫穿我們工作的始終,尤其在低成本高效處理用戶訂單上。每當用戶點擊“購買”按鈕時,神奇的事情就開始發生了,只是用戶們很難看到而已。你訂購的商品存放在亞馬遜各地的倉庫中,并會為用戶選擇最佳的“訂單處理中心”(Fulfillment Center)。
如果你有機會去我們的訂單處理中心參觀,你會發現所有的機器人、人類同時有條不紊的并行工作,互不干擾,就像在演奏一首人機交響曲,場面令人震撼。機器人們現在已經取代了很多以前必須由人類去完成的工作,而且效率要高得多。我們的技術原理其實很簡單直接:我們讓貨物過來找人,而不是派人去找貨物。通過這套系統,我們能保證亞馬遜的物流系統可以以極高的效率運行。
至于整套系統是怎么工作的,大家可以看下面的視頻。我想先介紹一下系統中的組成部分。這種橙色的機器人是“運輸單元”,它負責搬運倉庫中的黃色貨架,貨架上塞滿了貨物,什么形狀的都有,而且有些是隨意擺放的。亞馬遜的倉庫里有成千上萬這種貨架,機器人能準確識別需要搬運的貨架,在預先設定好的最優路線上行進,快速且不會相互干擾。
亞馬遜的訂單處理中心面積非常大,約120萬平方英尺(約合11萬平方米),約28個橄欖球場那么大。這些機器人會按訂單順序排隊來到工作人員身邊,將目標貨物所在的那一面朝向工作人員,以便他們拿取對應貨物。
感謝我們的員工和機器人們,他們讓亞馬遜的訂單處理能力前所未有的強大。在剛過去的高峰期中,我們達到了每秒處理500件貨物的水平。如果把所有亞馬遜搬運機器人所走過的路程加在一起的話,可以突破一個“1”,當然,單位很重要,畢竟在座的都是工程師:一個天文單位,這是地球到太陽的平均距離,約1.5億公里!從今年起,我們的機器人該往回走了。
最后想說一下亞馬遜機器人的團隊,他們是一群極富創新精神的人,敢想敢做,很多亞馬遜已部署的機器人都是由他們設計制造的。他們中的大部分人都在波士頓和西雅圖工作。我能與他們共事是我一生的榮幸!
好了,既然今天是EmTech數字峰會,而且主題是人工智能,我就來分享一下自己對機器人前景的五個觀察。
首先是,機器人應該在人類身邊,而不是遠離。機器造出來就是為了滿足人類的需求,只有當它們在身邊是才能為你服務。比如手機,它也是高科技的產物,而且人們總是把它帶在身上,以便隨時隨地的獲得信息。人們擁有了一部隨身攜帶的電腦,改變了我們的行為習慣,這才是改變革命性的。機器人也是一樣,它們必須融入到人類的生活環境,但挑戰在于,怎樣快速融合?AI技術就是這一融合過程的催化劑。
其次,機器人應該很容易使用,而且不分男女老幼。道理很簡單,某個產品被使用得越多,就會有更多的人去改進它,反之亦然,一個良性循環。AI技術將用于開發更方便、更自然的互動界面,不管你是對機器人說話,還是指點,或是碰觸,總之,在人與機器人之間,必須有一種自然的行為方式。比如亞馬遜的Echo,我自己經常使用,我妻子也是,我孩子也是。如果我們家的狗也會用,我想她會天天在網上訂購肉骨頭,這我可不干。
第三,機器人應該為人類創造一種學習環境,這點很重要。允許人類有很好奇心,允許人類了解機器人的能力,允許人類將他們認為合適的工具用于合適的場景。創造一個學習環境來讓人類以最自然的方式去了解機器人的功能。AI技術將是建立這種學習環境必不可少的,人類將把AI作為了解機器人,以及賦予其更多功能的入口。
第四,機器人應該以可預測的明確姿態去完成任務。人類應該完全清楚機器人的下一步行動,這樣才能建立人類與機器人之間的信任關系。AI將用來建立雙方間的意向及狀態的雙向分享機制,AI要學會預測下一步行動,不管是人類的還是機器人的,這樣才能使得人類與機器人的關系透明化。
最后,機器人應該以簡化事物及增強人類能力為直接目標,簡單的說就是讓人類生活得更輕松。比如,亞馬遜的運輸機器人只負責一項工作:搬運貨物。把這項工作做到極致后,帶來的效果就是訂單處理效率的極大提升。AI在這里的作用就是分配任務,讓機器人去做它們擅長的事情,而讓人類集中與那些需要大量腦力的重要工作上去,然機器去延展人類的能力。
百度首席科學家吳恩達:人工智能將和電力一樣具有顛覆性
主持人:作為掀起深度學習革命的先驅之一,你是在何時意識到,深度學習可能會跨過人工智能的門檻?
吳恩達:我記得我在 16 歲的時候,第一次寫出自己的神經網絡。但很長一段時間里,我對神經網絡都沒什么信心,因為它并不怎么管用。直到 2009 年的時候,這是個轉折點,我的同事Adam Coates給我展示了他自己寫出的圖表。那張圖表使用一個深度學習模型,并將它不斷擴大。他發現,模型被擴展得越大,輸出的結果就越準確,而整個系統不過是從一個小模型演變過來的。所以那時我想,構建更加龐大的系統,可能是一個能夠成功的思路。于是我找到Sebastian Thrun,他那時在Google X,我問他能不能提供給我一些Google的機器,他說好啊我們一起做,于是后來就有了Google Brain項目。
主持人:這故事的最后一部分我還真沒聽過。這段時間,百度在對話型交互界面上有了巨大的突破,從商業角度上看,為什么語音交互界面對百度如此重要?要在效率和靈活性方面取得進步,會面臨哪些挑戰?
吳恩達:事實上,很多人低估了 95% 語音識別率與 99% 語音識別率的差別,這四個百分點的微小差距能夠改變游戲規則:現在,只有少數人偶爾使用手機上的語音交互設備,然而如果我們達到 99% 的準確率,語音交互系統就會成為人們在使用產品時不可分割的一部分,人們會不假思索地使用。自去年以來,百度用戶中使用語音助手的數量已經增長了三倍,我們肯定經過了快速彎道。隨著語音識別技術越來越可靠,就會接近采用曲線(adoption curve),不久就會有越來越多的人與手機、電腦對話,甚至都不用考慮。我經常想到智能手機觸摸屏,它改變了一切,喬布斯沒有發明觸屏(可能是HTC第一個發明的觸屏電話),但是,他讓觸屏智能電話運行得很棒,你會不假思索地使用它,這改變了一切,因為這是一種全新的人機交互方式。我認為,幾年后,語音交互也有這樣的潛力,將來我們都會不假思索地以語音的方式與電腦、手機等智能設備交流。
主持人:近年來智能系統在商業中的應用越來越廣泛。你認為商業公司戰略應該如何與時俱進,適應智能系統的普及?
吳恩達:這個問題很大,要花很多時間談這個問題。我認為,人工智能是新的「電力」。一百多年前,電力的使用完全改變了一切,產生了許多意料之外的后果,例如,電力讓冰箱成為可能,冰箱改變了食品供應系統,發電機也改變了產業建立方式。我認為,人工智能也會產業相似變革影響。目前,我們正處在這一階段,許多公司正在首席數據執行官,以后可能還會雇傭人工智能執行官,來管理掌控一切的人工智能。而這與當時許多公司「電力VP」的角色十分相似,因為在當時,電力系統對人們來說太復雜了,以致于必須要由專人管理。目前,我們也是這樣。這種策略有很多價值,如果你不十分確定怎么做,可以雇傭數據執行官或者人工智能執行官幫你搞定。
在接下來幾年,會發生另一種變革:人工智能會具有戰略決策般的重要性。舉例,另一個對產業影響與之類似的變革,就是互聯網的發明,當時首席信息官負責處理互聯網之類事宜。我們意識到,互聯網的發明從根本上變革了我們對創立公司方式的看法。人工智能會帶來類似的轉變。比如,現在,數據是許多公司的防御門檻,技術相對容易進行某種復制,但是數據是很難復制的,因此,你們公司的數據戰略是什么?有時我們推出一個產品,部分原因在于我們喜歡這款產品,部分原因就是為了收集足夠的數據,獲取信息,為以后要做的事情做準備。
這就是戰略計劃的一部分,計劃推出項目的先后順序,先做什么,獲取數據。我認為,一家領先的公司已經開始思考這樣的問題。許多公司曾經希望自己早點思考互聯網戰略問題,就像很多年前一些公司希望早點設計出電力戰略一樣。現在正是考慮公司的數據戰略的好時機。
主持人:我們現在的大學,能夠培養足夠的人工智能工程師來滿足市場的需求嗎?
吳恩達:可能僅靠大學,無法提供如此多的專業人才,所以許多在線學習平臺,如coursera, Udacity等等平臺能夠幫助我們解決這個問題。
主持人:聽說,中國大城市的交通情況很讓人頭疼,我們的一位同事前段時間體驗了百度的無人車,他的感受是,中國的道路真的是很難開,百度訓練無人駕駛車就像中國司機一樣夸張。你認為,在中國開發無人車,有什么在美國不會遇見的問題嗎?
吳恩達:中國交通的確讓人頭疼。有一次我們在五環高速試行無人車,一輛車突然就開到我們前面。如果是我的話我早就撞上去了,但是當時,汽車猛地停了下來。我還跟坐在駕駛位的同事說,哇你技術真好,剛才太危險了,人類接管了汽車,他說,我什么都沒做,車自己停下了。這可能就是你剛才提到的那種體驗。
我想和大家分享一個洞見:為什么我對百度的自動駕駛戰略表示樂觀。
例如,當我獨自開車時,旁邊的建筑工人可能會對你做出「停車」的手勢,這時,你必須停車,如果做出「加速通過」的手勢(類似召喚你過去的手勢——譯者),你最好開過去。對于無人車來說,它需要非常準確地判斷這兩個十分相像的手勢,因為它們的含義是完全相反的。這時,99.99% 的準確率才能保證一切運作正常。
根據現在計算機視覺技術,區分這兩種手勢需要辯證能力。這就是為什么我認為現在絕大多數組織思考自動駕駛汽車存在的誤區,自動駕駛汽車不僅僅是自動化,也需要輕微改變汽車的基礎結構,比如給建筑工人無線麥克風,與自動駕駛汽車交流,搞清楚汽車傳達的信息。如此以來,可能不久以后,自動駕駛汽車就可以上路了。
主持人:作為一名父親,我很關心未來的教育和就業情況。你有什么建議給家長們,讓他們幫助孩子更好地就業?
吳恩達:像所有技術革命一樣,人工智能會替代許多職位,也會創造許多職位。我能給各位家長的建議是,幫助你的孩子學習如何學習。隨著技術更新換代越來越快,最重要的是擁有學習的能力,這樣一個人才能不斷地適應環境的變化,始終在需要人類的崗位上發揮價值。
主持人:你談到了技術性失業這個主題,不過,目前在硅谷,一個特別熱烈的討論是,工作機會的有限是不是一種永久性的結構性有限,硅谷的解決方案是universal basic income,意思是每個人出生的時候就有收入購買所需 ,這個概念可以追溯到經濟學家米爾頓·弗里德曼,在你看來,無論工作機會是否有限,這種統一基礎收入的解決方案是否會有意義?
吳恩達:以后可能出現的失業潮,可能會更加迅速。之前,當農業漸漸被機器取代的時候,農民們尚可繼續耕作,而他們的孩子轉而學習別的技能。未來,從事司機等職業的人,可能在他們有生之年就會面臨失業。我認為,有一種與此類似的方法可能會很有幫助,那就是,對于結構性失業的人,我們不發放「失業補助」,而是發放「學習補助」,讓人們通過學習來賺錢。因為我相信,每個人都有通過自己的努力來創造更好的生活的權力。對于因智能系統的普及而失業的人來說,讓他們能夠學習其它更加需要人類的技能,能夠幫助他們繼續他們個人的發展。
主持人:你認為對于當前的機器學習技術來說,可能存在什么樣的局限性,可能出現什么樣的難題?
吳恩達:目前,任何的機器學習系統使用的都是監督式學習,而實現監督式學習,我們需要大量的數據。例如,我們在百度訓練語音識別系統的時候,我們使用了過去整整五年的語音數據和相應的文本數據。所以,對數據的龐大需求是機器學習的阿喀琉斯之踵。我希望以后能夠出現新的技術,使得機器學習能夠從更少的樣本中學習。
觀眾問答:
觀眾:我感覺對于人工智能在市場上的應用,工業產業常常被忽略,那么你認為人工智能對工業產業會有什么影響?
吳恩達:我認為事實上沒有什么產業是不會被人工智能所影響的,其中有很多是我們現在難以想象的產業。在互聯網剛剛興起的是,不論在百度還是谷歌,我們投放廣告的方式是,雇傭專門的人員,他們需要和廣告商討論,尋找與之匹配的、用戶訪問量高的網站,然后把不同廣告放到不同的網頁去。后來,我們開始使用數據來幫助他們進行分析。到現在,我們幾乎完全依賴機器學習系統來自動匹配廣告和網頁。但在一開始,那些工作人員是絕對不會相信機器能夠取代他們的工作的。同樣,拿服裝零售業舉例,以前,銷售人員需要分析什么款式、什么顏色更符合用戶的需求,他們需要預估一件產品的銷量,現在,很多公司已經在使用數據來幫助它們分析了。
觀眾:目前在語義理解方面,我們的進步十分有限,你覺得什么時候才會出現拐點?
吳恩達:目前,我們已經能夠使機器學習類比,這雖然只是非常基礎的一步,但我確實相信我們能夠一步一步地達成目標。其中,大量的數據是必要的,我相信這也是兒童學習的方式。算法也是十分重要的。我們確實非常需要一種新的算法來解決這一問題,但就我個人而言,我還不知道這種算法會是什么樣的。概括地講,大數據、更好的算法、以及強大的硬件,能夠幫助我們進步。
特斯拉研發的負責人Sterling Anderson:特斯拉自動駕駛將在Model 3之前推出
斯特林·安德森(Sterling Anderson)
當Tesla在2012年推出Model S時,這部車的主要賣點之一就是永久移動網絡連接。如今,此功能將成為Tesla在自動駕駛汽車競賽中的一個重大優勢。
通過網絡連接,Tesla可以從車主車內所帶的探測器中下載各種數據,例如車主的開車習慣以及路況。這些數據則可以被用于測試Tesla的自動駕駛軟件的效率。Tesla公司甚至曾經秘密的把自動駕駛軟件下載到車主的車里,在不控制車的前提下測試軟件在真實路況上的反應。
“我們可以從車里下載高分辨率的數據,并且可以通過OTA(Over The Air)來升級這些車輛。這個功能使得我們在過去的18個月里,從開發競賽的尾巴追趕到如今擁有這些非常先進的自動或半自動駕駛功能”。Tesla自動駕駛項目總監斯特林·安德森(Sterling Anderson)在舊金山《麻省理工科技評論》EmTech Digital大會上如此宣布。
“自從在18個月前推出這些硬件以來,我們積累行駛了7.8億英里”,安德森說。“我們可以在自己的服務器上使用這些數據來觀察車主們是如何使用我們的車輛,以及我們如何可以提高自己。”
安德森還表示,Tesla每10個小時就可以獲得1百萬公里的數據。Tesla的工程師們在開發自動駕駛軟件的初期時,就會把軟件的結果和這些數據比較。任何表現良好的軟件可以被秘密的安裝在車輛里來做進一步的測試。在不控制車輛的前提下,軟件對真實路況的一切反應將被記錄下來。
“我們經常會在已售車輛中安裝一個‘惰性’功能”,安德森說,“這將允許我們觀察一個功能在千萬英里的實況下表現如何。”
當一個新的功能被推出時,安德森的團隊也可以緊密觀察它的情況。就拿Tesla的Autopilot功能來說,安德森展示了一個圖表。圖表顯示了在Autopilot的控制下,自動駕駛的Tesla汽車比人類駕駛更加貼近車道的中心。自從去年10月正式推出以來,Tesla的自動駕駛功能已經積累了1億英里。
可以隨時隨地的從車里下載數據,以及秘密的測試自動駕駛功能是屬于Tesla的獨門絕技。谷歌曾展示過最先進的自動駕駛技術,但是他們也只能從數量極少的原型車里下載數據。相比之下,Tesla的車輛不但在數量上超過谷歌,在區域的廣度上也完全超越谷歌。
其他汽車廠家,例如通用汽車,也在試圖開發自動駕駛技術。但是他們并沒有像Tesla一樣歡迎網絡連接和OTA升級。
前不久,馬斯克剛剛宣布,廉價版的電動車特斯拉Model3會在2017年晚些時候面世。其內飾和輪轂的設計依舊沒有蓋棺論定,馬斯克在自己的推特里,也提到了車輛設計方面的不確定性,以及Model3“宇宙飛船”般的駕駛體驗。宇宙飛船?這究竟意味著什么?難道這是關于特斯拉,乃至全世界,第一部無人駕駛汽車的高能劇透?
當Sterling Anderson,特斯拉無人駕駛部門的負責人,被問及Model3會不會是人類歷史上第一部無人駕駛車時,他“駁斥”了這種觀點:“這種事情,在Model3問世之前,就應該發生了。”
“Model 3不會因為價格的原因缺失任何我們所擁有的技術,它會代表我們的最高水平。”Anderson表示,特斯拉是獨一無二的公司,它會將所有已經掌握的新技術,運用到所有正在生產的車型上,也就是說,所有特斯拉電動車在出廠時,都擁有當時特斯拉最先進的技術,“ModelS和X的技術水平也會一直進步下去。”
這預示著,也許特斯拉Model 3不會成為第一部無人駕駛車了,因為一旦特斯拉掌握了讓無人駕駛(自動巡航)的技術——不僅僅針對高速公路,而是全路段——他們不會等待Model 3的問世,而會將這項技術直接加載到現有的車型中。
Anderson說,他們的無人駕駛研發團隊目前正在嘗試解決郊區行駛問題,以及如何處理十字路口情況的問題。他的說法也符合目前特斯拉在無人駕駛方面的計劃,以及研發現狀的報告。
以特斯拉Model S為例,它在2012年開始發售,當時并不具備自動駕駛所需要的傳感器和其他硬件;到了2014年晚些時候,Model S增加了自動緊急剎車系統以及相關傳感器;而2015年,Model S又增加了一項人工開啟自動巡航的功能。
按這個速度下去,無人駕駛(自動巡航)指日可待?
Facebook計劃在今年使用神經網絡來提高翻譯水平
阿蘭·帕克爾(Alan Packer)
Facebook正在試圖大幅提高它自動翻譯的精準度。
他們準備在年底推出一款全新的,基于人工神經網絡的翻譯系統。人工神經網絡是Facebook以及其他科技公司花重資所開發的人工智能新技術。
在麻省理工科技評論EmTec Digital峰會上,Facebook語言技術部部長阿蘭·帕克爾(Alan Packer)表示,使用神經網絡所得到的翻譯結果要比統計機器翻譯所得到的結果更加自然。目前,絕大多數翻譯軟件所使用的都是統計機器翻譯。
帕爾克還表示,神經網絡在把俚語和比喻翻譯為其他語言中相似的說法這方面可能更加出色。
谷歌也正在向神經網絡上轉移谷歌翻譯,但是目前此項目還沒具體的時間表。
Facebook和谷歌兩者都有龐大的數據可以用來訓練翻譯軟件。但是Facebook的數據可能更加口語化,更加貼近人們聊天的方式。
目前,Facebook上有大概2萬億個狀態和回復。而且這個數字正在以每日10億的數量增加。帕克爾曾解釋過他的團隊是如何使用這些數據來訓練他們的軟件,去翻譯口語化的單詞和句子的。
就拿數月前的一個發現來說。那時,Facebook有探測到法國學生正在使用各種英語單詞的變種,例如“wow”的變種“uau”。Facebook的機器學習軟件成功的學會了這些,并開始正確的翻譯這些變種。帕克爾表示,Facebook目前可以翻譯40多種語言,每天提供高達20億次的翻譯。每個月都有8億名用戶在Facebook上瀏覽翻譯的語言。
但是有一種及其受到歡迎的語言帕克爾沒有任何興趣翻譯——表情符號。
“它們一般都是通用的“他說。
Gary Marcus:一味追求大數據是機器學習的誤區,我們的算法所需數據更少且速度更快
去年,微軟和谷歌的圖像識別算法都已表現出可通過學習打敗人類的能力。他們各自搭建了自己的軟件,進行了標準測試,讓軟件識別1000張各式各樣的物體的圖片,結果超過了平均的人類得分。
但是,為了讓軟件足夠強大能夠對抗人類,這兩個公司的軟件都對120萬張帶標簽的圖片進行了仔細觀察。而對一個孩子來說,只用一張樣例圖片,就能夠識別一種新的物體。
日前,創業公司Geometric Intelligence說,他們研發了一個可以更快學習的機器學習軟件。該公司的CEO Gary Marcus在EmTech Digital大會上表示,如果要學習一項新的視覺任務,他們的XProp軟件所需要的樣品圖片數量與現在機器學習軟件的主流形式——即深度學習相比要少得多。
Marcus沒有披露XProp的工作細節,但他展示了一張將XProp和某個深度學習程序在一項測試中的表現做對比的表格,該測試的內容是軟件學習怎樣識別手寫體數字。
表格顯示,訓練數據越多,兩個系統性能就會越精確。但是在相同數量訓練樣例的情況下, XProp的性能表現得更好。
比如,XProp學習過每個數字的大約150張手寫圖片后,識別新的數字圖片,錯誤率只有約 2%。而對深度學習算法來說,為達到同樣性能,則每個數字需要學習約 700 張樣圖。
這并不代表XProp一定有實際用處。識別手寫體數字差不多屬于已解決的問題了。可用來訓練的數據很多,而用深度學習軟件得出的最好結果錯誤率已經達到了 0.2%。Marcus展示的數字顯示,隨著訓練數據的增多,XProp相比于深度學習軟件的優勢就會下降。
但是Marcus說,在谷歌街景項目收集的門牌號碼照片的數據庫中,XProp的識別結果與上面那個實驗相似,其他的圖像識別測試中也是如此,這表明,該公司的技術可能具有廣泛的可用性。
大多數機器學習研究人員都認為會出現一些能夠通過學習更少的數據運作起來的新技術。
Marcus說:“深度學習非常需要數據——而我們的學習速度則更快,我們的軟件有時可以將所需數據量減少一半,有時甚至更多。”
Marcus是紐約大學的心理學教授,曾用幾十年時間研究兒童的學習方式。他目前最困惑的一個問題是,語音及圖像識別等由深度學習支撐的領域進展是否一定會幫助理解語言等更有挑戰性的領域的進步呢?
谷歌這樣的大型計算公司通過將海量的標簽訓練數據集結到一起,已經有能力打造強大的語音和圖像識別軟件。Marcus不否認這類科技將會帶來成功的產品。但是,他相信,如果軟件的性能要更加接近人類快速學習新技能,以及適應不斷變化的環境的能力,那么需要更少數據量的算法就必不可少。
“我們處在大數據的時代,而且很多人覺得只要投入更多數據就能解決問題,”Marcus對EmTech的觀眾說,“但是面對有些問題的時候,并沒有那么多數據可以提供。”
他說,語言就是其中之一。人們的言語有無限種可能,將所有含義的語句歸納出來訓練軟件是不可能實現的。Marcus還提到了無人駕駛汽車的例子,機器學習算法需要大量數據,在無人駕駛汽車中,這可能無法解決所有問題。
他說,如果一輛汽車必須一遍遍地體驗環境才能掌握技能,那么用每種可能的交通和天氣情況訓練車輛,可能耗時太長。
翻譯:楊一鳥,機器之心,羊羽,十三