前言:斯坦福大學發起了一項名為《人工智能100年》的研究項目。2016年9月1日,該項目的首個成果《人工智能與2030年的生活》發布,這是一份關于AI在未來十幾年間影響的報告。報告分為三個部分,第一部分為AI的定義和研究趨勢;第二部分為AI的八大應用領域,包括交通、健康、教育等等;第三個部分為政策推薦,目的是希望推動相關政策的制定。我們翻譯了該報告的第一部分,以供參考。
報告摘要
人工智能是一門科學,同時也是一種計算機技術。人工智能的靈感來自人如何使用自己的神經系統和身體器官來進行感知、學習、推理和行動中獲得知識,但是,一般來說,二者的運行機制卻有很大的不同。
AI的發展是不一致而且不可預測的,60年前AI的構想剛被推出時,確實有過巨大的發展。作為一個整體上還屬于學術領域的技術,21世紀的AI使得一系列主流的科技變成了可能,對人類的日常生活產生了深遠的影響。
比如說,計算機視覺和AI規劃推動了視頻游戲的發展,在娛樂行業,視頻游戲的規模現在已經超過了好萊塢。
深度學習——一種基于多層被稱為神經網絡的表示的機器學習形式,已經讓手機或者廚房設備理解人類語言成為現實,其算法也可以被用在一系列依賴模式識別的應用上。自然語言處理、知識代表以及推理,已經可以讓機器擊敗Jeopardy的冠軍,為網絡搜索帶來新的功能。
雖然很讓人震撼,但是這些技術被高度地局限在特定的任務中,每一個應用基本上都要經過數年細化的研究和非常謹慎、獨特的建設過程。在類似的定向應用中,未來可以期待AI技術會呈現巨大增長,比如,無人駕駛、醫療診斷、靶向治療和老人身體輔助。AI和機器人也會在全球那些難以吸引年輕人的行業中得到廣泛應用,比如農業、食品加工、運營中心和工廠。它們會通過無人機、自動駕駛卡車或者可以爬樓梯直達家門口的機器人來促進快遞的發展。
這份報告是人工智能100年研究(AI100)的第一部分,以后會定期更新。
AI100由AI100長期委員會領導,其職責是研究AI在2030年前會發生的影響,尤其是在北美地區。2015研究小組由AI和其他相關領域的專家組成,他們最為突出的關注點聚焦在8個領域:交通、服務機器人、健康醫療、教育、低資源社區、公共安防、就業和職業以及娛樂。
報告回顧了每個領域過去15年的進展,也展望了未來15年的發展。雖然都是來源的研究基礎幾乎一致,但是每一個領域都反映了AI不同的影響和挑戰,比如,開發安全可信賴的硬件的困難(交通工具和服務機器人)、獲得工作信賴的困難(低資源社區和公共安防)、對人類可能會被邊緣化的擔憂(就業和職業)、人際交往減少帶來的社會副作用(娛樂)。
報告以“AI由什么組成”開始,以推薦AI相關政策作為結束。這些推薦包括,政府應該招聘AI專業人才,把更多的資源投入到研究AI系統對公平、安全、隱私和社會福利的影響上,消除阻礙。
與主流媒體上異想天開的預測不一樣,研究小組(StudyPanel)發現,人們完全沒有理由擔心AI會對人類形成即刻的威脅。目前為止,還沒有一臺可以自我維持、擁有長期目標和意愿的機器被發展出來,并且在短期也不可能會出現。反之,越來越有用的AI應用很可能會從現在起到2030年崛起,它們對社會和經濟會有非常深遠的積極影響。同時,這些發展將會對人類勞動力的增強或者替代產生顛覆性的變革,在更大范圍上增加經濟和社會的挑戰。在短期內的應用設計和決策很可能會對自然和這些發展的方向產生長遠的影響,這使得AI研究員、開發者、社會科學界和政策制定者在進行創新與確保AI的經濟和社會福利能被全社會共享二者之間的平衡顯得尤為重要。
如果社會對這些技術的理解主要是擔憂、懷疑和誤解,那么,確保AI技術的安全和可信就變得很重要。從另一方面來說,如果社會以一種更加開放的心態來接受AI,從這一領域崛起的技術將會深刻地變革社會,在接下來的10年中,會把人類社會變得更好。
第一部分:什么是人工智能? 本節介紹了研究人員和從業者如何定義“人工智能”和AI的研究和應用發展的熱門領域。本節描述了什么是AI和什么不是AI,并且介紹了一些人工智能研究的當前“熱門”領域。本節將為第二節引入相關的背景知識,第二節介紹了人工智能在八個領域的影響和發展前景,第三節介紹有關AI設計和公共政策問題,同時提出了鼓勵AI創新,保護民主價值觀的建議。
一、定義AI 對人工智能給出不同于大眾理解的精確和復雜的描述是困難的,因為如何對人工智能進行精確定義目前還沒有達成共識。奇怪的是,AI缺乏一個精確的、普遍接受的定義反而幫助它成為成長日益加快的領域。人工智能的從業者、研究人員和開發者,大多是按照自己朦朧的方向感以及努力跟上發展形勢的緊迫感在該領域探索。盡管如此,定義仍然是重要的,斯坦福大學計算機科學教授尼爾斯·J·尼爾森提供了一個可供參考的定義:
“人工智能致力于使機器智能化,智能化是衡量實體在特定環境中反應和判斷能力的定量指標。”
從這個角度來看,如何定義AI取決于研究者更加看重軟硬件系統的“反應”能力還是軟件系統的“判斷”能力。功能簡單的計算機器計算速度比人腦快,而且從不出錯,這能算是一種計算器智能嗎?本研究小組同尼爾森的觀點一樣,認為應當從多維譜系來看待智能。在我們看來,計算器和人腦之間的差異不是單一維度的,而是包括規模、速度、自治程度和通用性等多個維度。這種方法還可以用于比較他物體的智能,比如智能語音識別軟件、動物大腦、汽車的巡航控制系統、圍棋程序、恒溫器等,并且將它們放置在智能頻譜中合適位置。雖然以我們寬泛的解釋,可以把計算器放到智能頻譜中,但是這種簡單的設備和今天的AI并沒有什么相似之處。AI的前沿進展日新月異,而計算器的功能只是今天智能手機眾多功能中的一個。
目前AI開發人員致力于提高、推廣和擴大智能手機的智能程度。事實上,人工智能領域是一個持續努力推動機器智能的前沿。但是諷刺的是,AI取得進展經常被有意無意的忽視,逼迫著它不得不持續推動前沿技術的普及,這種重復出現的現象被稱為“AI效應”或“奇異悖論”。AI為傳統領域帶來了新技術,當人們已經習慣了這種技術,就不再認為為它是AI技術,然后新的AI技術又會出現,這種情況在未來仍會持續下去。AI不會像晴天霹靂那樣突然“傳遞”一個足以改變生活的產品。相反,人工智能技術是以一種連續的,漸進的方式逐步演化的。
*對人腦的評價 值得注意的是,我們在智能頻譜定性排序中并沒有為人的大腦安排特殊的位置。但迄今為止,人類的智能在生物界和人造世界中都是所向無敵的。人類的智能是豐富多樣的,表現為“推理、實現目標、理解和創造語言、感知和響應感官輸入的、證明數學定理、玩挑戰性的游戲、綜合和總結信息、創造藝術和音樂,甚至是書寫歷史”。
這使得人類的智能自然成為衡量AI的進步的標準。甚至可以提出一個經驗法則:任何電腦的活動能夠和人類活動一樣,都應該算作一個智能的實例。但是,與人的行為相似只是一個充分條件而不是必要條件。
現在已經有很多系統,已經超過人類的智慧,至少在速度上,如機場調度系統,每日能夠調度數千架航班抵港及離港。AI的長期追求的目標之一是在國際象棋的比賽擊敗人類玩家,奇怪的是,沒過多久,AI就達到了之前它難以實現的目標。現在這個目標已經最終實現了,成為人類與機器比較智能過程中一個引人注目的實例。
國際象棋已經讓人心醉了幾個世紀。當計算機即將誕生的時候,計算機科學之父阿蘭·圖靈提出可以讓電腦通過與人類下國際象棋展現其智能水平。在沒有強大的計算機的情況下,圖靈和他模擬的計算機對弈時,計算機大約要半個小時才能走一步棋。但是經過六十年代的一系列漫長的改進后,國際象棋的AI方案越來越成熟,卡內基梅隆大學、斯坦福大學、麻省理工學院、莫斯科的理論和實驗物理學院和西北大學都作出了自己的貢獻。最后國際象棋的AI方案通過IBM的長期項目度過了沖刺階段,IBM的深藍計劃在1997年擊敗卡斯帕羅夫,獲得國際象棋世界冠軍,最終的比分是3.5-2.5。
深藍的AI方案被描繪成的“暴力方法”集合,這并不是“真正的智能”。事實上,IBM的隨后關于深藍的出版物,提供了其AI方案中有關搜索和評估程序的大量細節,文中甚至一次都沒有提到“智能”這個詞。深藍到底是不是智能?顯然,人工智能的前沿再次向前推動了。
*實操層面的定義 AI的定義也可以通過AI的研究人員的研究內容來確定。本報告認為AI是計算機科學的一個分支,通過人工合成智能來研究智能的特點。雖然AI的研究進展一直依賴于硬件計算資源的快速發展,但是最近為神經網絡計算軟件專門設計硬件的趨勢體現了硬件和軟件緊密耦合、共同推進人工智能發展的新特點。本報告將重點從軟件層面反映人工智能的發展趨勢。
*智能的評判依賴多維度光譜 在我們看來,計算器和人腦之間的差異不是單一維度的,而是包括規模、速度、自治程度和通用性等多個維度。“智能”仍然是一個復雜的現象,其各個方面都引起了不同的研究領域的關注,包括心理學、經濟學、神經科學、生物學、工程學、統計和語言學。當然,人工智能領域已經從所有這些相關領域所取得的進展中獲益。例如,很多AI的方案的核心部分人工神經網絡的設計思想最初就是受到生物神經元中信息流動機制的啟發。
二、AI的發展趨勢 直到世紀之交,AI的吸引力在很大程度取決于其承諾的兌現,但在最近的15年中,AI作出的大部分承諾都兌現了。人工智能技術已經滲透到我們的生活中。當他們成為社會的核心力量,這個系統也將從簡單的構造智能的系統向構造具有人類意識、值得信賴的智能系統轉變。
有幾個因素推動了AI革命。其中最重要的是基于云計算和基于大范圍網絡數據采集支持的機器學習系統的日漸成熟。“深度學習”是機器學習領域的一次重大飛躍,它是一種使用反向傳播算法的自適應人工神經網訓練方法。這種革命性的軟件技術極大地推動了傳感、視覺、物體識別等領域人工智能硬件技術的發展。
新的數據驅動的平臺和產品市場,以及刺激尋找新的產品和市場的激勵措施,都有助于AI驅動技術的出現。所有這些趨勢推動了如下所述的“熱點”研究區域。該匯編只是為了通過一個度量或一個方面反映目前獲得較多關注領域。他們不一定比其他領域的更重要或更有價值。事實上,一些目前的“熱門”區域在過去幾年中是不太受歡迎的,所以現在不太受歡迎的領域在未來也可能變得“熱門”。
大規模機器學習 許多機器學習問題(如有監督和無監督學習)已經基本解決了。目前科學家們重點攻克的問題是使用海量的數據集擴展現有的算法。例如,盡管傳統的方法能夠在多次分析數據集后得出結論,但是最新的方法只需分析一次數據集就能得出結論;在某些情況下使用亞線性方法只需分析一小部分數據就可以得出結論。
深度學習
卷積神經網絡的訓練成功讓計算機視覺領域收益匪淺,在目標識別、視頻標記、行動識別及其他相關領域獲得廣泛應用。深度學習的應用還在音頻、語音和自然語言處理等領域取得顯著進展。
強化學習 傳統的機器學習大多集中在模式挖掘,而強化學習得重點是決策,這是一種有助于AI更深入學習的技術,可以讓AI進一步理解真實世界、作出更好的反應。
強化學習作為經驗驅動的順序決策的框架思想已經提出了幾十年了,但這類方法在實踐中并沒有取得巨大成功,主要是受樣本空間的代表性的影響。然而,深度學習的出現為增強學習注入了“強心針”。
最近,谷歌開發的計算機深度學習程序AlphaGo在五場比賽中擊敗人類的圍棋冠軍,這種成功很大程度上是強化學習的功勞。AlphaGo先是接受一個人類專家庫訓練程序的自動化訓練,然后利用強化學習的方法,自己同自己下大量的圍棋,進一步提高智能化水平。
機器人 靜態環境中的機器人導航問題已經在很大程度上解決了。目前的努力的方向是如何訓練機器人與周圍的環境以日常的和可預測的方式進行交互。與環境交互必然要求發展機器人操縱能力,這是當前研究者關注的另一個話題。
深度學習的革命才剛剛開始影響到機器人技術,在很大程度上是因為訓練機器人而標記數據集的難度比其他領域大的多。
強化學習(見上文)可以幫助降低標記數據集的要求,但需要系統能夠安全地探索策略空間避免損害系統本身或他人的錯誤。
機器感知可靠性的進展,包括計算機視覺,力度和觸覺等,其中大部分將靠機器學習來驅動,機器學習還將繼續成為推進機器人的功能演化的關鍵力量。
計算機視覺 目前計算機視覺是機器的視覺最突出的形式。它一直是人工智能領域通過深度學習發展最快的分支。直到幾年前,視覺分類任務首選的最直觀的方法還是支持向量機。
但是,大規模計算的融合,如GPU、通過互聯網可獲得大型數據集,以及神經網絡算法改進都促進了人工智能在圖像網絡分類大賽上基準任務處理能力的顯著提高。電腦第一次能夠比人類更好地執行一些(狹義的)視覺分類任務。目前大部分的研究主要集中自動圖像和視頻文字標記上。
自然語言處理 自然語言處理和自動語音識別都是機器感知領域非常活躍的應用。它正在在擁有大量語料數據的主流語言領域中迅速實現商品化。谷歌宣布,目前20%的移動端查詢指令是通過語音下達的,最近的演示也證實了實時翻譯的可能性。
研究者現已不滿足只是對程式化的要求做出響應的系統,逐步轉向開發能夠與人對話互動的智能系統,人工智能技術已經滲透了我們的生活。當他們成為社會的核心力量時,這個領域將從構建具備簡單智能的系統向構建具有人類意識和值得信賴的智能系統轉變。
附錄I提供了AI發展簡史,包括一些經典人工系統的介紹。人工智能的核心研究領域在經過六十年的發展,已經發生較大的變化。反向傳播是“基于錯誤的反向傳播”的縮寫,是一種訓練人工神經網絡的常用方法,經常與梯度下降等優化方法配合使用。該方法計算損失函數相對于網絡中所有的權重的梯度。
附:人工智能的發展簡史 人類最早關于人工智能的研究可以追溯至上古時期的神話和寓言中。而現代科學意義上的人工智能則始于上世紀40年代末,計算機科學之父阿蘭·圖靈在1950年發表論文《計算機器與智能》、《機器能思考嗎》,提出了著名的“圖靈測試”,指出如果第三者無法辨別人類與人工智能機器反應的差別,則可以論斷該機器具備人工智能。從此,學術界展開了廣泛有關機器思維問題的討論。因此,圖靈也被稱為“人工智能之父”。
1956年的達特茅斯會議標志著“人工智能”學術概念的誕生。此次會議上,學術界各領域代表不僅接受了“人工智能”這一學術表達,并且認可了該領域的研究目的、早期重大成果及其主要貢獻者。這一歷史時刻被廣泛認為是人工智能的誕生。
此后,人工智能經歷了1956-1974年的第一個黃金發展期。在該階段,人工智能取得了不少建樹,有重大影響力的成果包括:推理搜索的算法研究、概念依存理論、微世界研究等。在取得這些重大突破以后,第一代研究者對人工智能充滿信心而過于樂觀,甚至預言3-8年(1970年)內,人工智能將達到人類的平均水準。
1974-1980年是人工智能研究的第一個寒冬,因局限于當時落后的計算機運算能力和數據收集能力等原因,人工智能發展約到了阻礙,導致社會對于人工智能普遍預期下降,投資減少。
1980-1987年,得益于“專家系統”的出現,人工智能研究引來了第二次快速發展。所謂“專家系統”,是人工智能的一個研究分支,它具有一種仿真決策能力。但問題必須聚焦于非常具體的某個領域,才可能通過if-then規則來規避計算機不擅長的常識性問題。1989年的DeepThought戰勝了國際象棋大師,為后來的DeepBlue的成功奠定了基礎。1981年日本政府提出了“第五代電腦計劃”,開始重點資助人工智能項目。
1987-1993年是人工智能研究的第二個寒冬,導致整個人工智能研究進展放緩的原因來自于個人消費電腦的快速發展。1987年,蘋果和IBM開始在桌面市場發力,個人電腦的運算能力開始超越Symbolics公司昂貴的Lisp電腦,人工智能硬件市場受到巨大擠壓而發展緩慢。
1993-今,人工智能在誕生了半個多世紀后,終于可以實現當初既定的幾個目標,并且再21世紀初得到了快速發展。1997年5月11日,IBM公司的DeepBlue擊敗了國際象棋世界冠軍卡斯帕羅夫;2005年,斯坦福大學制造的機器人自我駕駛131英里,贏得了美國國防部先進研究項目大挑戰。兩年后,2011年,IBM公司的沃森在一檔智力競猜節目中擊敗了2位人類冠軍,并且優勢巨大。2016年,DeepMind公司研發的AlphaGo以4-1的比分擊敗了韓國圍棋大師李世石。
譯自:2016年10月【美國】斯坦福大學