精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
未來人工智能:從AlphaGo到BetaGo



2016年,AlphaGo 4∶1擊敗人類圍棋冠軍,它是否會進化到陪伴人類下棋的BetaGo(陪Ta狗)?

| 作者:楊小康

1956年夏,麥卡錫(J. McCarthy)、明斯基(M. L. Minsky)等正式提出人工智能(artificial intelligence,AI)的概念,標志著人工智能學科誕生。在人工智能發(fā)展60周年的2016年,谷歌DeepMind AlphaGo戰(zhàn)勝李世石,樹立了人工智能新的里程碑

從AlphaGo看人工智能現(xiàn)狀

AlphaGo的人工智能原理

圍棋是最復雜的棋類游戲,人類高手下圍棋主要靠宏觀的直覺,加上局部的計算。AlphaGo憑借兩招出奇制勝:深度卷積網(wǎng)絡,模仿高手,尋找好的落點;深度強化學習,形成左右互搏,自我進化。

AlphaGo的第一招:模仿高手,學習高手的棋形。要模仿高手棋形,AlphaGo需要一個分類器來判斷棋形是否與高手的棋形相像。圍棋盤可以看成是19×19的圖像,雖然這個圖像很小,但約有250 150種變化。將這些變化分成高手棋形、非高手棋形,是一個挺難的機器學習問題,主要難在高手棋形的特征不好定義、不易提取。在人臉識別、車牌識別中,可以定義顏色、邊緣、關鍵點等特征,顯然圍棋棋形的特征不能使用同樣的方法。

AlphaGo使用了最新圖像分類器——深度卷積神經(jīng)網(wǎng)絡(deep convolutional neural network,DCNN),可以自動學習圖像中好的特征。不同于傳統(tǒng)的人工神經(jīng)網(wǎng)絡,該網(wǎng)絡的層數(shù)特別多,學習和分類的能力非常強。神經(jīng)網(wǎng)絡早在1943年就已提出,在1950年代末和1980年代曾興起過兩波研究熱潮。以前的人工神經(jīng)網(wǎng)絡層數(shù)很淺,只能解決一些簡單識別問題。2000年前后,欣頓(G. Hinton)等提出一套預訓練后向傳播的方法,解決了深度學習問題 [1]。DCNN是專門針對圖像識別的深度學習方法,對局部圖像進行卷積計算,效率很高。

深度學習能夠發(fā)揮巨大威力的前提是,必須要有大量的數(shù)據(jù)才能訓練深度結構。深度學習會涉及上百萬、甚至上億的參數(shù),如果數(shù)據(jù)不夠,很容易過擬合、性能降低。此外,進行這樣大規(guī)模的訓練,需要超強的計算能力。據(jù)說,AlphaGo存有15萬職業(yè)棋手、百萬業(yè)余高手的棋譜,訓練的時候會用到1202個中央處理單元(central processing unit,CPU)和176個圖形處理單元(graphics processing unit,GPU)。

AlphaGo的第二招:自我學習,自我進化。 模仿高手還不足以超越高手。為超越頂尖高手,AlphaGo用了一個自我學習的機制,就像金庸小說《射雕英雄傳》中的老頑童周伯通,左右互搏。人類高手通過自我復盤、擺棋譜來提高棋藝,但是人類高手復盤慢,一次復盤往往需要數(shù)小時甚至數(shù)天,其間棋手還需要吃飯、休息。而AlphaGo只要有電就可以一直左右“互搏”下去,其復盤速度極快,每分鐘就可以研究上萬盤棋,這樣的特性使得AlphaGo有可能在學習速度上超越人類高手

為了達到左右互搏的效果,AlphaGo采用了一個名為深度強化學習的技術。強化學習很符合智能體(agent)的學習規(guī)律,類似孩子在不斷跌倒中自我強化學會走路,猴子在胡蘿卜加大棒下自我強化學會表演。強化學習有兩個特點,一是智能體通過環(huán)境交互學習,二是訓練標注稀少,且通常有一定的延時。強化學習主要通過感知、行動、獎賞三個環(huán)節(jié)構成一個狀態(tài)轉(zhuǎn)移空間,學習過程可以用馬爾科夫決策過程來表示。

之前,強化學習的算法訓練只能解決很小規(guī)模的狀態(tài)轉(zhuǎn)移空間。圍棋是超大轉(zhuǎn)移空間的問題,同時也是個帶有超長延時訓練標注的問題。一開始的棋難以量化好壞,雙方要下多步后才能夠數(shù)出各自大概的目數(shù),從而判定輸贏。AlphaGo將圍棋這一特征視為深度強化學習問題,這個問題恰恰可以用深度的遞歸神經(jīng)網(wǎng)絡(diagonal recurrent neural network,DRNN)解決。DRNN的訓練和DCNN沒有太大區(qū)別。在左右互搏中,AlphaGo局部會采用一種名為蒙特卡洛搜索樹的隨機策略進行搜索,令整個系統(tǒng)能夠自我進化。

AlphaGo是最新深度學習方法、棋譜大數(shù)據(jù)以及最新超算體系的總和,并按現(xiàn)代科學技術的指數(shù)式發(fā)展繼續(xù)進化,沒有任何情緒波動。盡管在此次人機大戰(zhàn)中,人類個體告負,但AlphaGo卻是人類挑戰(zhàn)自我的里程碑!

未來人工智能感知的思考

未來人工智能的發(fā)展愿景

“類人服務、超人感知”愿景

在國內(nèi)外專家看來,未來人工智能有很多、很高遠的愿景。筆者看來,在人工智能的愿景中,至少應該包括“類人服務、超人感知”的愿景,即以類人的方式服務人類自身,以超人的方式感知外部世界。類人服務要求具備類人智能,具體而言,從人類的視角看,未來人工智能理應在感官和思維上像人;從機器的視角看,未來人工智能應該能理解人的行為和情緒。

傳統(tǒng)社會是一個二元空間,人類社會和物理空間形成互訓關系。而在信息社會,人、機、物三者相互融合,形成一個三元空間。未來,人工智能可進行人、機、物信息的整合,以超越人類的精度和時空尺度,感知三元空間的信息關聯(lián)性。

交叉學科的研究,特別是腦科學的研究 [4],將進一步夯實機器學習的理論基礎,三元空間的大數(shù)據(jù)和超級計算能力將進一步提高機器學習的工程能力。機器學習、大數(shù)據(jù)、超級計算機三者將共同實現(xiàn)未來人工智能超人感知、類人服務的愿景。

類人智能

類人智能是指將類人知覺和類腦思維整合。如果機器人具備逼近人類的交互能力,那么擊敗人類的AlphaGo將極有可能進化到陪伴人類下圍棋的BetaGo(俗稱為“陪Ta狗”)。

可以從知覺和思維兩個層面來理解類人智能。在知覺層面,隨著低成本、低功耗傳感器的發(fā)展,未來人工智能將通過視、聽、味、觸等方式感知和認知現(xiàn)實世界;在思維層面,未來人工智能則需要實現(xiàn)類腦計算。從長遠來看,研究類腦計算是通往強人工智能的有效方法 [2]。傳統(tǒng)的計算機相當于左腦,擅長邏輯思維,處理數(shù)字;神經(jīng)元芯片相當于右腦,擅長形象思維,處理圖像。目前,IBM等公司正著手將兩者整合,以期實現(xiàn)全腦的類腦計算。

三元空間協(xié)同感知

科學家正在研究人、機、物的三元空間協(xié)同感知。從側(cè)重于物理空間的感知層面看,突破人類肉眼感知的局限性是人工智能的傳統(tǒng)強項,可見光譜、紅外光譜、太赫茲、核磁共振等可實現(xiàn)全譜感知,相當于賦予了人類天眼或慧眼。

從人類社會層面看,群體智能新技術和社會計算新學科不斷涌現(xiàn)。通過利用不同網(wǎng)絡的大數(shù)據(jù),可以解決傳統(tǒng)社會學調(diào)查方法數(shù)據(jù)稀少的問題,能更好、更快地分析人群、組織和社會的行為。

立足于信息空間的層面,未來學家認為互聯(lián)網(wǎng)正在向著與人類大腦高度相似的方向進化,它將具備自己的視覺、聽覺、觸覺、運動神經(jīng)系統(tǒng),也會擁有自己的記憶神經(jīng)系統(tǒng)、中樞神經(jīng)系統(tǒng)、自主神經(jīng)系統(tǒng)。通過借鑒研究人類智力的方法,對互聯(lián)網(wǎng)大腦和因為互聯(lián)網(wǎng)而崛起的人工智能的智力問題進行深入研究,最終形成互聯(lián)網(wǎng)、人工智能和人類大腦的聯(lián)合智商

我國的人工智能戰(zhàn)略

人工智能已經(jīng)上升為我國的國家戰(zhàn)略,國家“科技創(chuàng)新2030 重大項目”將新增人工智能2.0。潘云鶴院士于2016 年12 月在中國工程院院刊Engineering(主刊)上,提出了人工智能2.0 的核心理念 [3]。2017年1 月,中國工程院院刊信息與電子工程學部分刊出版了“人工智能2.0”(artificial intelligence 2.0)專 [4],潘云鶴、李未、高文、鄭南寧、吳澄、李伯虎、陳純等院士以及多位專家學者對人工智能2.0 中所涉及的大數(shù)據(jù)智能、群體智能、跨媒體智能、混合增強智能和自主智能等內(nèi)容做了深刻闡述。

AI 有三個關鍵部分構成,機器學習是AI 的大腦,超級計算機是AI 的軀體,大數(shù)據(jù)是AI 成長的養(yǎng)分。據(jù)統(tǒng)計,全球43% 的機器學習相關論文出自中國學者之手。目前,我國已有眾多的AI 人才,形成了AI 垂直產(chǎn)業(yè)應用的人才基礎。近年來,我國的超級計算機發(fā)展迅猛,“神威·太湖之光”“天河二號” 超級計算機先后登頂TOP500 排行榜,這給人工智能的發(fā)展提供了堅實的硬件基礎。在大數(shù)據(jù)方面,相對歐美日等國,我國不僅擁有眾多的“冷數(shù)據(jù)”(包括人口、地理等靜態(tài)數(shù)據(jù)),而且擁有更多的“熱數(shù)據(jù)”(比如交易、診療等動態(tài)數(shù)據(jù)),大數(shù)據(jù)優(yōu)勢將有力推動我國的AI 研究形成特色,實現(xiàn)彎道超車。

未來,人工智能無疑會深刻改變?nèi)祟惿睢1M管堅信人類能夠與人工智能包容發(fā)展,但仍需要注意人工智能將引起的就業(yè)結構改變和其沖擊倫理關系所帶來的諸多挑戰(zhàn)


[ 本文相關工作得到國家重點研發(fā)計劃課題(2016YFB1001003)、國家重大科研儀器研制項目(NSFC61527804)等資助。]


楊小康:教授,認知計算和計算健康研究中心副主任,上海交通大學電子信息與電氣工程學院,上海 200240。

Yang Xiaokang:Professor, Vice Director of the Center for Cognitive Machines and Computational Health, School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240.



  1. Hinton G, LeCun Y, Bengio Y. Deep learning. Nature, 2015, 521(7553): 436 – 444.

  2. 蒲慕明, 徐波, 譚鐵牛. 腦科學與類腦研究概述. 中國科學院院刊, 2016: 31(7): 725-736.

  3. Pan Y H. Heading toward artificial intelligence 2.0. Engineering , 2016: 409 – 413.

  4. Pan Y H, Li W, Gao W, et al. Special issue on artificial intelligence 2.0. Frontiers of Information Technology & Electronic Engineering, 2017: 1-152.


關鍵詞人工智能  機器學習  深度學習  神經(jīng)網(wǎng)絡  


  本文刊載于《科學》雜志2017年第3期。

《科學》雜志于1915年1月在上海問世,

 早年由任鴻雋,趙元任,胡明復等學者編輯寫作,

是我國歷史最長的綜合性科學刊物。

雜志定位為高級科普期刊,致力于科學知識、理念和科學精神的傳播,科學與人文互動,歷史和前沿并舉,為提升我國全民科學素質(zhì)和建設創(chuàng)新型國家服務。雜志現(xiàn)任主編為中國科學院院長白春禮院士,主辦單位為上海科學技術出版社。


本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
人工智能與設計(1):人工智能的發(fā)展和定義
人工智能 李開復 王詠剛(讀書筆記)
【干貨】楊強:從機器學習到遷移學習 | GAITC 演講
人工智能是洪水猛獸還是人類的朋友?科學家終于給出了答案
未來人工智能:從AlphaGo到BeltaGo
AI已來,只是尚未流行!4個新視角看人工智能
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 淄博市| 大竹县| 临沭县| 陈巴尔虎旗| 剑阁县| 道真| 抚顺市| 长沙市| 邵东县| 上蔡县| 易门县| 山西省| 北川| 松潘县| 甘泉县| 合山市| 巨野县| 永顺县| 东丰县| 平乐县| 祁门县| 琼中| 汤原县| 来宾市| 镇宁| 松溪县| 盐山县| 辉县市| 仁寿县| 迁西县| 阳西县| 珠海市| 玛曲县| 阳谷县| 石渠县| 高陵县| 大英县| 富源县| 贺州市| 临汾市| 石泉县|