相信我,任何人如果在最近聽到身邊的女孩兒對自己說出了這句話,他都應該是一個幸福且稱職的男人。大白不僅僅是呆萌的象征,同時也是年度暖男的有力競爭者之一,它體貼、踏實、善良、道德高尚、給人以溫暖和無微不至的呵護、甚至還熱愛小動物,深受女孩兒們的喜愛也是情理中事。不過這些“暖點”只屬于可以秀恩愛的群體們,我們對大白的關注并不在此。在我們眼中,大白的特質是絕對經典的。
因為它是一個機器人,而且它會學習和思考。
當一臺機器/機器人學會思考,并具備了以思考為基礎的事務處理能力之后,它的能力以及它與人的關系都將發(fā)生翻天覆地的變化,很多事情都會變得與眾不同。《超能陸戰(zhàn)隊》雖然是一部多少充斥了些許"好萊塢氣息"的商業(yè)大片,但它卻為我們展現(xiàn)了這樣一副與眾不同又十分有趣的未來圖景。大白與小宏以及其他人的關系、情感和微妙互動,皆源自其思考、學習以及對應的進行改變的能力,甚至大白的類似“人格”的特質也來源于此。而基于學習和思考能力的機器人,其本質實際上就是基于學習和思考能力的電腦。所以《超能陸戰(zhàn)隊》所描繪的,其實就是電腦具備學習和思考能力的未來圖景。
大白的類似“人格”特質來源于其思考、學習以及對應的進行改變的能力
那么電腦具備學習和思考能力的那一天離我們究竟還有多遠呢?在電腦學會學習和思考之后,我們的生活究竟會發(fā)生怎樣翻天覆地的變化呢?在第六期的ZOL科技預言壇當中,就讓我們一起來聊一聊電腦與思考這件事吧。
● 思考=AI?
讓電腦思考這件事兒聽起來確實挺帶感的,因為一想到思考,我們自然而然的就會往下擅自展開一系列諸如人工智能,AI或者天網之類的字眼,進而甚至聯(lián)想出人造生命甚至某些哲學高度的念頭。不過很遺憾,盡管本文剛剛開始,但我們還要先給諸位潑一盆冷水——所謂計算機思考,跟AI或者人工智能是存在著本質差異的。
對“AI”的界定長期以來一直是一個令人沮喪的話題,有人認為騙得過圖靈測試即可,有人認為只要不能生成真隨機數就不能算實現(xiàn)了人工智能,還有人認為應當以心智和情感為判斷標準,幾乎每次對它討論幾乎都會以激烈的爭吵而告終……我們并不是人工智能方面的權威,也不想誘發(fā)新的爭論,所以我們決定只是謹慎的給出自己的判斷標準——因果性與目的性,亦即如果計算機完成的工作受因果性限制,則不算人工智能級別,如果計算機完成工作帶有目的性,則屬于人工智能范疇。
簡單來說,當機器要執(zhí)行的所有任務和結果都處在人控范圍,電腦無法干預或自行產生新的目的,僅能通過訓練和學習來自行優(yōu)化任務執(zhí)行過程時,我們稱這種狀態(tài)為機器學習與思考。而當機器具備自己決定目的的能力,在機器人三原則約束(甚至是越過之)的前提下可以自己決定要執(zhí)行什么任務以及產生怎樣的結果時,我們稱這種狀態(tài)為人工智能,也就是AI。機器學習與思考可以作為最終達成AI的一種手段,同時也可以是AI的一部分,但它本身并不算是AI,起碼不屬于強人工智能范疇,要實現(xiàn)機器學習與思考也并不一定就需要AI的介入。
最簡單的例子就是與游戲中的機器人對戰(zhàn),他們每次的戰(zhàn)術都相同嗎?
按照這樣的判斷依據,我們要討論的話題其實并不是AI與人的關系。大白的表現(xiàn)也可以被視作是對機器思考過程所產生影響的描述,并不算AI,或者說起碼不算是強AI所應該具有的表現(xiàn)。雖然這么說并不嚴謹,但“踏實聽話”是大白重要的暖男屬性,如果制作方希望強調的是大白的強人工智能屬性,那它對小宏就不一定會那么言聽計從而且使命必達了,即便是對指令和目的的小幅修改也會讓人產生“心機”的錯覺,這肯定會削弱大白的萌點不是么?
之所以要先花力氣整理兩者的區(qū)別,是因為AI及人工智能背后會涉及到大量的哲學和倫理學問題。當機器具備了AI,它的能力將不再僅僅局限于學習和思考,當機器甚至可以自行決定是否學習而不是如何學習的時候,能夠“改變目的”的質變會給人與機器的關系以及我們接下來要進行的討論帶來諸多難以逾越的障礙。我們希望進行的討論僅限于機器具備學習和思考能力之后會給我們的生活帶來哪些便利以及變化,這種討論需要一個盡量單純的環(huán)境,沒錯,就像大白一樣單純、可靠、直達目的。
好了,理清這些問題之后,我們就可以開始討論單純的電腦學習和思考能力問題了——究竟什么才是電腦的學習和思考能力呢?
● 思考是一個學習的過程
無論對于電腦還是對于我們人類自己而言,學習和在特定的學習范圍內進行相關的思考其實都是一個相當受控的過程。學習無外乎知識與信息的收集、攝取以及整理,而與之相關的思考則包含了歸納、總結、規(guī)則抽離以及延伸等等過程。要讓電腦在受控的范圍內具備學習和思考的能力其實并不難,只需要設定好思考的規(guī)則和方式,然后不斷地為電腦提供可作參考和訓練樣本的信息即可。用最通俗的話講——給它筷子和吃的,告訴它怎么用筷子以及怎么吃,然后看著它吃就好了,它自然會在吃的過程中總結與吃有關的經驗然后越吃越順暢的。
有關于電腦或者計算機學習與思考的話題其實并不時髦,早在上世紀六十年代,以machine learning(機器學習)為代表的一系列概念就已經出現(xiàn)了。這些概念構成了多領域的交叉學科,涉及概率論、統(tǒng)計學、逼近論、線性及非線性過程分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構并用來改善自身的性能和執(zhí)行效率。它們的出現(xiàn)以及相關模型的建立賦予了計算機學習問題進而通過訓練獲得更好的解決問題的方法的能力,同時在理論上為日后的AI及人工智能發(fā)展鋪平了道路。
等等,不對吧,既然50多年前的計算機就已經開始進行學習和思考的過程了,我們?yōu)槭裁吹浇裉於歼€沒看到什么特別震撼的成果或者干脆見到AI呢?其實答案用想就能猜到了——machine learning的發(fā)展,在開始階段就遭遇了難以逾越的瓶頸。
以概念和需求而言,machine learning在當時無疑都是一個超越時代的產物。機器的學習過程本質上雖然簡單,只需要設定好規(guī)則,然后把足夠多的信息塞給機器,接著讓機器處理這些信息即可,但這個過程需要兩樣最基本的要素——樣本信息總量和運算能力總量,要命的是這兩樣東西在那個時代可以說都少的可憐。最初的machine learning模型能夠獲取的樣本完全靠設計者手工拾取和構筑,在剛剛擺脫紙帶輸入進入磁介質存儲的當時,這樣的樣本信息量充其量只能以KB為單位計。而處理能力則更不用說了——你能指望一臺處理能力還不及今天的智能手表的大家伙以多長的時間跨度來處理大量信息并完成學習呢?
有介于這些最簡單卻又是最基本要素的缺失,machine learning在經歷了誕生之初爆炸般的蓬勃發(fā)展之后便快速陷入了沉寂,雖然其后又經歷了多次復蘇和發(fā)展,但卻一直沒有擺脫樣本總量不足以及運算處理能力不足這兩個最根本的制約因素。盡管有筷子,但吃的東西不夠,吃的速度也快不起來,“餓著肚子”怎么可能有機會去學習和思考啊。在這種大環(huán)境下,machine learning的發(fā)展陷入了冷靜和沉寂,這種情況一直持續(xù)到了21世紀初才有所改觀。
隨著互聯(lián)網以及以GPU節(jié)點為主的大規(guī)模并行計算體系的高速發(fā)展,人類進入了真正意義上的“信息爆炸”時代,每時每刻都會有以TB甚至PB為單位計的數據在互聯(lián)網中飛馳,這些數據包羅萬象,從我們每天拍的無數張照片到各種音頻視頻流數據無所不有,而人類所能夠擁有的并行計算能力也因為GPU以及GPGPU的出現(xiàn)而提升到了前所未有的高度。machine learning發(fā)展所需要的兩樣最基本要素,在當前這個時代中已經不再是瓶頸和制約要素了,近乎無窮多而且每天都還在高速增長的各種信息可以為其提供任何想要的學習樣本,而大規(guī)模并行計算則為學習過程提供了運算能力的支撐,過去幾十年無法得到有效發(fā)展的尷尬好像一下子就消失不見了。
在等待和蟄伏的日子里,machine learning已經發(fā)展出了更具針對性和效率的分支——deep learning,這是一種基于網格化和分布式運算特正的,近似神經網絡模型的新式機器學習模式。它將原本的machine learning過程并行化并進一步加深了學習深度,通過復雜且龐大的并行非線性數據樣本所形成的網絡來完成training(訓練)的過程,進而實現(xiàn)多層結構的立體式學習和思考模型。deep learning需要的大規(guī)模非線性數據樣本廣泛存在于整個互聯(lián)網當中,而并行處理模式則與由GPU構成節(jié)點的新一代超算集群契合度非常高。在一系列有利要素的推動和促進下,計算機的學習和思考過程再一次進入了發(fā)展的快行道,大量應用和事例不斷涌現(xiàn)并且被直接轉換成了實際生產力。
deep learning將讓計算機具備抽離和優(yōu)化規(guī)則的思考能力
在剛剛結束的GTC以及WINHEC上,NVIDIA和微軟幾乎同時向我們展示了大量基于deep learning的超算集群科研成果、應用以及實際產品,BAT/google/微軟的積極參與和大力推動也在應用層面刺激了deep learning的轉化,以deep learning加速的快速圖形識別和高精度語音識別為基礎的一系列服務已經大量上線并開始為用戶提供對應的服務,我們所熟悉的百度圖片檢索就是這其中的代表。以當前的形勢來看,能夠維系深度學習及計算機思考領域發(fā)展的良性生態(tài)循環(huán)已經建立了。
照這么看,機器學習與思考的技術發(fā)展已經進入了快行道,大白的到來應該已經近在咫尺啦?
● 我們距離大白的懷抱還有多遠?
一如既往的,我們又要重復那個我們重復了很多很多遍的詞了——很遺憾……盡管機器學習在各方面有利條件的推動下進入了高速發(fā)展階段,但我們距離被大白擁入懷抱那一天還是有一段不短的距離的。
在Intel和NVIDIA所提供的硬件以及BAT/google/微軟的協(xié)力推動下,目前最強大的超級計算機集群已經能夠實現(xiàn)十幾至幾十層layer約束深度下的監(jiān)督/非監(jiān)督思考和自主算法優(yōu)化過程,科研人員只需保證樣本數據的輸入,集群就可以自行完成效率的優(yōu)化和結果準確率的提升,因此從某種意義上來講,我們似乎已經可以被視為實現(xiàn)“會思考的電腦”了。
不過必須要注意的是,這種類似思考的過程其實僅僅局限于特定的算法和處理過程,而且不同算法之間的表現(xiàn)相差懸殊,所以說當前的deep learning過程對象性還十分明顯,面向一般意義上的“通用性思考過程”還完全無法實現(xiàn),甚至連可以大規(guī)模部署試驗的成熟模型都還沒有出現(xiàn),想要將這個過程抽象成更的“思考行為”基本上也不現(xiàn)實。即便不考慮制造大白所需的工程學技術,單就大白的靈魂,也就是思考能力而言,我們所能夠實現(xiàn)的幼稚能力也與要求相去甚遠。到底遠到什么地步呢?遠到這次我們連模糊的大概抵達時間都無法給出了。從能夠解決常規(guī)開放性問題的“通用思考模型”從提出到實用化預計都要花上十余年的時間,而這樣的模型何時才會出現(xiàn)更是個未知數,這基本上斷絕了我們進行預測的基礎。所以相當遺憾,我們這次真的給不了關于大白什么時候能被造出來的“預言”了。
話說回來,大白也許是一個遙不可及的夢想,但現(xiàn)實中并非找不到“機器會思考之后能做些什么”的例子,比如我們剛剛就提到了,在剛剛結束的GTC以及WINHEC大會上,NVIDIA以及微軟均向我們展現(xiàn)了基于deep learning的超級計算機集群所能夠帶來的改變以及對未來的影響。這些變化涵蓋搜索、語音交互、服務供應、汽車、醫(yī)療甚至金融等等各種與我們生活息息相關的領域,所以可能您還沒有注意到,但我們確實已經生活在一個被會思考的電腦服務著的世界當中了。
比如說快速高精度圖片識別吧,踏青的時候如果您想知道某種很好看的花叫什么,現(xiàn)在只需要拍一張照片然后交給百度/google去識別就行了,搜索引擎背后基于deep learning的超算集群已經通過數億甚至數百億張圖片樣本的學習掌握了區(qū)分圖像細節(jié)的方法,并且能夠自動完成所有必須得細節(jié)判斷和檢索工作。我們只需要給一張照片,就能獲取過去必須通過語言詳盡描述之后才能夠獲取的信息和答案了。
超越siri的語音交互系統(tǒng)未來將會實現(xiàn)
直接用圖片完成信息搜尋的方式不僅會改變我們的搜索習慣,還會對包括醫(yī)學在內的諸多領域產生深遠影響,從組織切片照片當中快速識別病變細胞/癌細胞之類過去十分棘手的問題,在deep learning支撐的系統(tǒng)當中都將不再是難事。除此之外,基于deep learning的超算集群還在快速高精度語音識別、復雜背景音環(huán)境主音拾音以及連續(xù)動態(tài)視頻監(jiān)控等領域表現(xiàn)出了相當明顯的效率優(yōu)勢,無論是超越siri的語音交互系統(tǒng)還是更好的車載交互平臺,都將會在很近的未來得以實現(xiàn)。我們的生活,將會很快被會思考和學習的計算機徹底改變。
也許投入大白溫暖的懷抱在短時間內無法實現(xiàn),但我們覺得投身于會思考的機器所帶來的更便捷的生活當中也不失為一個不錯的選擇,不是么?