●如果說數據是新時代的石油,那么學習算法就是從中提取信息的煉油廠
●地球上的生命充滿了無數奧秘,但最具挑戰性的也許是智能的本質
●人類智能的進化經歷了數百萬年的時間,而人工智能在最近幾十年才發展起來
一
不久之前,人們還常說,計算機視覺的辨別能力尚不如一歲大的孩子。如今看來,這句話要改寫了。計算機不僅能和大多數成年人一樣識別圖片中的物體,在馬路上駕駛汽車的安全性還高過16 歲的青少年。
更神奇的是,如今的計算機不再是被動按照指令識別和駕駛,而是像自然界的生命由數百萬年前開始進化那樣,自主地從經驗中學習。
是數據的井噴促成了這一技術進步。如果說數據是新時代的石油,那么學習算法就是從中提取信息的煉油廠;信息積累成知識;知識深化成理解;理解演變為智慧。歡迎來到深度學習的新世界。
二
深度學習是機器學習的一個分支,它根植于數學、計算機科學和神經科學。
深度網絡從數據中學習,就像嬰兒了解周圍世界那樣,從睜開眼睛開始,慢慢獲得駕馭新環境所需的技能。深度學習的起源可以追溯到20 世紀50 年代人工智能的誕生。關于如何構建人工智能,當時存在兩種不同的觀點:一種觀點主張基于邏輯和計算機程序,曾主宰人工智能的研究和應用數十年;另一種觀點則主張直接從數據中學習,經歷了更長時間的摸索才逐漸成熟。
20 世紀,計算機技術還不夠成熟,而且按照現在的標準,數據存儲成本十分高昂,用邏輯程序來解決問題更加高效。熟練的程序員需要為每個不同的問題編寫不同的程序,問題越大,相應的程序也就越復雜。
如今,計算機能力日趨強大,數據資源也變得龐大且豐富,使用學習算法解決問題比以前更快、更準確,也更高效。此外,同樣的學習算法還能用來解決許多不同的難題,這遠比為每個問題編寫不同的程序更加節省人力。
三
本書的初稿是我在太平洋西北地區徒步旅行,并思索了近幾十年來人工智能領域的顯著變化之后寫出來的。
這本書講了一個一小群研究人員挑戰AI 研究建制派的故事,這些建制派在當時擁有更充足的資金支持,并被看作“唯一的主導力量”,他們大大低估了這些問題的難度,并且所依賴的對智能的直覺,后來被證明是有誤導性的。
地球上的生命充滿了無數奧秘,但最具挑戰性的也許是智能的本質。自然界充斥著各種形式的智能,從微小的細菌到復雜的人類智能,每種智能都適應了它在自然界中的位置。人工智能也將以多種形式出現,并在智能族譜中占據特殊的位置。
隨著基于深度神經網絡的機器智能日漸成熟,它可以為生物智能提供一個新的概念框架。
四
這是一本關于深度學習的過去、現在和未來的指南。不過本書并不是對該領域發展歷史的全面梳理,而是記錄了這一領域重要概念的進步及其背后研究群體的個人觀點。
人類的記憶并不可靠,對故事的每次復述都會導致記憶的偏差,這個過程叫作“重整記憶”。這本書中的故事延續了40 多年,盡管有些對我來說依然歷歷在目,就像昨天剛發生的一樣,但我很清楚,那些故事在我的記憶中不斷被復述時,有些細節已經悄悄地被改寫了。
本書有兩個相互交織的主題:人類智能是如何進化的,以及人工智能會如何演變。這兩種智能之間的巨大差異在于,人類智能的進化經歷了數百萬年的時間,而人工智能在最近幾十年才發展起來。盡管對于文化演變來說,這個速度仍然是快得出奇,但是過于謹小慎微可能并不是個正確的選擇。