
原標題:使用認知心理學(xué)解釋深度神經(jīng)網(wǎng)絡(luò):DeepMind新研究破解AI黑箱問題
選自DeepMind
機器之心編譯
近日,DeepMind在其官方博客上發(fā)表了一篇題為《Interpreting Deep Neural Networks using Cognitive Psychology》的文章,試圖通過認知心理學(xué)來解決深度神經(jīng)網(wǎng)絡(luò)中的「黑箱問題」,隨著神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于實際問題,這一問題正變得越發(fā)重要;并且在已被ICML收錄的DeepMind最新論文《Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study》中,其證明了認知心理學(xué)工具能夠揭示DNN背后隱藏的計算特性,同時也為人類學(xué)習(xí)語言提供了一種計算模型。機器之心對博客文章和論文摘要進行了編譯。原文鏈接見文中。
深度神經(jīng)網(wǎng)絡(luò)已經(jīng)學(xué)會去處理一些令人感到驚奇的任務(wù)——從圖像識別和推理物體,到在 Atari 游戲和圍棋上超越人類。由于這些任務(wù)和網(wǎng)絡(luò)結(jié)構(gòu)正在變得更復(fù)雜,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的解決方案也會變得更加難以理解。
這就是「黑箱」問題,而且它正在變得越發(fā)重要,因為神經(jīng)網(wǎng)絡(luò)正在被應(yīng)用于越來越多的實際應(yīng)用當中。
在 DeepMind,我們正在努力去擴展用于理解和解釋這些系統(tǒng)的工具包。在我們最新的論文中(最近被 ICML 收錄),提出了一種解決此種問題的新方法,即利用認知心理學(xué)的方法去理解深度神經(jīng)網(wǎng)絡(luò)。認知心理學(xué)通過判斷行為表現(xiàn)來推斷認知層面的機理,并且涵蓋大量的詳述這些機理的資料和實驗論證。由于我們的神經(jīng)網(wǎng)絡(luò)在一些特定任務(wù)中可以接近人類的水平,因此認知心理學(xué)方法與黑箱問題之間的關(guān)系也正在變得越來越緊密。
「黑箱」
為了說明這一點,我們的論文闡述了一個案例研究,我們使用設(shè)計好的實驗來說明人類認知對于深度神經(jīng)網(wǎng)絡(luò)如何解決一個圖像分類任務(wù)的理解。
我們的結(jié)果顯示,認知心理學(xué)家觀察到的人類行為也可以被這些深度網(wǎng)絡(luò)展示出來。而且,這些結(jié)果也揭露了有關(guān)網(wǎng)絡(luò)如何解決分類任務(wù)的見解,這些見解不僅有用而且令人驚奇。
在一次性詞語學(xué)習(xí)模型中衡量形狀偏好
在我們的案例研究中,我們考慮了兒童是怎樣識別和標注物體的——這是發(fā)展認知心理學(xué)中的一個豐富的研究領(lǐng)域。兒童具備根據(jù)單一例子對詞語含義進行猜測的能力——叫做「一次性詞語學(xué)習(xí)(One-shot Word Learning models)」——我們很容易地會認為這是一個簡單的過程。然而,一個來自心理學(xué)家 Willard Van Orman Quine 的經(jīng)典思維實驗說明了這一過程的的復(fù)雜性:
一位實地語言學(xué)家走訪了語言完全不同于我們的地區(qū)。這位語言學(xué)家嘗試去和當?shù)氐耐林鴮W(xué)習(xí)一些詞匯,恰巧此時一只兔子匆匆路過。這位土著說了一聲「gavagai」,而這位在他身邊的語言學(xué)家也推斷出了這個新詞匯的含義。實際上這位語言學(xué)家面對的是大量的合理推斷,這個「gavagai」可能泛指兔子,動物,白色的東西,也可能就是指這只特定的兔子或者「兔子中獨立的一個種類」。其實他是可能做出無限個合理推斷的。而人們又是怎樣去選擇其中的正確選項呢?
「Gavagai」
五十年后,當我們面對關(guān)于可以做一次性學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)的相同問題時。去考慮匹配網(wǎng)絡(luò),這是 DeepMind 研發(fā)的一種神經(jīng)網(wǎng)絡(luò)。這一模型使用了有關(guān)注意力和記憶力(attention and memory)研究的最新成果,可以在僅使用一種類別中的單一示例的情況下,把 ImageNet 圖像進行分類,這種方法的性能表現(xiàn)絕對是一流的。然而,我們并不知道為了把這些圖片進行分類網(wǎng)絡(luò)都做了哪些假設(shè)。
為了使這一問題更加透明,我們借鑒了發(fā)展心理學(xué)家(developmental psychologists)(1)的工作,他已經(jīng)發(fā)現(xiàn)了關(guān)于兒童通過利用歸納偏移來消除很多不正確推斷,從而找到正確推斷的證據(jù)。這些偏好包括:
全物體偏好,兒童通過參考完整物體(而非某部位)設(shè)想某個詞匯(消除 Quine 對未觀察到的兔子部分的憂慮)。
分類學(xué)偏好,兒童通過參考基礎(chǔ)類別分類來設(shè)想某個詞匯(緩解 Quine 把所有的動物都選擇為的兔子的恐懼)
形狀偏好,兒童基于物體形狀設(shè)想一個詞匯的含義,而非顏色或紋理(解除 Quine 把所有的白物體都認定為「兔子」的焦慮)。
我們選擇測量神經(jīng)網(wǎng)絡(luò)的形狀偏好,因為在人類偏好上有大量的研究工作。
認知心理學(xué)刺激物樣本,我們用它來測量深度網(wǎng)絡(luò)中的形狀偏好。這些圖像由印第安納大學(xué)認知發(fā)展實驗室的 Linda Smith 提供。
我們采用的經(jīng)典形狀偏好實驗如下:我們給深度神經(jīng)網(wǎng)絡(luò)提供了三種物體圖像,即探測物體、形狀匹配物體(與探測目標形狀相同,顏色不同)和顏色匹配物體(與探測物體形狀不同,顏色相同)。然后我們度量了偏好,即將探測圖像的標簽分配為形狀匹配圖像的標簽而不是顏色匹配圖像標簽所出現(xiàn)的比率。
我們使用的物體圖片是印第安納大學(xué)認知發(fā)展實驗室提供的。
帶有匹配網(wǎng)絡(luò)(atching Networks)的認知心理學(xué)實驗示意圖。匹配網(wǎng)絡(luò)將左側(cè)的探測物體匹配到「A」圖或「B」圖。匹配網(wǎng)絡(luò)的輸出取決于其形狀偏好的強度。
我們嘗試使用深度神經(jīng)網(wǎng)絡(luò)(即匹配網(wǎng)絡(luò)和 Inception 基準模型)進行這次實驗,實驗發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)像人類一樣更傾向于物體形體而不是顏色或紋理,所以它們有著「形狀偏好」。
這表明匹配網(wǎng)絡(luò)和 Inception 分類器為形狀使用一個歸納性的偏好(inductive bias)而消除不正確的假設(shè),因此我們更加清楚了神經(jīng)網(wǎng)絡(luò)到底是如何解決一次性詞語學(xué)習(xí)問題。
觀察形狀偏好并不是我們唯一有意思的發(fā)現(xiàn):
我們觀察到形狀偏移是在早期神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中逐步出現(xiàn)的。這也許會聯(lián)想到讓人類的形狀偏好到底是如何出現(xiàn)的:心理學(xué)家發(fā)現(xiàn),較小兒童的形狀偏好要比青少年小,并且成年人的形狀偏好相對其他階段是最大的。
我們發(fā)現(xiàn)使用不同的隨機種子進行初始化和訓(xùn)練會得到不同程度偏移的神經(jīng)網(wǎng)絡(luò)。這就說明在深度學(xué)習(xí)系統(tǒng)進行實驗時,我們必須使用大量已訓(xùn)練的模型來得出有效的結(jié)論,這正像心理學(xué)家不會根據(jù)單個主題得出一個結(jié)論一樣。
我們發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)即使在形狀偏好十分不同時,它都可以實現(xiàn)相同的一次性學(xué)習(xí)性能。因此這證明了不同的神經(jīng)網(wǎng)絡(luò)能發(fā)現(xiàn)復(fù)雜問題多種等價高效的解決方案。
這一在標準神經(jīng)網(wǎng)絡(luò)架構(gòu)中未被認識到的偏好發(fā)現(xiàn)表明,使用人工認知心理學(xué)解釋神經(jīng)網(wǎng)絡(luò)解決方案的潛力巨大。在其他領(lǐng)域中,來自 episodic 記憶文獻的洞見可用于理解 episodic 記憶架構(gòu),來自語義認知文獻的技術(shù)可被用于理解形成概念的模型。這些以及其他領(lǐng)域豐富的心理學(xué)文獻,賦予了我們一個極為強大的工具來解決神經(jīng)網(wǎng)絡(luò)黑箱問題,更深入地理解神經(jīng)網(wǎng)絡(luò)的行為。
論文: Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study
論文地址:https://arxiv.org/abs/1706.08606
摘要:深度神經(jīng)網(wǎng)絡(luò)(DNN)在多種復(fù)雜任務(wù)中具有優(yōu)勢,可以達到超出人類能力的表現(xiàn)。雖然過去的大量研究都旨在增進對于模型本身的理解,但卻少有研究將其用于人類認知心理學(xué)中問題解釋、理論和試驗方法。為了探索這些工具的潛在價值,我們在發(fā)展心理學(xué)中選擇了一個完善的分析方法來解釋人類兒童如何學(xué)習(xí)事物的語言標簽,同時將這種分析應(yīng)用到 DNN 中。
通過使用受到原始認知心理學(xué)啟發(fā)的數(shù)據(jù)集進行實驗,我們找到了在 ImageNet 上迄今為止表現(xiàn)最佳的一次性學(xué)習(xí)模型,它展示了與人類相似的偏見:偏向于以形狀而不是顏色對物體進行分類。這種對形狀偏好的量級不僅出現(xiàn)在整體識別中,也出現(xiàn)在子模型里,甚至?xí)谟?xùn)練時在子模型中產(chǎn)生波動。這些結(jié)果證明了認知心理學(xué)工具能夠揭示 DNN 背后隱藏的計算特性,它同時也為人類學(xué)習(xí)語言提供了一種計算模型。
圖 1:認知心理學(xué)數(shù)據(jù)集中的示例圖像。該數(shù)據(jù)集由認知心理學(xué)家 Linda Smith 提供,其設(shè)計初衷是控制物體大小和背景。
圖 2:帶有不同隨機初始化種子的模型及其形狀偏好,這些模型在訓(xùn)練計算中使用的是 CogPsyc 數(shù)據(jù)集。
圖 4:該散點圖展示匹配網(wǎng)絡(luò)(Matching Network/MN)形狀偏好和 Inception 形狀偏好的線性相關(guān)性。
圖 5:帶有不同隨機初始化種子的模型及其形狀偏好,這些模型在訓(xùn)練計算中使用的是真實世界(real-world)數(shù)據(jù)集。
最后,在本研究工作中,我們展示了如何利用認知心理學(xué)技術(shù)來幫助我們更好地了解 DNN。作為一個案例研究,我們使用了兩種十分強大但又不甚了解的深度神經(jīng)網(wǎng)絡(luò)(Inception 和匹配網(wǎng)絡(luò))測度量形狀偏好。我們的分析在一定程度上揭示了這些模型的未知屬性。更廣泛地說,我們的研究工作為使用認知心理學(xué)技術(shù)探索深度神經(jīng)網(wǎng)絡(luò)提供了新的途徑。
參考文獻
Markman, Ellen M. Constraints children place on word meanings. Cognitive Science, 14(1):57–77, 1990.
Markman, Ellen M and Hutchinson, Jean E. Children’s sensitivity to constraints on word meaning: Taxonomic versus thematic relations.Cognitive Psychology, 16(1):1–27, 1984.
Markman, Ellen M and Wachtel, Gwyn F. Children’s use of mutual exclusivity to constrain the meanings of words. Cognitive Psychology, 20(2):121–157, 1988.
Landau, Barbara, Smith, Linda B, and Jones, Susan S. The importance of shape in early lexical learning. Cognitive Development, 3(3):299–321, 1988.
原文鏈接:https://deepmind.com/blog/cognitive-psychology/
本文為機器之心編譯,轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)。
------------------------------------------------
加入機器之心(全職記者/實習(xí)生):hr@jiqizhixin.com
投稿或?qū)で髨蟮溃篹ditor@jiqizhixin.com
廣告&商務(wù)合作:bd@jiqizhixin.com