【導讀】近幾年,隨著人工智能的迅速發展,人工智能對各行各業也產生了深遠的影響。圍繞人工智能建立的系統已經對醫療、交通、刑事司法、金融風險管理和社會的許多其他領域產生了巨大的價值。然而,人工智能系統仍然具有很多問題,為了保證人工智能系統的有效性和公平性,需要我們對人工智能具有深刻的理解和控制能力。所以,今天專知小編給大家帶來的是Google可解釋人工智能白皮書《AI Explainability Whitepaper》,總共27頁pdf,主要介紹谷歌的AI平臺上的AI的可解釋性。
機器學習發展
人工智能的迅速發展導致現在我們現在所研究和使用的AI模型越來越復雜化,從手工規則和啟發法到線性模型和決策樹再到集成和深度模型,最后再到最近的元學習模型。
這些變化已經導致了多個維度上規范的變化:
可表達性(Expressiveness),使我們能夠在越來越多的領域(如預測、排名、自主駕駛、粒子物理、藥物發現等)擬合各種各樣的功能。
通用性(Versatility),解鎖數據模式(圖像,音頻,語音,文本,表格,時間序列等),并啟用聯合/多模式應用。
適應性(Adaptability ),通過遷移學習和多任務學習來適應小數據狀態。
效率(Efficiency ),通過自定義優化硬件,如gpu和TPUs,使研究人員可以更快地訓練更大更復雜更強大的模型。
然而,這些更復雜更強大的模型也變得越來越不透明,再加上這些模型基本上仍然是圍繞相關性和關聯建立的,這導致了以下幾個挑戰和問題:
虛假的關聯性(Spurious correlations),這往往會妨礙模型的泛化能力,導致模型在現實場景下效果很差。
模型的調試性和透明性的缺失(Loss of debuggability and transparency),這會導致模型難以調試和改進,同時這種透明度的缺乏阻礙了這些模型的應用,尤其是在受到監管的行業,如銀行和金融或醫療保健行業。
代理目標(Proxy objectives),這會導致模型在線下的效果與實際場景下的效果存在很大的出入。
模型的不可控(Loss of control)
不受歡迎的數據放大(Undesirable data amplification)
AI方法有:
簡單(基于規則且可解釋)
復雜的(不是可解釋的)
根據應用不同,我們有明確的倫理、法律和商業理由來確保我們能夠解釋人工智能算法和模型如何工作。不幸的是,普通人可以解釋的簡單人工智能方法缺乏優化人工智能決策的準確性。許多提供最佳精度的方法,如ANN(人工神經網絡),都是復雜的模型,其設計并不是為了便于解釋。
如圖所示,人工智能方法的準確性和可解釋性之間存在著一種相反的關系。兩者之間的負相關關系如下: 解釋性越大,準確性越低,反之亦然。
一些不太精確的模型仍然很受歡迎,因為它們具有可模擬性(因此人類可以重復它們)、完全可解釋的計算過程(算法透明性)以及模型的每個部分都有一個直觀的解釋(可分解性)。
隨著深度學習和強化學習的普及,對復雜神經網絡的解釋需求激增,推動了XAI工具的發展。最終目標: 實現負責任的、可追溯的、可理解的AIs。
可解釋人工智能 XAI
這些挑戰突出了對人工智能的可解釋性的需求,以使人們可控的發展人工智能。
圍繞人工智能建立的系統將影響并在許多情況下重新定義醫療干預、自動交通、刑事司法、金融風險管理和社會的許多其他領域。然而,考慮到上一節所強調的挑戰,這些人工智能系統的有效性和公平性將取決于我們理解、解釋和控制它們的能力。
自從幾十年前專家系統出現以來,XAI(可解釋的AI)領域已經復蘇。本文對一種嚴謹的科學解釋的機器學習,Doshi-Velez和Kim定義為“解釋性或呈現在人類可以理解的術語的能力“利用韋氏字典的定義“解釋”,它適應人類和智能代理之間的交互。
谷歌的人工智能可解釋白皮書(AI Explainability Whitepaper)是谷歌云的人工智能解釋產品的技術參考。它的目標用戶是負責設計和交付ML模型的模型開發人員和數據科學家。谷歌云的可解釋產品的目標是讓他們利用對AI解釋性來簡化模型開發,并解釋模型的行為。
白皮書的目錄:
特征歸因(Feature Attributions)
特征歸因的限制和使用注意事項(Attribution Limitations and Usage Considerations)
解釋模型元數據(Explanation Model Metadata)
使用What-if工具的可視化(Visualizations with the What-If Tool)
使用范例(Usage Examples)
參考鏈接:
https://cloud.google.com/ml-engine/docs/ai-explanations/overview