來源:專知
摘要:本文介紹Arxiv上的《Explanation in Human-AI Systems》,一篇關于可解釋機器學習的綜述,介紹了可解釋機器學習的多學科觀點、歷史研究、模型、關鍵點等。
可解釋AI是現在正火熱的科研和工程問題。Arxiv上一篇《Explanation in Human-AI Systems: A Literature Meta-Review Synopsis of Key Ideas and Publications and Bibliography for Explainable AI》介紹了可解釋機器學習的多學科觀點、歷史研究、模型、關鍵點等,PDF大概內容組織如下:
目的、范圍和本文組織結構
該主題的重要性
本文的組織結構
多學科觀點
哲學
邏輯學觀點
機械學觀點
統計學觀點
相對主義者/實用主義者的觀點
心理學
可解釋性與心理學
社會心理學
語言心理學
團隊科學
其他人類因素、認知系統工程和決策輔助
考慮多學科觀點的總結
從研究到相關主題的發現
以前的綜述
公平、透明、安全、可靠、道德
信任
因果推理和外展推理
事件和概念的因果和機械推理
類比
理解解釋
理解的失敗和局限性
復雜系統的理解
反事實和對比推理
個體差異與動機
學習和概念形成
心智模型
前瞻推理與規劃
對話式解釋
自解釋
遷移和泛化
關鍵論文和它們的貢獻
AI系統的可解釋性:歷史研究的觀點
心理理論、假設和模型
分類學
解釋性與基礎認知過程的關系
好解釋的特性
可解釋推理的局限和缺點
解釋性推理的個體差異
解釋的概念模型
心理模型的總結
可解釋性AI關鍵概念的概要
解釋的價值
形式和內容
可解釋性
解釋和證明
候選解釋
心智模型
預期和前瞻
全局和本地解釋
上下文依賴
對比推理
一致
好的和滿意的解釋
糾正的解釋
信任和可靠
自解釋
主動探索作為連續過程
解釋作為協作和共同適應過程
測量和評價
可解釋性AI系統的評價:人類參與的性能評價
部分PDF內容:
參考鏈接:
https://arxiv.org/pdf/1806.00069.pdf
未來智能實驗室是人工智能學家與科學院相關機構聯合成立的人工智能,互聯網和腦科學交叉研究機構。
未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)云腦研究計劃,構建互聯網(城市)云腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。