在認(rèn)知科學(xué)領(lǐng)域,人類通過持續(xù)學(xué)習(xí)改變認(rèn)知的過程被稱為認(rèn)知迭代(Cognitive Dynamics)。形象地說,認(rèn)知迭代就像是我們大腦的「軟件更新」過程,手機(jī)應(yīng)用通過不斷的更新來修復(fù) bug 和增加新功能,我們的大腦也通過不斷學(xué)習(xí)新知識、經(jīng)驗,來改善和優(yōu)化思考方式。
從我們判斷感冒吃什么藥效果好,到一代代數(shù)學(xué)家如何證明費馬大定理,無論是個人的心智發(fā)展還是人類文明的進(jìn)步,認(rèn)知迭代都扮演了不可或缺的角色。
如今,像 GPT-4 等大型語言模型(Large Language Models,LLMs)為通用人工智能(Artificial General Intelligence,AGI)的發(fā)展帶來希望的同時,也暴露出一個顯著的問題 —— 認(rèn)知固化。比如,對于經(jīng)典問題「宇宙的中心在哪里」,不同時代的人會基于當(dāng)時的信息給出不同的回答,但對于大模型,它們的參數(shù)在訓(xùn)練完成后就固定下來了,這時候的大模型就像是一個不能升級的老舊軟件,不能再學(xué)習(xí)新的信息。
雖然我們可以通過 in-context learning 的方式,通過為大模型設(shè)定特定的認(rèn)知背景來模擬相應(yīng)回答,但這種認(rèn)知迭代不是自驅(qū)的,也不能適應(yīng)的未知信息環(huán)境。這就引出了一個問題:怎么才能讓大模型和人類一樣,根據(jù)不斷變化的信息實現(xiàn)自驅(qū)的認(rèn)知迭代呢?
值得慶幸的是,這個問題已經(jīng)有了初步的答案,哈爾濱工業(yè)大學(xué)與快手科技的研究團(tuán)隊率先提出了大型語言模型的認(rèn)知迭代(the cognitive dynamics of LLMs)的概念。不僅如此,為了系統(tǒng)建模這個概念,他們給出了形式化的任務(wù)定義和相關(guān)基準(zhǔn) CogBench,并提出了 CogGPT,一個顯式建模大型語言模型的認(rèn)知迭代的 LLM-driven Agent。這就意味著,基于這個研究,以后的大型語言模型將不再是簡單的信息處理工具,而可以進(jìn)一步模擬人類的思考方式,實現(xiàn)終身學(xué)習(xí)。
論文鏈接:https://arxiv.org/abs/2401.08438
項目主頁:https://github.com/KwaiKEG/CogGPT
從論文中可以看到,這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究,對大模型進(jìn)行持續(xù)性的「心理測試」。具體來說,這個任務(wù)首先通過動態(tài)信息流建立了持續(xù)變化的信息環(huán)境,然后為大模型設(shè)定了初始人設(shè),通過定期要求它們填寫相同的認(rèn)知問卷,觀察這些模型在持續(xù)接收信息過程中,它們的認(rèn)知是如何發(fā)生變化的。
基于這個任務(wù),研究團(tuán)隊還提出了基準(zhǔn) CogBench,根據(jù)信息流的類型,可以分為基于長文章的 CogBench_a 和基于短視頻的 CogBench_v,同時設(shè)立了真實性(Authenticity)和合理性(Rationality)兩個關(guān)鍵評估指標(biāo),分別用于衡量模型與人類評分的一致性,以及評分理由的合理性,進(jìn)而豐富了大型語言模型的認(rèn)知迭代分析方法。
由于現(xiàn)有大模型無法實現(xiàn)參數(shù)的實時更新,研究團(tuán)隊設(shè)計了 CogGPT,一個具有迭代認(rèn)知機(jī)制的 LLM-driven agent。該機(jī)制包括一個記憶保持系統(tǒng)(Memory Retention System),用于蒸餾、存儲和檢索信息,以及一個協(xié)作優(yōu)化框架(Collaborative Refinement Framework),用于自驅(qū)地完成自我認(rèn)知迭代。
比如下面這個例子,CogGPT 扮演的是一個喜歡手工的人,她一開始對紋身并不了解,因此對「紋身是對美的追求」這一觀點保持代表中立的 3 分,在「看過」紋身會對身體造成傷害」和「自制香水紋身貼教程」的一系列短視頻后,她認(rèn)為紋身對身體有傷害,而且不應(yīng)該是美的唯一標(biāo)準(zhǔn),將自己對這一觀點的看法從中立的 3 分改變?yōu)椴煌獾?2 分,同時也對自制紋身貼產(chǎn)生了興趣,從而展現(xiàn)出了像人一樣的認(rèn)知迭代能力。
研究團(tuán)隊還對 CogGPT 和一些通用基線在 CogBench 上做了充分實驗。實驗結(jié)果表明,在 CogBench_a 和 CogBench_v 兩個基準(zhǔn)上,CogGPT 在真實性(Authenticity)和合理性(Rationality)這兩個核心評估指標(biāo)上的表現(xiàn)都遠(yuǎn)超現(xiàn)有方法,這也進(jìn)一步證明了 CogGPT 可以有效地模仿特定人設(shè)的認(rèn)知迭代過程。
如果智能系統(tǒng)可以像人類一樣持續(xù)學(xué)習(xí),將會給我們的生活帶來革命性的變化,到時候,私人助理將能夠提供更高效的定制化服務(wù),網(wǎng)上沖浪也可能不再是人類獨有的樂趣。盡管這項研究還處于起步階段,但它已經(jīng)向我們揭示了一個充滿可能性的未來。
值得注意的是,該團(tuán)隊不久前還開源了 KwaiAgents 系統(tǒng),提升了 7B/13B 大語言模型的 Agents 相關(guān)能力,自從發(fā)布以來已經(jīng)在 Github 上獲得了 800+star(https://github.com/KwaiKEG/KwaiAgents)。