精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
哈工大聯(lián)合快手提出CogGPT:大模型也需要認(rèn)知迭代
機(jī)器之心專欄
機(jī)器之心編輯部

在認(rèn)知科學(xué)領(lǐng)域,人類通過持續(xù)學(xué)習(xí)改變認(rèn)知的過程被稱為認(rèn)知迭代(Cognitive Dynamics)。形象地說,認(rèn)知迭代就像是我們大腦的「軟件更新」過程,手機(jī)應(yīng)用通過不斷的更新來修復(fù) bug 和增加新功能,我們的大腦也通過不斷學(xué)習(xí)新知識、經(jīng)驗,來改善和優(yōu)化思考方式。

從我們判斷感冒吃什么藥效果好,到一代代數(shù)學(xué)家如何證明費馬大定理,無論是個人的心智發(fā)展還是人類文明的進(jìn)步,認(rèn)知迭代都扮演了不可或缺的角色。

如今,像 GPT-4 等大型語言模型(Large Language Models,LLMs)為通用人工智能(Artificial General Intelligence,AGI)的發(fā)展帶來希望的同時,也暴露出一個顯著的問題 —— 認(rèn)知固化。比如,對于經(jīng)典問題「宇宙的中心在哪里」,不同時代的人會基于當(dāng)時的信息給出不同的回答,但對于大模型,它們的參數(shù)在訓(xùn)練完成后就固定下來了,這時候的大模型就像是一個不能升級的老舊軟件,不能再學(xué)習(xí)新的信息。

雖然我們可以通過 in-context learning 的方式,通過為大模型設(shè)定特定的認(rèn)知背景來模擬相應(yīng)回答,但這種認(rèn)知迭代不是自驅(qū)的,也不能適應(yīng)的未知信息環(huán)境。這就引出了一個問題:怎么才能讓大模型和人類一樣,根據(jù)不斷變化的信息實現(xiàn)自驅(qū)的認(rèn)知迭代呢?

值得慶幸的是,這個問題已經(jīng)有了初步的答案,哈爾濱工業(yè)大學(xué)與快手科技的研究團(tuán)隊率先提出了大型語言模型的認(rèn)知迭代(the cognitive dynamics of LLMs)的概念。不僅如此,為了系統(tǒng)建模這個概念,他們給出了形式化的任務(wù)定義和相關(guān)基準(zhǔn) CogBench,并提出了 CogGPT,一個顯式建模大型語言模型的認(rèn)知迭代的 LLM-driven Agent。這就意味著,基于這個研究,以后的大型語言模型將不再是簡單的信息處理工具,而可以進(jìn)一步模擬人類的思考方式,實現(xiàn)終身學(xué)習(xí)。

  • 論文鏈接:https://arxiv.org/abs/2401.08438

  • 項目主頁:https://github.com/KwaiKEG/CogGPT

從論文中可以看到,這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究,對大模型進(jìn)行持續(xù)性的「心理測試」。具體來說,這個任務(wù)首先通過動態(tài)信息流建立了持續(xù)變化的信息環(huán)境,然后為大模型設(shè)定了初始人設(shè),通過定期要求它們填寫相同的認(rèn)知問卷,觀察這些模型在持續(xù)接收信息過程中,它們的認(rèn)知是如何發(fā)生變化的。

基于這個任務(wù),研究團(tuán)隊還提出了基準(zhǔn) CogBench,根據(jù)信息流的類型,可以分為基于長文章的 CogBench_a 和基于短視頻的 CogBench_v,同時設(shè)立了真實性(Authenticity)和合理性(Rationality)兩個關(guān)鍵評估指標(biāo),分別用于衡量模型與人類評分的一致性,以及評分理由的合理性,進(jìn)而豐富了大型語言模型的認(rèn)知迭代分析方法。

由于現(xiàn)有大模型無法實現(xiàn)參數(shù)的實時更新,研究團(tuán)隊設(shè)計了 CogGPT,一個具有迭代認(rèn)知機(jī)制的 LLM-driven agent。該機(jī)制包括一個記憶保持系統(tǒng)(Memory Retention System),用于蒸餾、存儲和檢索信息,以及一個協(xié)作優(yōu)化框架(Collaborative Refinement Framework),用于自驅(qū)地完成自我認(rèn)知迭代。

比如下面這個例子,CogGPT 扮演的是一個喜歡手工的人,她一開始對紋身并不了解,因此對「紋身是對美的追求」這一觀點保持代表中立的 3 分,在「看過」紋身會對身體造成傷害」和「自制香水紋身貼教程」的一系列短視頻后,她認(rèn)為紋身對身體有傷害,而且不應(yīng)該是美的唯一標(biāo)準(zhǔn),將自己對這一觀點的看法從中立的 3 分改變?yōu)椴煌獾?2 分,同時也對自制紋身貼產(chǎn)生了興趣,從而展現(xiàn)出了像人一樣的認(rèn)知迭代能力。

研究團(tuán)隊還對 CogGPT 和一些通用基線在 CogBench 上做了充分實驗。實驗結(jié)果表明,在 CogBench_a 和 CogBench_v 兩個基準(zhǔn)上,CogGPT 在真實性(Authenticity)和合理性(Rationality)這兩個核心評估指標(biāo)上的表現(xiàn)都遠(yuǎn)超現(xiàn)有方法,這也進(jìn)一步證明了 CogGPT 可以有效地模仿特定人設(shè)的認(rèn)知迭代過程。

如果智能系統(tǒng)可以像人類一樣持續(xù)學(xué)習(xí),將會給我們的生活帶來革命性的變化,到時候,私人助理將能夠提供更高效的定制化服務(wù),網(wǎng)上沖浪也可能不再是人類獨有的樂趣。盡管這項研究還處于起步階段,但它已經(jīng)向我們揭示了一個充滿可能性的未來。

值得注意的是,該團(tuán)隊不久前還開源了 KwaiAgents 系統(tǒng),提升了 7B/13B 大語言模型的 Agents 相關(guān)能力,自從發(fā)布以來已經(jīng)在 Github 上獲得了 800+star(https://github.com/KwaiKEG/KwaiAgents)。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
ChatGPT為什么這么強(qiáng)
AI:2023年6月9日北京智源大會演講分享之基礎(chǔ)模型前沿技術(shù)論壇—《工程化打造AI中的CPU》、《構(gòu)建一個AI系統(tǒng):在LLM上應(yīng)用帶有RLHF來推進(jìn)定制》、《多模態(tài)預(yù)訓(xùn)練的進(jìn)展回顧與展望》、《擴(kuò)展大
GPT-4 震撼發(fā)布,能讀圖,考高分,訓(xùn)練更高效
具身智能,是機(jī)器人的“冷飯熱炒”嗎?
【網(wǎng)絡(luò)首發(fā)】毛文濤:出版的當(dāng)下與未來
通過LLaMA-Factory可對源2.0基礎(chǔ)模型進(jìn)行微調(diào)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 香格里拉县| 泗洪县| 遂昌县| 田东县| 双牌县| 黄骅市| 安平县| 怀仁县| 双鸭山市| 普格县| 黄大仙区| 东海县| 枣阳市| 东丽区| 体育| 历史| 乐东| 墨脱县| 秀山| 休宁县| 奇台县| 淮安市| 岳阳市| 夏津县| 东莞市| 自治县| 响水县| 池州市| 松原市| 白玉县| 航空| 云梦县| 达拉特旗| 祁东县| 永丰县| 舞阳县| 申扎县| 扎鲁特旗| 陆良县| 四会市| 怀集县|