精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
AI革新之路:14篇AI Agents論文,探討人工智能未來


近期,關于通用人工智能(AGI)的技術發展引發了廣泛的關注和熱議。在這個激動人心的時期,大模型一直扮演著重要的角色,幾乎成為了舞臺中央的主角。

然而,最近OpenAI的兩位重要技術人物,Andrej Karpathy和Lilian Weng,向外界傳遞出一個令人振奮的信號:基于LLM的AI Agents將成為AGI領域未來的重要發展方向。
Andrej Karpathy的表態引起了廣泛的關注。他表示,相較于大模型訓練,OpenAI內部目前更加關注Agent領域。這一表態暗示著OpenAI對于開發具備推理和決策能力的AI系統的研究和發展更感興趣。
而Lilian Weng在這一領域的觀點更加具體,她認為Agent的構成要素包括LLM(Language Model),記憶(Memory),規劃技能(Planning skills)以及工具使用能力(Tool use)。
這一定義揭示了構建AI Agents的關鍵要素,也為我們提供了明確的發展方向。

一、 HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace

本文介紹了一項新的系統,名為HuggingGPT,該系統利用大型語言模型(LLMs)來管理各種人工智能模型,以解決復雜的跨模態和領域的人工智能任務。作者認為,LLMs在語言理解、生成、交互和推理方面展現了卓越的能力,可以充當控制器,管理現有的人工智能模型來解決復雜的人工智能任務。文章介紹了HuggingGPT的工作流程:當接收到用戶請求時,使用ChatGPT進行任務規劃,根據HuggingFace中提供的功能描述選擇模型,使用選定的人工智能模型執行每個子任務,并根據執行結果進行總結。通過利用ChatGPT的強大語言能力和HuggingFace中豐富的人工智能模型,HuggingGPT能夠處理各種不同模態和領域的復雜任務,并在語言、視覺、語音和其他具有挑戰性的任務中取得了令人矚目的成績,為人工智能的通用智能(AGI)提供了新的思路。

論文鏈接:
https://www.aminer.cn/pub/64264f7b90e50fcafd68e162
二、Generative Agents: Interactive  Simulacra of Human Behavior
這篇論文介紹了一種新的計算機模擬軟件,稱為“生成代理”,可以模擬逼真的人類行為。這些生成代理可以像真實人一樣進行日常生活行為,例如起床做早餐、去上班、形成意見、互相注意到并開始對話等。為了實現生成代理,論文提出了一種架構,該架構基于大型語言模型,可以存儲生成代理的自然語言體驗記錄,并將這些記憶隨著時間的推移合成為更高層次的反思,然后動態檢索這些反思以規劃行為。論文還展示了如何將這些生成代理實例化,用于填充一個類似于《模擬城市》的互動沙箱環境,該環境可與二十五個生成代理進行自然語言交互。在評估中,這些生成代理產生了可信的個體和群體行為,例如從一個用戶指定的觀念開始,即一個代理想舉辦情人節派對,代理們在接下來的兩天內自主傳播派對的邀請,結交新朋友,互相邀請參加派對,并協調在正確的時間一起參加派對。論文通過消融證明了生成代理架構的各個組成部分——觀察、計劃和反思——對于代理行為的可信度都至關重要。通過將大型語言模型與計算交互代理相結合,該工作為實現逼真的人類行為模擬提供了架構和交互模式。
論文鏈接:
https://www.aminer.cn/pub/64337e3190e50fcafd76ef32/
三、Introspective Tips: Large Language Model for In-Context Decision Making

這篇論文討論了使用大型語言模型 (LLM) 進行上下文決策制定的方法。近年來,大型語言模型 (LLM) 已經在自然語言處理領域產生了重大影響,在多種任務中取得了出色的結果。在這項研究中,作者使用“內省提示”來幫助 LLM 自我優化其決策制定。通過內省地檢查軌跡,LLM 生成簡潔且有價值的提示,來改進其政策。這種方法在很少或沒有示例的情況下提高了代理的表現,考慮了三個重要場景:從代理過去的經驗中學習、集成專家演示,并泛化到不同的游戲。重要的是,我們實現這些改進并不需要微調 LLM 參數,而是調整提示以概括上述三個場景的洞察力。我們的框架不僅支持,而且強調使用 LLM 進行上下文決策制定的優勢。通過超過 100 個 TextWorld 游戲的實驗,我們展示了我們的方法的優勢。
論文鏈接:
https://www.aminer.cn/pub/646aecaad68f896efa05a6f6
四、Interactive Natural Language Processing
這篇論文綜述了交互自然語言處理 (iNLP) 的概念及其在不同領域的應用。iNLP 是一種新興的自然語言處理 (NLP) 范式,旨在解決現有框架中存在的限制,同時與人工智能的最終目標保持一致。在這個框架中,語言模型被視為能夠觀察、行動和從外部實體獲得反饋的代理。具體而言,語言模型可以與人類進行交互,更好地理解和滿足用戶需求,個性化回答,符合人類價值觀,并改善用戶體驗;與知識庫進行交互,增強語言表示,提高響應的上下文相關性,并動態利用外部信息生成更準確、明智的回答;與模型和工具進行交互,有效地分解和處理復雜的任務,利用特定領域的專業知識解決特定子任務,并促進社交行為模擬;與環境進行交互,學習著地表示語言,有效處理推理、計劃和決策等任務。該論文提出了 iNLP 的統一定義和框架,并對 iNLP 進行分類,包括交互對象、交互界面和交互方法等各個組件。此外,論文還探討了該領域的評估方法、應用、倫理和安全問題,并討論了未來的研究方向。該綜述論文為對 iNLP 感興趣的研究人員提供了一個全面的指南,并為該領域的當前景觀和未來趨勢提供了一個廣闊的視角。
論文鏈接:
https://www.aminer.cn/pub/646c3addd68f896efa5d195b/
五、Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager是 Minecraft 中第一個由 LLM 驅動的嵌入式終身學習代理,可以在沒有人類干預的情況下不斷探索世界、獲取各種技能并做出新發現。Voyager由三個關鍵部分組成:
1)最大化探索的自動課程;
2)用于存儲和檢索復雜行為的不斷增長的可執行代碼技能庫;
3)結合環境反饋、執行錯誤和自我驗證以改進程序的全新迭代提示機制。
Voyager 通過黑盒查詢與 GPT-4 進行交互,從而避免了模型參數微調的需要。Voyager 所開發的技能具有時間擴展性、可解釋性和組合性,能迅速增強代理的能力,減少災難性遺忘。從經驗上看,Voyager表現出很強的在情境中終身學習的能力,在玩 Minecraft 時表現出非凡的熟練程度。與之前的 SOTA 相比,它獲得的獨特物品數量增加了 3.3 倍,旅行距離延長了 2.3 倍,解鎖關鍵技術樹里程碑的速度提高了 15.3 倍。Voyager 能夠在新的 Minecraft 世界中利用學習到的技能庫從頭開始解決新任務,而其他技術則很難做到這一點。
論文鏈接:
https://www.aminer.cn/pub/64702deed68f896efa5202ea/
六、Decision-Oriented Dialogue for Human-AI Collaboration
這篇論文描述了一種名為“決策導向對話”的人機合作方法,用于幫助人類做出復雜決策。在該方法中,人工智能助手必須與一個或多個人類通過自然語言進行合作,以幫助用戶做出最佳決策。論文涵蓋了三個日常決策場景:選擇將審稿人分配給會議論文、在城市中進行多步驟旅行計劃以及與朋友協商旅行計劃。在這些場景中,人工智能助手和用戶擁有不同的能力和需求,必須相互結合以做出最佳決策。為了每個任務,論文建立了一個對話環境,使代理人根據他們最終決策的質量獲得獎勵。使用這些環境,論文收集了人類與人類之間的對話,人類扮演助手的角色。為了比較當前人工智能助手在這些場景中的溝通能力,論文還提供了基于大型語言模型的自我對弈的基礎線。最后,論文強調了決策導向對話中面臨的許多挑戰,包括高效溝通、推理和優化,并釋放了我們的環境作為未來建模工作的測試平臺。
論文鏈接:
https://www.aminer.cn/pub/647817b2d68f896efa85106e/
七、Minimum Levels of Interpretability for Artificial Moral Agents
這篇論文的主題是人工道德代理(AMA)的最低可解釋性水平。隨著人工智能(AI)模型的不斷擴展和應用,如何理解和信任這些模型的內部推理機制變得尤為重要。對于參與道德決策的模型,即人工道德代理,可解釋性提供了一種途徑。本文概述了這個迅速發展的 AI 可解釋性子領域,并引入了“最低可解釋性水平”(MLI)的概念,為各種類型的代理在現實世界的安全部署提供了建議。
論文鏈接:
https://www.aminer.cn/pub/64a39885d68f896efa31e1ca/
八、Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration
這篇論文主要探討如何在大型語言模型(LLM)中實現認知協同作用,以提高其解決復雜任務的能力。盡管 LLM 作為通用任務解決代理表現出一定的性能,但在需要深入領域知識和復雜推理的任務中,它們仍然存在挑戰。作者提出了一種名為 Solo Performance Prompting(SPP)的方法,通過與多個角色進行多輪自我協作,將單個 LLM 轉變為認知協同者。這種認知協同者是指一個智能代理,它與多個智能體合作,結合各自的優勢和知識,以提高在復雜任務中的問題解決和整體性能。通過根據任務輸入動態識別和模擬不同的角色,SPP 釋放了 LLM 中認知協同的潛力。作者發現,為 LLM 分配多個、細粒度的角色比使用單個或固定數量的角色能更好地解決問題。SPP 在三個具有挑戰性的任務上進行評估:知識密集型的 Trivia 創意寫作,推理密集型的 Codenames 協作和 Logic Grid 謎題。與僅提高 LLM 推理能力的先前工作(如 Chain-of-Thought)不同,SPP 有效地激發了內部知識獲取能力,減少了虛構現象,并保持了強大的推理能力。相關代碼、數據和提示可訪問:https://github.com/MikeWangWZHL/Solo-Performance-Prompting.git。
論文鏈接:
https://www.aminer.cn/pub/64ae259c3fda6d7f0658f403/
九、Communicative Agents for Software Development
這篇論文介紹了一種用于軟件開發的通信代理范式,該范式利用大型語言模型在整個軟件開發過程中進行自然語言溝通,簡化和統一關鍵過程,從而消除了每個階段需要專門模型的需要。該范式的核心是 ChatDev,一個由聊天驅動的軟件 development 公司,類似于傳統的瀑布模型,將開發過程分為四個明顯的時間階段:設計、編碼、測試和文檔。每個階段都涉及一組代理,如程序員、代碼審查人員和測試工程師,促進協作對話并提供無縫工作流程。聊天鏈充當促進者,將每個階段分解為原子子任務,從而具有雙重角色,允許提出和驗證解決方案,以高效解決特定子任務。instrumental analysis of ChatDev 表明,它具有出色的軟件生成能力,能夠在不到七分鐘內完成整個軟件開發過程,成本不到 1 美元。它不僅識別和緩解潛在漏洞,而且還糾正潛在幻覺,同時保持出色的效率和成本效益。ChatDev 的潛力揭示了將 LLMs 集成到軟件開發中的新可能性。
論文鏈接:
https://www.aminer.cn/pub/64b60eaa3fda6d7f06eaea2a/
十、AgentBench: Evaluating LLMs as Agents
這篇論文介紹了一個名為 AgentBench 的多維度演化基準,用于評估大型語言模型 (LLM) 作為智能體的能力。隨著 LLM 變得越來越智能和自主,在傳統自然語言處理任務之外的現實世界實用任務中發揮作用,因此評估 LLM 在交互環境中的挑戰性任務上作為智能體的能力變得緊迫。論文測試了 25 個 LLM(包括 API 和開源模型),發現頂級商業 LLM 在復雜環境中作為智能體的表現很強,但與開源競爭者之間存在顯著的性能差距。該基準是正在進行的一個更廣泛覆蓋和更深入考慮系統評估 LLM 的項目的一部分。相關數據集、環境和 AgentBench 的集成評估軟件包已發布在 https://github.com/THUDM/AgentBench 上。
論文鏈接:
https://www.aminer.cn/pub/64d1bdf93fda6d7f06ec4af3
十一、Forming Effective Human-AI Teams: Building Machine Learning Models that Complement the Capabilities of Multiple Experts
論文涉及的問題是在與人類專家共同工作的應用領域中,如何構建機器學習模型以補充多個專家的能力。之前的研究主要集中在只有一個不同專家的場景上,但實際情況中可能有多個能力不同的專家可供選擇。為了解決這個問題,該論文提出了一種訓練分類模型的方法,使其能夠補充多個人類專家的能力。通過與分配系統一起進行聯合訓練,分類器學習準確預測那些對人類專家來說很難預測的實例,而分配系統學習將每個實例分配給最合適的團隊成員,可以是分類器或某個人類專家。該方法在多個實驗中使用“合成”專家的公共數據集和由多個放射科醫生注釋的真實醫療數據集進行評估。該方法優于之前的研究,比最好的人類專家或分類器更準確。此外,該方法適應能力強,可以靈活地適應不同規模和不同水平的專家多樣性的團隊。

論文鏈接:
https://www.aminer.cn/pub/634d809c90e50fcafd4e75bc

十二、Human-AI Symbiosis: A Survey of Current Approaches


這篇論文旨在對人工智能與人類協同合作的不同方法進行全面概述。文章突出了人類與 AI 團隊合作的各個方面,如互補流程、任務范圍、模型表示、知識層次和團隊目標,并根據這些維度對近年來的工作進行分類。作者希望這份調查能為人工智能與人類團隊之間的研究提供更清晰的聯系,并給該領域的新研究人員提供指導。
論文鏈接:
https://www.aminer.cn/pub/6054791591e0116f82f2d5f4/
十三、MindCraft - Theory of Mind Modeling for Situated Dialogue in Collaborative Tasks
這篇論文主要研究了如何讓自主代理能夠在人類世界中以人類的方式進行合作。其中,心智理論在人類合作和交流中起著重要的作用。為了實現心智理論建模在情境交互中的應用,作者引入了一個由人類主體在 Minecraft 的 3D 虛擬方塊世界中執行的協作任務的細粒度數據集。這個數據集提供了在交互過程中合作伙伴對世界和對方的信念信息,為研究人類在情境語言交流中的協作行為提供了豐富的機會。作為實現我們目標的第一步,即開發能夠推斷協作伙伴情境信念狀態的具身 AI 代理,我們構建并展示了計算模型對于幾種心智理論任務的結果。

論文鏈接:
https://www.aminer.cn/pub/614164545244ab9dcb9dd85a/
十四、It Takes Two to Tango: Towards Theory of AI's Mind
這篇論文討論了人工智能(AI)與人類協作的必要性,并提出了一種名為“AI 心智理論(ToAIM)”的方法。論文認為,要讓人機協作團隊有效運作,不僅要讓 AI 更理解人類,還要讓人類更好地理解 AI。作者在視覺問答(VQA)領域中實例化了這些觀點,發現只需使用少量示例(50 個),非專業人士就可以通過訓練更好地預測復雜 VQA 模型的響應和即將出現的故障。此外,論文還評估了現有解釋(或可解釋性)方法在幫助人類建立 ToAIM 方面的作用。出人意料的是,獲得模型內部狀態——例如對前 k 個預測的置信度、顯式或隱式注意力圖等——并不能幫助人們更好地預測其行為。
論文鏈接:
https://www.aminer.cn/pub/599c7971601a182cd263e0b6
未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)大腦研究計劃,構建互聯網(城市)大腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。每日推薦范圍未來科技發展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
495篇新聞187個事件全景分析 | 智譜·AI人工智能發展月報(2021年1月)
《人工智能之表示學習》報告重磅發布:AI未來發展方向與前景
AI在科研中的滲透率,1600名科學家這樣說
陶哲軒:2026年GPT幫我合著數學論文!試用“完全版”GPT
ChatGTP全景圖 | 背景 技術篇
人工智能已經可以解決復雜的數學問題了,還有哪些工作是無法被取代的?
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 南华县| 淮滨县| 南开区| 泊头市| 上林县| 杭锦旗| 宜丰县| 元谋县| 宿迁市| 威海市| 天津市| 桂阳县| 政和县| 隆林| 封丘县| 星座| 嘉祥县| 连南| 丰都县| 乐清市| 冕宁县| 大庆市| 文昌市| 固安县| 巴彦淖尔市| 东山县| 泸定县| 姚安县| 华蓥市| 轮台县| 筠连县| 临澧县| 梓潼县| 台江县| 行唐县| 大田县| 珠海市| 思南县| 大英县| 沙洋县| 册亨县|