精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
硅谷今夜無眠!中國團隊用“驗證代理”架構重寫AI Agent游戲規則

摘要:

離用戶最近,做出最好的 AI Agent

來源|極客公園
作者|shiyun 張勇毅
編輯|靖宇
2025 年是 AI Agent 元年——這句話,在北京時間 3 月 6 日凌晨,得到了應驗。
「DeepSeek 之后,又一個科技圈的不眠之夜。」
不少用戶在社交媒體上如此點評。
所有人徹夜蹲守,只為該產品的一個使用邀請碼——它就是 Monica.im 研發的全球首款 AI Agent 產品「Manus」。
據團隊介紹,「Manus」是一個真正自主的 AI 代理,能夠解決各類復雜多變的任務。與傳統 AI 助手不同,Manus 不僅能提供建議或答案,還能直接交付完整的任務成果。
圖|Manus 的介紹視頻只有短短的 4 分鐘,卻威力驚人 來源:Monica.im
正如「Manus」的名字寓意,它在拉丁文里象征著「手」。也就是說,知識不僅要在腦子里,還要能用手執行。這正是 Agent 和 AI Bot(聊天機器人)產品的本質進階。
Manus 牛在哪里?最直觀的是看官方網站展示、以及用戶自發展示的使用用例,極客公園部分整理如下:
  1. 旅行規劃:不僅整合旅行信息,還為用戶創建定制旅行手冊。例如,為用戶規劃日本四月旅行,提供個性化的旅行建議和詳細手冊。

  2. 股票分析:進行深入的股票分析,設計視覺上吸引人的儀表盤展示全面的股票洞察。例如,對特斯拉股票進行深度分析,創建可視化儀表盤。

  3. 教育內容創建:為中學教師創建視頻演示材料,解釋動量定理等復雜概念,幫助教師更有效地教學。

  4. 保險政策比較:創建清晰的保險政策比較表,提供最佳決策建議,幫助用戶選擇最適合的保險產品。

  5. 供應商采購:在整個網絡中進行深入研究,找到最適合用戶需求的供應商,作為真正公平的代理為用戶服務。

  6. 財務報告分析:通過研究和數據分析捕捉市場對特定公司(如亞馬遜)的情緒變化,提供過去四個季度的市場情緒分析。

  7. 創業公司列表整理:訪問相關網站識別符合條件的公司,并將其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。

  8. 在線商店運營分析:分析亞馬遜商店銷售數據,提供可操作的洞察、詳細可視化和定制策略,幫助提升銷售業績。

當 Agent 通過一長串思維鏈和工具調用,最終輸出一個無比完整、專業的結果時,用戶們開始感嘆「真的能幫人類做事了」。
根據官方網站信息,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上都取得了新的最先進 (SOTA) 表現。
總結成一句話——Manus 更想做的,是你在數字世界中,字面意義上的「代理人」。而它做到了。
就像你想的一樣,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!
Manus,你的「數字代理人」
首先,Manus 在體驗上與此前 LLM 最大的不同:
它強調直接交付最終結果的能力,而不只是給出一個單純的「答案」。
Manus 目前采用 Multiple Agent 架構,運行方式與此前 Anthropic 發布的 Computer Use 類似,完全運行在獨立虛擬機中。同時可以在虛擬環境中調用各類工具——編寫和執行代碼、瀏覽網頁、操作應用等,直接交付完整成果。
在官方發布的視頻中,介紹了三個 Manus 在實際使用場景中所完成的工作案例:
第一個任務是篩選簡歷。
從 15 份簡歷中,為強化學習算法工程師職位推薦合適的候選人,并根據其強化學習專業知識對候選人進行排名。
在這個演示中,你甚至不需要給壓縮文件解壓、將其中的簡歷文件一份份手動上傳。Manus 這時候就已經展現出了像人類「實習生」的一面,手動解壓縮文件,并逐頁瀏覽每一份簡歷,同時記錄其中的重要信息。
圖|Manus 像實習生一樣,自動理解「解壓老板扔過來的打包文件」這個隱藏指令 來源:極客公園
在 Manus 給出的結果中,不僅有自動生成的排名建議,它還會根據工作經驗等重要維度,將候選人分為不同等級。在接受到用戶更希望以 Excel 表格的方式呈現后,Manus 還能自動將這些內容通過現場編寫 Python 腳本的方式,來生成對應的表格。
Manus 甚至還能通過記憶能力,在這個實踐過程中記錄下「用戶更喜歡通過表格的方式接受結果」這樣的信息,下一次處理類似的任務結果時,會優先使用表格的形式來呈現。
圖|Manus 能記住用戶在內容生成流程中的偏好 來源:極客公園
第二個案例,更為國人量身打造,就是遴選房產。
案例中用戶希望在紐約購買房產,輸入的要求是希望同時有安全的社區環境、低犯罪率,以及優質的中小學教育資源—— 當然還包括最重要的預算,足夠在每月固定收入的情況下負擔的起。
在這個需求中,Manus AI 將復雜任務分解為待辦事項列表,包括研究安全社區、識別優質學校、計算預算、搜索房產等。并通過網絡搜索,仔細閱讀有關紐約最安全社區的文章,收集相關信息。
其次,Manus 通過編寫一個 Python 程序,根據用戶收入計算可負擔的房產預算。結合房地產網站上相關的房價信息,根據預算范圍篩選房產列表。
圖|Manus 能夠自動搜索、并過濾掉條件不符合用戶要求的房源  來源:極客公園
最后,Manus 會整合所有收集的信息,撰寫詳細報告,包括社區安全分析、學校質量評估、預算分析、推薦房產列表以及相關資源鏈接——就像一個專業的房地產經紀人一樣。而且由于 Manus 自帶「完全基于用戶利益考慮」的屬性,其使用甚至體驗更好。
在最后一個案例中,Manus 展示了對股票價格的分析能力。
案例給出的任務是分析過去三年中英偉達、邁威爾科技和臺積電股票價格之間的相關性:眾所周知這三支股票之間存在緊密的關聯性,但對于新手用戶來講,很難快速將其中的因果關系整理清楚。
而 Manus 的操作,與一個真正的股票經紀人非常相似,它先是通過 API 訪問雅虎金融等信息網站,來獲取股票歷史數據,同時還會交叉驗證數據準確程度,避免被單一信息來源誤導,對最終產生結果帶來重大影響。
在這個案例中,Manus 同樣用到了編寫 Python 代碼、進行數據分析和可視化的能力,同時還引入了金融相關的專業工具進行分析,最終通過數據可視化圖表,搭配詳盡的綜合分析報告的方式,向用戶反饋其中的因果關系——真的就像一個金融領域「實習生」做的日常工作。
不僅如此,在 Manus 官網還展示了十多個 Manus 能夠使用的場景:直接使用 Manus 幫你整理行程、個性化推薦旅游路線,還能讓它學習使用各種復雜工具,來流程化的完成日常工作。
在這個過程中,真正讓 Manus 展現出與往常工具不同的,是它的自主規劃,來確保執行任務的能力。
自主學習的能力也讓 Manus 的工作能力提升邏輯更像是真正的人類——即使現階段,它可能還無法在某一個特定領域做到專家級別的精通,但已經能看到巨大的潛力。
隨著自主學習能力的加入,AI Agent 的泛用性得到了巨大的提升,在用戶對 Manus 的實際測試中,你甚至可以做到直接對它描述一個視頻畫面中的相關內容,Manus 最終能夠直接根據對應的信息,跨越平臺內容對于搜索引擎的限制,精準找到某個抖音短視頻的鏈接。
由于目前版本的 Manus 完全基于云端異步運行,因此實際上 Manus 的能力并不被你所使用的端側平臺形態或算力等因素限制——用戶甚至可以做到在向 Manus 下達指令之后,暫時關閉電腦,當 Manus 執行完成活動結果后,會自動通知你結果。
這個操作邏輯同樣非常眼熟——就像一個人下班以后,在微信上喊實習生「文件整理好發我」。只不過,現在,這個實習生是真的可以 7x24 小時的響應你了,并且不用擔心他會「整頓職場」。
多代理+自查,跑通 AI Agent 流
從上面這些案例,其實不難看出 Manus 真正的殺手锏,并非 Computer Use 中已經出現過的「AI Agent」概念,而是它「模擬人類方式工作方式」的能力。
比起「運行計算」,Manus 的工作邏輯更像是「思考并執行命令」。它并沒有做到哪些人類當前真正無法做到的事;這也就是為什么一些已經體驗過當前版本 Manus 的用戶,將它形容為「一個實習生」。
在 Manus 官網,展示著眾多 Manus 能夠完成的任務,其中就有一個案例,展示了在 B2B 業務中,如何使用 Manus。快速精準的將你的訂貨需求,與全球供應商實現精準匹配。
在類似需求的常規產品中,在平臺內整合全球供應鏈企業信息,來幫助用戶完成供貨商/需求方匹配這件事,是業內通行的邏輯。但這件事在 Manus 的案例中,你能看到完全不同的實現方式。
Manus AI 使用一套名為「Multiple Agent」的架構,運行在獨立的虛擬機中。通過規劃代理、執行代理、驗證代理的分工協作機制,。來大幅提升對復雜任務的處理效率,并通過并行計算縮短響應時間。
在這個架構中,每個代理可能基于獨立的語言模型或強化學習模型,彼此通過 API 或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支持云端擴展。每個獨立模型都能模仿人類處理任務的流程,比如先思考和規劃,理解復雜指令并拆解為可執行的步驟,再調用合適的工具。
換言之,通過 Manus 的這套多代理架構,它更像是由多個助理,通過協助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫你完成整個工作流程——這實際上不僅像是你招了一個「實習生」,更像是直接當上了一個微縮版的「部門主管」。
在 B2B 業務這個案例中,Manus 通過網頁爬蟲以及代碼編寫、執行能力,Manus 會自動在互聯網這片汪洋大海中檢索,根據你自己的需求,對潛在供應商從產品質量、價格、交貨能力等方面,為你匹配到最合適的貨源。不僅可以將結論以圖表的方式直觀呈現在你眼前。還能對這些數據進一步給出更加詳細的操作建議。
圖|Manus 完成 B2B 場景下的需求,或許比單一平臺的內建工具更好用  來源:極客公園
至于 Monica 團隊到底如何、用何種技術實現的視頻效果,根據消息,團隊或將在北京時間 3 月 6 日為大家揭曉。
「縫合」的極致,就是炸裂
Manus 背后的 Monica.im,到底是家什么公司?
Monica 是一款 All-in-One 的 AI 助手,產品形態從瀏覽器插件、慢慢拓展至了 App、網頁端。主流的使用場景是,當用戶在瀏覽器中點開它的小圖標,就能直接使用其接入的各大主流模型。通過對細分場景用戶需求的準確理解,Monica 摘到了大模型「低垂的果實」。
其創始人肖弘(昵稱小紅,英文名 Red)是一位年輕的連續創業者,1992 年生,畢業于華中科技大學。2015 年,他畢業后創業,早期創業不算順利(如校園社交、二手集市)。2016 年,他創業微信公眾號運營者提供編輯與數據分析工具,獲得了百萬用戶、并完成了盈利,最終產品于 2020 年出售給了某獨角獸公司。
等到 2022 年大模型浪潮后,他正式創立 Monica,專注海外市場,通過獨立開發者產品 ChatGPT for Google,產品快速完成了冷啟動。
2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上線的第一時間,Monica 讓用戶可以獲得最新 SOTA 模型。隨著接入模型的新進展,Monica 推出的專業搜索、DIY Bot、Artifacts 寫小程序、記憶等功能也受到用戶喜愛。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的網頁里呈現出不同的交互形態和功能,以適配特定場景的用戶需求,更新了數百個網頁的個性化 AI 體驗。
2024 年,Monica 用戶數量翻番,達 1000 萬。同時,其保持著可觀的盈利,在海外同類產品中,位居頭部。
Monica 的強勁表現驗證了一件事:
套殼到極致,既是 TPF、也是 PMF,最后都通往用戶價值。
圖|Monica 首頁 
Manus 或許延續了 Monica 團隊這種思路——肖弘接受媒體人張小珺的訪談時表示,產品不能只有聊天機器人一種形態,Agent 會是新增的形態、需要新的產品去承接。
他從 AI 編程產品 cursor 和 Devin 中獲得了靈感。據極客公園了解,前者主要是 copilot 模式、后者則是 autopilot 模式,后者更符合人性需求。Agent 也應該像 Devin 一樣,面向大眾人群、真正由 ai 主導進行執行。但過去的問題是,模型不夠聰明。
但基于模型已有能力去做場景的封裝服務,或許正是 Monica 團隊的優勢。肖弘說,目前 Agent 產品團隊并不多,因為它需要很多復合能力,比如說團隊要搞過 chatbot、AI 編程、瀏覽器相關(因為都在瀏覽器上跑)、而且對模型的邊界要有不錯的感知——今天發展到什么水平,接下來會發展到什么樣的水平等等。
「同時擁有這些能力的公司沒那么多,而有這些能力的公司,可能手頭正在干一個很具體的業務,但我們恰好有同學剛好有時間一起把這件事情做出來。」他說。
為什么是 Monica 做出來了,他總結道,「第一,我覺得我們是比較幸運的。第二,某種程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些時間給創業公司?模型預計能力外溢還能走多遠?」
他認為,目前 Agent 還在早期階段。一是目前 Agent 還在規劃階段,還沒到物理世界的執行;二是大模型的能力還在往上發展,一切還不可預料。
「我肯定不知道 Agent,是可以被用這樣的方式被出來的,它是一個未知的事情。」他說。
耐人尋味的是,「不知道怎么做 Agent」的 Monica,現在做出了一個讓整個 AI 圈感到炸裂的產品。
Manus 可能未必是最終的 AI Agent,但它無疑在 DeeoSeek 爆火之后,再次將人們對 AI 的期望拉升了一個數量級。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
三萬字實錄對話硅谷頂尖研究員:General Agent是偽命題;Agent的交互設計是關鍵
第一層:算力、算法數據層
智能體(AI Agent)未來的發展趨勢與展望
AI大模型agent: 大模型從屁都不懂到精通我是怎么做到的!!
年后AI落地別踩坑!DeepSeek熱潮下,企業最容易犯的2個錯(含詳細避坑指南)
GPT-4化身邪惡化學家!中國科大等發布首個科學風險基準大模型
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 平乐县| 锡林浩特市| 小金县| 山东省| 西安市| 宜丰县| 华容县| 辛集市| 汕头市| 磐安县| 盐边县| 宁波市| 衡山县| 奇台县| 开平市| 西贡区| 阿鲁科尔沁旗| 武鸣县| 博乐市| 云林县| 沧州市| 龙南县| 蕲春县| 安岳县| 巩留县| 瑞丽市| 高邑县| 麟游县| 贺州市| 望谟县| 天峻县| 靖边县| 高邑县| 肃宁县| 万荣县| 乡宁县| 元阳县| 大关县| 波密县| 乌恰县| 格尔木市|