(文/瀟冷)大家好,這里是《AI談》,在這里我們一起談AI。在本文開始之前,筆者想先請各位思考一個問題:DeepSeek為何能夠迅速走紅?難道僅僅是因為它“易用”、“好用”、“耐用”這些特點嗎?在眾多大模型中,比如chat-GPT、豆包、通義千問等,難道就沒有能與DeepSeek相媲美的嗎?
沒有大模型能與DS媲美嗎?
答案顯然是“不是”,當然這也并不是筆者一個人“口嗨”。在全球知名的AI模型評測平臺Chatbot Arena于今年2月份公布的最新一期榜單(Chatbot Arena LLM Leaderboard)中。谷歌Gemini-2.0、ChatGPT 4o、DeepSeek-R1、o1、Qwen2.5、DeepSeek-V3等均名列前茅,能夠與DeepSeek-R1、DeepSeek-V3一較高下的大模型并不少,唯獨DeepSeek火得一塌糊涂。
榜單:媲美DeepSeek有的,但是國內媲美DeepSeek的貌似只有通義千問
為何DeepSeek爆火?筆者始終堅信,DeepSeek的最大魅力在于其開源特性,這也正是吸引大模型產業鏈上下游廠商紛紛側目的關鍵所在。畢竟,在國內大模型市場這片熱土上,盡管過去兩年里熱潮涌動,但真正實現盈利的卻寥寥無幾。在紫光云紫鸞6.0發布會上,紫光云公司總裁王燕平向中關村在線透露,基于DeepSeek的大模型訓推一體機售賣得異常火熱。
360集團創始人周鴻祎在接受采訪時,坦言,DeepSeek最大的成果不僅是讓中國大模型在技術上趕上了美國大模型,同時在中國用戶、企業和政府中做了一次人工智能的普及教育。他認為,由于DeepSeek免費、開源等特性,政府和企業紛紛開始采用DeepSeek降本增效,加速了中國AI產業革命的爆發。換言之,以往企業只能獨自研發并訓練自己的大模型,而如今有了DeepSeek,企業可以在其基礎上進行二次開發,或者進行微調以滿足自身需求。
Manus又是何方神圣?
Manus突然爆紅,短視頻、朋友圈里滿是它的相關消息,連“邀請碼”都炒得炙手可熱,價值倍增,甚至有“媒體”將其比喻為“第二個DeepSeek”。在這里,筆者還是想強調,DeepSeek真正價值不僅僅是能力,更為重要的是“開源”。同時,Manus官方介紹,Manus能夠獨立思考、規劃并執行復雜任務,直接交付完整成果,支持在簡歷篩選、房產研究、股票分析、旅行規劃、網站SEO優化等場景應用。嗯?他說你就信?都用過嗎?像極了愛情的模樣!
用互聯網“造”產品的成本確實低。回想當年,微軟為了保護自己的系統免受攻擊,付出了巨額的成本,硬是把自己打造成了一家安全公司。而如今,Manus只需一份PPT,一場發言,就能引起廣泛關注,真是天壤之別。鬧到最后,Manus相關負責人稱,團隊正在盡力改善內測用戶體驗,在模型幻覺、交付物友好度、運行速度等方面仍有很大提升空間。在筆者看來,Manus實測結果不如人意,其宣傳過頭了。
雖然說發展是否定之自我否定,但我們不能完全否定Manus所做的貢獻。零一萬物技術負責人在接受新京報采訪時表示,相較于去年Dify的工作流,或是Agently這類框架而言,Manus更符合智能體定義的Agent。但從模型發展角度來看,目前是補足模型能力不足的一個中間態。未來模型將會持續發展,覆蓋所有Agent產品。Manus的最大意義是定義了一個AGI的產品形態,預計3月底前,市場上會出現沿著Manus產品思路或者功能開發的其他產品。
言外之意,DeepSeek可以參考Manus的形態進行進化。Manus在褒貶不一的攻勢下,仿佛也雜事纏身。3月7日,Manus聯合創始人兼首席科學家季逸超發文稱,Manus的官方X賬戶被意外暫停,正積極與X的支持團隊合作解決此事。初步觀察表明,暫停可能與第三方提及加密貨幣詐騙有關,該領域與Manus的運營完全無關。季逸超還澄清,Manus從未參與加密貨幣項目、代幣發行或區塊鏈計劃。
Manus爆火,別影響千問
令筆者遺憾的是,3月6日的熱點幾乎全被Manus所壟斷,而由DeepSeek引發的開源大戰,盡管有阿里巴巴這樣的行業巨頭傾情參與,卻似乎并未獲得足夠的關注。就在這一天,阿里云發布了一款更小尺寸、性能卻比肩全球最強開源推理模型的QwQ-32B。
阿里云稱,這款QwQ-32B模型擁有320億參數,其性能竟能與具備6710億參數的DeepSeek-R1相媲美。發布當天,贊譽之聲便接踵而至。據財聯社報道,全球最大的AI開源社區Hugging Face更新了其大模型榜單,QwQ-32B成功榮登榜首。
據了解,千問QwQ-32B在數學、代碼及通用能力上均實現了質的飛躍,整體性能與DeepSeek-R1不相上下,更突破性地讓高性能推理模型得以在消費級顯卡上實現本地部署,大幅降低了模型的應用成本。
事實上,阿里云開源QwQ-32B模型對于國內大模型的發展而言,其意義遠非止于此。這一系列的開源舉措,無疑將極大地促進基于國產大模型的二次開發及模型微調的生態壯大,DeepSeek、阿里巴巴、百度等巨頭紛紛搶灘登陸,展開激烈角逐。
尤為值得一提的是,百度也在積極布局大模型領域。2月28日,百度官方宣布其文心大模型4.5將于3月16日正式發布,并透露這一代模型在基礎能力上實現了大幅提升,同時具備了原生多模態、深度思考等前沿能力。據悉,這將是百度迄今為止最強的下一代大模型。而早在2月14日,百度就已透露將在未來幾個月中陸續推出文心大模型4.5系列,并計劃于6月30日起正式開源。
開源之戰的號角已經吹響,讓我們忘掉那些插曲,共同見證這場技術盛宴。
本篇為《AI談》欄目的第三篇文章,原計劃這期寫“大模型安全”,但Manus有點突發,讓人始料未及。抱歉,在下期文章里,筆者也將談一談“大模型引發的安全問題”。感謝大家閱讀。
(9569519)