「 AI領域卷大模型,從卷算法到卷參數再到卷價格,如今要卷思維。」
AI又一次迎來質變的進化:9月13日,OpenAI o1-preview落地,一時間引發人們對“Inference law(推理定律)”取代“Scaling Law(規模定律)”的熱議。當大家深入探討OpenAI o1的“思維鏈”時,才發現,這不是與兩個月前周鴻祎說的“慢思考”是一個底層邏輯嗎?
AI的發展,不僅要卷技術的領先,更要卷思維的前瞻。洞察趨勢,預見到未來的方向,才能真正領跑未來。
具有強大推理能力、適用于復雜任務的OpenAI o1,再次給業界帶來震動。用OpenAI官方的說法:“這個模型在復雜推理任務上是一個重大的進步,代表了人工智能能力的一個新水平;因此,我們決定重新開始編號,把這一系列模型命名為OpenAI o1。”言外之意就是,這是AI思維模式、發展路徑的一次重大改變,預示著未來AI發展的全新路徑。
過去的GPT系列模型雖精確且量大,但缺乏“思考”環節,因此難以真正理解復雜學科如物理學和數學。
這一次的具體變化歸結為“思維鏈” (Chain-of-Thought, CoT)一詞。o1 系列模型采用全新的訓練方法,不再局限于模仿訓練數據中的模式,而是通過強化學習和“思維鏈”技術,引導模型自主解決問題,主打推理能力。工作原理本質上是-思維鏈的自動化,把一個復雜問題拆解成若干簡單步驟,從而有利于大模型解決復雜的邏輯問題。
OpenAI 創始人山姆·奧特曼(Sam Altman) 將 o1 稱為“迄今為止最強大、最一致的一系列模型”,并將其視為邁向自主系統或代理的關鍵一步。
總結起來,“思維鏈”有幾個特性:像人一樣思考,自主推理,自動分解步驟,通過一系列模型協同完成。
有沒有覺得“似曾相識”?沒錯,早在7月底的ISC.AI 2024大會上,360集團創始人周鴻祎就提出:“用基于智能體的框架打造慢思考系統,從而增強大模型的慢思考能力。”
他認為,快思考的特點是快速直覺、無意識,反應很快但能力不夠強。GPT類大模型通過訓練大量知識,主要學習的是快思考能力,GPT這類大模型可以做到脫口而出,但是質量不夠穩定,甚至會“一本正經地胡說八道”,所答非所問。而慢思考則是緩慢、有意識、有邏輯性,需要分很多步驟,類似寫一篇復雜的文章,要先列提綱,根據提綱去搜集數據,收集素材,根據素材進行討論,再把文章寫出來,還要進行潤色和修改。也就是說,慢思考更像真正的人類一樣去思考,先了解問題的意圖,再對分步完成一項復雜的任務。
周鴻祎評價:“這一次OpenAI o1擁有了人類慢思考的特質,在回答問題前會反復地思考,拆解、理解、推理,可能會自己問自己1000遍,然后才能給出最終的答案。”
顯然,“思維鏈”與“慢思考”是一套邏輯體系,不謀而合,只是周鴻祎無論從觀點到實踐,都早了近兩個月。
這也將是產業的一個轉折點。GPT當年很轟動,并引發了千模大戰。但是卷大模型的道路上,普遍缺乏“思考”環節,有時不能正確理解問題,有時不能解答復雜的科學問題。隨著“思維鏈”與“慢思考”的提出,為AI的發展引入了新的底層思維邏輯,不僅在生成內容時進行計算,還模擬了“先想后說”的過程,更接近人類思維模式,標志著向通用人工智能(AGI)邁進的重要一步。
正如周鴻祎所說:“所以,以后比的不是多快能給你答案,而是給的答案完不完整,人工智能到最后還是要參考人類大腦的組成來構造工作模式。”
與過去一味地卷大模型不同,周鴻祎更關注的是如何讓AI真正解決問題,真正給用戶帶來價值。兩個月前,周鴻祎在提出“慢思考”的全新邏輯時,也拿了出全新的解題思路----多模型協同。
如何通過多模型協同來實現人類的思維模式呢?
首先是搭臺子——CoE。
以前MoE(Mixture-of-Experts,混合專家)架構的稀疏混合專家模型都被認為是Transformer之后大模型下一個發展趨勢。MoE模型可以只選擇某一專家模型來處理數據,這使得模型在推理過程中更為高效,因為大部分專家處于未激活狀態,從而減少了不必要的計算,即所謂的快思考。而在7月底的ISC大會上,360推出了CoE(Collaboration-of-Experts,專家協同)技術架構,可以讓多個模型分工協作、并行作戰,執行多步推理,不同模型之間可以相互補充、相互校驗,確保面對復雜問題可以有更穩定的輸出,解決“AI幻覺”的弊端。可以預見,未來CoE會替代MoE成為新趨勢,開啟多模型協同時代。
其次是建班子——大模型聯盟。
由360牽頭,百度、騰訊、阿里巴巴、智譜AI、Minimax、月之暗面等16家國內主流大模型廠商形成一個聯盟,將這些企業的54款大模型產品接入CoE,協同發揮作用。其實,今年以來,大模型企業之間的合作、聯手越來越多,只是360這次的聯盟聲勢比較大,并且將一些互聯網頭部企業都囊括進來,在市場上影響比較大。
據悉,CoE技術架構不僅接入了“大模型”,還接入了很多十億甚至更小參數的專家模型,這使得整個系統更加智能。CoE架構在實現“讓最強的模型回答最難的問題”的同時,還能在回答簡單問題時調用更精準的“小模型”,在獲得高質量回答的同時,節約推理資源、提升響應速度。
第三是練隊伍——加速應用落地。
有了技術架構,有了大模型,更重要的是要有應用,通過應用才能讓大模型更好用,大模型的協同效果才能得到驗證。360在加速產品的AI化的同時,在多個產品中都通過多模型協同實現產品的領先優勢。
360AI搜索就是基于CoE技術架構,支持多模型協作重構了搜索的底層鏈路,是一種真正意義上的“AI原生搜索引擎”。 360AI搜索“深入回答”模式,首先是構建意圖分類模型,然后打造任務路由模型對問題進行拆解,最后再構建AI工作流,整個過程會涉及7-15次的大模型調用,這才能讓用戶獲得真正高質量的回答。
在CoE技術架構的加持下,360AI搜索僅用了八九個月的時間,就超越了Perplexity AI,蟬聯全球最大的AI原生搜索引擎;并且依然勢能強勁,以113%的月訪問量增速,位列全球主要搜索引擎首位。
入駐360AI瀏覽器的AI助手(bot.360.com)的「多模型協作」能力,近期也成為了行業焦點。用戶可以從國內主流16家廠商的54款LLMs中任意3款,分別做專家、反思者和總結者,直觀體驗LLM領域的“三英戰呂布”。讓3款LLM協作起來,組隊碾壓GPT-4o、媲美OpenAI o1。
由此可見,作為國內“AI教父”的周鴻祎,并不只是一個思考者,更是一個行動者。他在洞察到大模型的諸多問題之后,給出新的路徑;并且身體力行,通過搭臺子、建班子、練隊伍的方式,將這個路徑給驗證了。這才是真正難得的地方。
自從OpenAI掀起大模型浪潮之后,周鴻祎非常活躍,在語言上和行動上都是。一方面,他在各種場合交流對AI發展趨勢的見解;另一方面,迅速推動公司所有產品的AI化,兩者相互促進。
而這次,在大模型前進道路上邁出的關鍵一步,周鴻祎和360不僅與OpenAI不謀而合,并且還快了一步,正是其在思考中實踐、在實踐中思考的結果。
如今,AI的發展還處于初級階段。最近,“慢思考”與“思維鏈”理念的提出,對AI的發展帶來三點啟示。
第一,戰略高于戰術,格局重于技術。
大模型火了之后,傳統互聯網大廠、創業者都進來卷,但卷大模型的價值有那么大嗎?從終局來看,AI 不是被動接受指令的工具,而是能夠自主“思考”、決策和行動的智能伙伴。
周鴻祎在看到大模型強大的同時,也很早就看到AI幻覺的問題,并思考未來的發展方向。戰略方向比具體的戰術更重要,單點的技術創新是戰術,而終局思維才是戰略方向,這是其“慢思考”的來源。
跑得快很重要,但是更重要的是在對的方向上跑得快。如果一味地卷大模型,其實是對產業資源的浪費。
今天,“慢思考”與“思維鏈”也不是終局,只是在向終局的路上邁進了一大步。
第二,卷應用比卷模型更有價值。
技術創新與用戶價值之間,往往隔著一道鴻溝,跨過這道鴻溝的企業比發明技術的企業更偉大。最早發明二維碼的不是微信,但是微信是二維碼最大的推動者。新能源電池不是特斯拉發明的,但特斯拉確是新能源汽車產業的先行者。
大模型很酷,但如何能為用戶創造價值更重要。也就是說,卷應用落地比卷大模型更有意義。360的產品全面AI化,目的就是讓小白用戶可以簡單輕松地體驗到AI帶來的好處。在應用的落地方面,360走得很快,特別是在多模型協同上領先了OpenAI兩個月。
學習、辦公是最常見的應用場景,為了推動應用了落地,360還推出了AI辦公,是一個一站式學習辦公工具,用戶可以體驗到AI圖片、AI文檔、AI音視頻、AI PPT等超過200多個AI能力,幾乎覆蓋所有學習、辦公所需。
第三,獨行不如眾行遠。
AI的實現,是一個非常復雜的系統工程,不是單個企業可以實現的。在業界有一個共識,未來AI的競爭是生態的競爭。單個OpenAI可能很強,但是通過協同作戰,中國的大模型可以用全新的思路彎道超車。
經測試,基于CoE架構集各家所長的混合大模型能力就超過了GPT-4o。該混合大模型在翻譯、寫作等12項指標的測試中取得了80.49分的綜合成績,超越了GPT-4o的69.22分;而且除了代碼以外,其余11項指標均優于GPT-4o。特別是在“邏輯推理”、“多步推理”、“詩詞賞析”這類比較具有中文特色的問題上,CoE的領先優勢更加明顯。
目前,360“多模型協作”在測試中,已經打敗并遠遠甩開GPT-4o,媲美o1-preview,這就是聯盟的力量,生態的威力。
【結束語】
AI發展初期,從大模型來看好像中國落后一步。如果跟在別人后面延著人家的軌跡追,差距只會越拉越遠。以終局思維重新審視AI的發展路徑,技術創新的同時更要路徑創新。“慢思考”與“思維鏈”的巧合,是中國AI發展趕超的新契機。