文|AI大模型工場,作者|參商 王玄,編輯|星奈
有研究預計,如果 LLM 保持現在的發展勢頭,預計在 2028 年左右,已有的數據儲量將被全部利用完。屆時,基于大數據的大模型的發展將可能放緩甚至陷入停滯。
實際上,OpenAI O1模型的推出將預訓練Scaling Law范式帶向了推理層的Scaling Law,國內企業也開始紛紛上線推理模型。
國內,10月初,就有消息傳出,“AI六小虎”中已經有兩家公司已經決定逐步放棄預訓練模型,近期又有消息指出,仍在繼續預訓練的公司只剩下智譜AI和MiniMAX,其他包括月之暗面、百川只能在內的公司都已經放棄預訓練。
然而,OpenAI高級研究副總裁Mark Chen卻在在爐邊談話中,正式否認「Scaling Law撞墻論」。他表示,并沒有看到Scaling Law撞墻,甚至OpenAI還有兩個范例——o系列和GPT系列,來保持這種Scaling。
此外,扎克伯格、奧特曼和其他 AI 開發商的首席執行官也公開表示,他們尚未達到傳統 scaling laws 的極限。因此,OpenAI 等公司仍在開發昂貴的、價值數十億美元的數據中心,以盡可能多地提升預訓練模型的性能。
企業軟件公司 Databricks 的聯合創始人兼主席聯合開發者 Ion Stoica 表示,大模型的表現可能在某些方面已經停滯,但在其他方面仍在進步。
Stoica 表示,盡管大模型在代碼和解決復雜、多步驟問題等任務方面不斷改進,但其在執行通用任務(如分析一段文本的情感或描述醫療問題的癥狀)方面似乎進展緩慢。“對于常識性問題,你可以說,目前我們看到 LLM 的表現停滯不前。我們需要 [更多] 事實數據,而合成數據沒有太大幫助”他說道。
但其實“Scaling Law”撞墻與否,在AI領域,雖然短期內可能會遇到技術瓶頸或成本效益比下降的問題,但從長遠來看,AI的軟硬件能力仍然會持續增長。
最近,大廠扎推上線AI Agent產品。從去年就大火的概念,今年終于迎來應用落地的集中爆發。
Gartner已將代理式AI列為2025年十大技術趨勢之一,并預測到2028年,至少有15%的日常工作決策將由代理式Al自主完成。
11月29日,在智譜Agent OpenDay上,智譜AI CEO張鵬宣布旗下自主任務完成智能體AutoGLM再次升級,支持自主執行超過54步的長步驟操作,也可以跨App執行任務。
張鵬認為,發展至今,大模型已經初步具備了人類與現實物理世界互動的部分能力。Agent將極大地提升L3使用工具能力,同時開啟對L4自我學習能力的探索。未來,GLM團隊將繼續加速Agent模型產品的研發,期待著一句話操作電腦和手機的范式盡快到來。
目前,微軟、蘋果、華為、小米等國內外頭部廠商也正爭先推出AI助手相關產品。加上OpenAI即將推出的全新AI Agent產品“Operator”,2025年將成為AI Agent商用爆發年。
此外,華鑫證券在其研報中預測,AI Agent的中國市場規模有望從2023年的554億元增長至2028年的8520億元,年均復合增長率高達72.7%。中信建投則在研報中表示,預計在不久的將來會進入大模型時代的2.0時代:AI Agent。
隨著人工智能技術的持續突破,AI Agent正迅速成為全球科技領域的關鍵發展方向,預計未來幾年內,AI Agent將廣泛滲透至多個行業應用,涵蓋智能家居、醫療、金融等領域,成為推動行業升級和自動化的核心技術之一。
11月12日,“百度世界2024”大會上,百度發布了全新AI硬件產品——小度AI眼鏡,號稱全球首款搭載中文大模型的原生AI硬件產品。據悉,小度 AI 眼鏡將于明年上半年正式上市。
據透露,小米也正在布局新一代AI眼鏡,屆時將與歌爾股份合作,全面對標Meta Ray-ban。該眼鏡搭載 AI 功能、音頻耳機模塊、攝像頭模塊,并將以小米自有品牌形式發布。消息稱雷軍對這款AI眼鏡的銷售預期設定在“三十萬臺以上”。而此前小米已經在2021年發布了小米智能眼鏡探索版。
11月18日,Rokid的發布會上推出的一款與BOLON眼鏡聯名的新一代 AI + AR 眼鏡—— Rokid Glasses。通過整合阿里巴巴通義千問多模態大模型,Rokid Glasses 支持接打電話、AI 問答搜索、AI 識別物體、AI 拍照答題、AI 多語種翻譯、AI 導航、AI 轉譯、AI 健康提醒等。
華為、小度、小米、榮耀等互聯網巨頭依托自身強大的生態體系和用戶基礎,紛紛布局AI眼鏡。根據IDC的數據,2024年第一季度全球智能眼鏡出貨量同比增長了200%以上,顯示出AI眼鏡市場的強勁增長勢頭。預計到2029年,全球智能眼鏡全球年銷量有望達到5500萬副,市場規模將達到1067.78億元。這一市場趨勢進一步證實了大廠們紛紛布局AI眼鏡,希望通過硬件化落地AI大模型技術,以抓住市場機遇。
11月21日消息,百度發布截至2024年9月30日的第三季度業績。 財報顯示,百度總營收336億元,百度核心營收265億元,歸屬百度核心的凈利潤75.4億元,同比增長17%,超出市場預期。
李彥宏在業績會上透露,百度將于2025年初發布文心大模型的新版本。目前,文心大模型日均調用量已達15億次,一年內增長30倍。
同時在業績會上披露的,還有百度文庫和百度App的最新數據——當前,百度文庫AI功能月活用戶已經突破5000萬,同比增長超300%;百度App AI功能已覆蓋近70%月活用戶。
近日,百度文庫推出的“AI全網搜”功能,利用先進的AI技術提升信息檢索的效率和準確性,幫助用戶在信息泛濫的時代快速獲取核心要點。該功能整合了豐富的文檔資源,特別是在學術領域表現突出,能夠通過自然語言處理技術提供結構化答案,并通過圖示化功能提升信息的可讀性。
11月15日消息,字節跳動視頻生成模型 PixelDance和Seaweed在即夢AI正式上線,面向公眾免費開放使用。用戶進入即夢AI的“視頻生成”界面,在視頻模型里選擇“視頻P2.0 Pro”或“視頻S2.0 Pro”,即可分別體驗這兩款模型,目前網頁版和手機端APP均已支持。
字節跳動兩款視頻生成模型于9月底首次發布,并通過即夢AI、火山引擎分別面向創作者和企業客戶小范圍邀測。
11月14日消息,扣子上線了全新的智能語音 OpenAPI,首次將“理解”的能力注入語音交互鏈路,同時具備強大的 AI Agent 能力、精準識別、穩健的實時通信能力、自然的語音效果等優勢。
扣子團隊表示,邀測期間暫不收取語音功能費用,僅根據智能體調用次數和 Token 消耗收取專業版的基礎費用。而內測用戶的福利是每日 1 小時、每月 20 小時的實時通話體驗時長,足以滿足基礎測試和常規使用。如有更高時長需求,用戶可根據實際情況提出額外申請,以滿足不同場景的深度測試需要。
近日,科大訊飛對其星火低代碼智能體平臺進行了全面升級,旨在通過快速搭建和靈活定制,顯著縮短開發周期并拓展應用場景。新平臺允許用戶免費創建AI Agent,接入微調平臺實現定制優化,升級RAG方案擴充專業知識,并上線創建模板降低開發門檻。
星火低代碼智能體平臺提供可視化操作界面,允許用戶將大型語言模型、插件、代碼等功能模塊靈活組合,高效編排復雜且穩定的業務流程。
平臺涵蓋了大語言模型(LLM)、自定義代碼執行以及復雜的判斷邏輯等高級功能,滿足用戶對各種復雜任務處理的需求。開發者可以基于大小模型混合架構搭建應用,一鍵發布API,并跨平臺云+端大模型SDK進行靈活集成與定制化。
11月12日消息,阿里在海外推出對話式 AI 搜索引擎 Accio,面向全球商家開放,這是全球第一個 B2B 領域的 AI 搜索引擎。
11月13日消息,阿里云通義大模型團隊正式開源通義千問代碼模型全系列,共6款Qwen2.5-Coder模型。其中32B尺寸的旗艦代碼模型在十余項基準評測中均取得開源最佳成績,成為全球最強開源代碼模型,在多項關鍵能力上超越閉源模型GPT-4o。
11月17日消息,阿里最近宣布開源了其最新的圖像生成模型——Qwen2vl-Flux。該模型不僅具備編輯、合并和混合等多種功能,還能夠根據用戶輸入的圖片或文字生成高度相似的新圖片。
近日,阿里巴巴國際AI團隊推出的Marco-o1模型,專注于解決開放型問題,超越了傳統的標準答案領域。該模型通過創新的self-play和MCTS技術,構建了具備反思能力的超長CoT數據,展現了在機器翻譯和其他領域的強大能力。
近日,權威大模型評測基準 SuperCLUE 發布最新《中文大模型基準測評2024年10月報告》中,由中國電信人工智能研究院(TeleAI)原創打造的星辰語義大模型 TeleChat2,作為央企大模型代表,綜合能力位列大模型第一梯隊。
其中TeleChat2 在理科“工具調用”維度排名前二,在 Agent 智能體總榜排名并列第二。
TeleChat2-35B 以更小參數量和更佳效果獲得開源模型排行榜銅牌,綜合效果超過 Llama-3.1-70B-Instruct 和 Llama-3.2-90B-Instruct 等較大參數模型。
據了解,中國電信是最早布局并首先開源大模型的央企機構,在中國電信CTO、首席科學家、TeleAI院長李學龍教授帶領下,堅持全鏈路自主研發創新,構建了語義、語音、視覺及多模態等全模態完備的大模型基礎框架。并在今年7月完成了星辰大模型系列的語義、語音、多模態大模型均已完成算法及服務的“雙備案”。
且在今年前半年,TeleAI 就陸續開源了 1B、7B、12B和52B 參數的第一代 TeleChat 系列模型。最近,TeleChat2 系列也已完成 3B、7B、35B 和 115B 模型開源,逐步構建了全尺寸開源布局。
在應用落地層面,目前,星辰語義大模型系列已在政務服務、智慧教育、經營分析、公文寫作等領域廣泛應用落地。
11月15日消息,騰訊宣布旗下AI智能工作臺ima現已正式上線,其除了能完成其余大模型AI問答產品的功能(包括問答、創作文字、生成圖片等)以外,還打通了微信公眾號文章的生態,整個公眾號世界里的知識都可為用戶所用。
11月28日消息,騰訊公司官方人士對外宣布,騰訊混元大模型12月3日正式上線視頻生成能力,用戶可以在騰訊元寶App中提交申請試用。企業客戶通過騰訊云提供服務接入,目前 API 同步開放內測申請。同時,騰訊也將開源該視頻生成大模型。
本月中旬,騰訊大模型 App元寶發布了 2.0 版本,界面方面的升級包括更新對話列表,支持歷史使用資產沉淀,用戶可更輕松地查找歷史對話和用過的智能體。
2.0版本新增 AI 應用專屬板塊,提供了 AI 搜索、AI 閱讀、創意繪畫、靈感圖庫、AI 美照五大應用,以及“應用廣場”的多種智能體,其中AI 搜索功能除微信公眾號外,還升級整合微信視頻號、QQ 音樂等信息資源,提供更加智能和便捷的搜索體驗。
此外,元寶2.0基于新一代大模型“混元Turbo”,在性能上實現了大幅提升,訓練和推理效率提高一倍,支持任意長寬比及最高7K分辨率圖片的理解分析。在文生圖方面,語義理解、畫面質感和真實性也得到了全面優化。
11月27日消息,360集團研發的全新生成式 AI 搜索產品“納米搜索” App日前已上架到蘋果App Store和應用寶等安卓應用商店,直接對標百度、阿里夸克、秘塔AI、Perplexity AI等多個 AI 搜索類產品。
據介紹,基于大模型的360 AI搜索產品“納米搜索”,slogan是“解鎖每一個疑問,看見每一個細節”,主打集搜、讀、寫、創于一體,稱要“重新定義AI搜索”、更輕更快更強,并且要開創全新問答方式,讓搜索變得簡單直觀。
周鴻祎在視頻中指出,傳統搜索引擎存在“關鍵字不匹配導致結果偏差大”和“搜索信息質量參差不齊”兩大問題;同時大模型的使用對普通用戶而言仍有較高門檻,需要掌握復雜的提示詞與對話技巧。而360AI搜索以大模型驅動搜索引擎的智能化升級,在用戶體驗上取得顯著突破,具有門檻低、易操作的優勢,是AI改造的最佳場景之一。
11月29日消息,在上午北京智譜GLM OpenDay上,智譜AI發布AutoGLM 及 GLM-PC兩款AI智能體產品。
其中,AutoGLM,基于智譜自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”,是智譜第一個產品化的智能體 Agent,通過文字/語音指令模擬人類操作手機,實現大模型從“言”到“行”的范式轉變,目前已經“百萬內測”開放申請;GLM-PC則是基于CogAgent模型的視覺理解和任務規劃能力,操作計算機的桌面應用,用戶通過簡單的一句話即可實現復雜任務的快速執行,同時具有任務規劃、屏幕界面信息理解的能力,能夠根據頁面信息進行計劃更改和自我糾錯,根據用戶的指令完成任務。
智譜 AI CEO張鵬表示,Al Agent今天非常火,從蘋果的 Apple Intelligence、谷歌的 Jarvis,到 OpenAI 即將發布的 Operator,全球科技巨頭紛紛布局。而國內智譜率先開放AutoGLM內測,已受到很多關注,過去一個月申請頁面已經有超過100萬的用戶訪問。
11月27日消息,昆侖萬維正式推出具有復雜思考推理能力的系列模型——「天工大模型4.0」 o1版(Skywork o1)。此次發布的Skywork o1包括三款模型:Skywork o1 Open、Skywork o1 Lite、Skywork o1 Preview。
據了解,Skywork o1是由昆侖萬維集團發布的具有慢思考推理能力的系列模型。這是國內第一款中文邏輯推理能力的o1模型。不同于現有的復現OpenAI o1模型的工作,Skywork o1不僅在模型輸出上內生了思考、計劃、反思等能力,同時,該開源模型在標準評測集上,對比普通模型推理能力大幅上升,真正讓模型擁有了思考和反思帶來的推理能力的提升。團隊復現o1的技術路線,使得初始推理能力較差的基座模型在基準測試集上成為生態位SOTA。
11月20日,昆侖萬維正式推出「天工大模型4.0」4o版(Skywork 4o),以及新產品「實時語音對話助手Skyo」。據了解,Skyo作為一個智能語音互動產品,具備快速響應、多語言對話能力,它能夠主動發起對話、實時打斷。同時,Skyo具備情感化反應和個性化聲音定制功能,為用戶帶來溫暖貼心的陪伴體驗。
外此,基于天工AI的大模型技術能力和AI搜索功能,Skyo能克服大模型幻覺問題,在對話中回復真實內容。
11月16日消息,月之暗面宣布:發布數學大模型k0-math。這是該公司首次推出推理能力強化模型產品,發布時間就在o1-preview推出的2個多月后。
11月27日消息,該數學推理模型已經上線網頁版,用戶可以拿數學難題去考驗AI的解題能力。Kimi相關負責人表示,該模型在做了大量的數學思維訓練之后,不僅會做數學題,還具備了極強的綜合邏輯思維能力,面對非數學問題,也可以給出自己的思考。
最近兩天,月之暗面的仲裁糾紛持續發酵。金沙江創投主管合伙人朱嘯虎公開“炮轟”前金沙江創投主管合伙人張予彤,認為其隱瞞在月之暗面的股權激勵,并指出月之暗面在拿到循環智能幾個投資方的同意豁免書之前開始融資,次程序過程存在問題,對月之暗面的豁免協議也可以被認為無效。
對此,楊植麟出面回應,感謝投資人,并確認張予彤作為聯創加入月之暗面,并透露,迄今為止張予彤在業務、戰略以及多場融資戰役中對公司做出了重要貢獻,月之暗面授予張予彤股份的本質是其作為月之暗面聯合創始人對公司后續多年持續工作的對價。
朱嘯虎在楊植麟回應后馬上表態,認為楊植麟回避了關鍵問題:
1、書面溝通是不夠的,需要嚴格的按照公司章程,股東決議(每一輪股東多數的簽字);董事決議有利益沖突的董事必須明示并申請回避,不能隱瞞欺騙。
2、利益沖突必須第一天就披露,900萬股是第一天就給的,并不是后面陸續給的,而且不是簡單的沒有披露,而是設計了很多方式(代持,投很少的錢來欲蓋彌彰)來隱瞞欺騙。雖然是月之暗面,但希望所有的行為都能在太陽底下,堂堂正正。
圍繞月之暗面的風波還未結束,無論后續事件會如何發展,都將是AI創投圈一個標志性事件。
快手
11月11日消息,快手可靈AI正式推出獨立App,已在蘋果App Store及多個安卓商店陸續上架。可靈AI App的核心功能為AI視頻生成和編輯,支持文生視頻和圖生視頻,目前有可靈1.0和1.5兩個版本模型可供選擇,其中1.0模型擁有更強大的可控生成能力,而1.5模型可直出1080p高清視頻、提高畫面美感。同時,針對已生成的視頻提供續寫功能,最長可續寫生成約3分鐘視頻。
11月20日消息,在快手三季度業績電話會上,快手科技創始人兼首席執行官程一笑表示,可靈 AI 自問世以來,服務用戶已超 500 萬,累計生成 5100 萬個視頻,超 1.5 億張圖片, 9 月實現了月活超 150 萬,商業化單月流水超千萬人民幣
11月25日消息,快手可靈AI在全球上線業內首個視頻模型定制功能,創新性解決了AI視頻生成中人物IP穩定性難題。目前,用戶可在可靈AI web端使用該功能訓練定制人臉模型,并參照該模型繼續生成視頻內容,滿足用戶創作多個包含同一人物鏡頭的訴求。此外,可靈1.5模型也迎來再次升級,支持在圖生視頻高品質模式下,使用多達六種運鏡控制方式和運動筆刷功能。
11月27日消息,獵戶星空聯合聚云科技舉辦了題為《Data Ready for Al,MoE大模型發布暨商業閉環分享》媒體見面會。獵戶星空正式發布了自主研發的Orion-MoE8×7B大模型,并攜手聚云科技推出了基于該大模型的數據服務產品——AI數據寶AirDS(AI-Ready Data Service)。
這兩項重要成果的發布,不僅標志著獵戶星空在AI技術領域的又一重大突破,更為AI行業商業化進程注入新動能。