作者 | 萬泉河
編輯 | 阿文
AI少閑月,五月人倍忙。
5月的AI行業格外熱鬧。國外,OpenAI、谷歌、微軟相繼發布了AI在多模態和端側應用的新產品GPT-4o、Astra和AI PC ,賺足看客眼球的同時,競爭的硝煙也在彌漫。
而國內,大模型廠商的競爭則更直接和露骨,他們沒有征兆地開啟了價格戰。沒有鋪墊和試探,降價幅度堪比蹦極,仿佛置身“618大促”直播間,賣貨主播聲嘶力竭地喊:“幫家人們把大模型價格打下來!”。
很多人認為價格戰的導火索是字節的豆包大模型降價,其實并不準確。真正打響第一槍的是幻方旗下的大模型公司DeepSeek,它于5月6日開源了DeepSeek-V2,并將輸入價格定為1元/百萬tokens,僅為GPT-4-Turbo價格的近百分之一。
隨后智譜AI入局,宣布個人版GLM-3Turbo模型產品的調用價格下調80%,輸入價格也定為1元/百萬tokens。
接下來,云廠商的加入把戰斗推向高潮,這下整個“晉西北”正式亂成一鍋粥了。
5月15日,字節宣布豆包主力模型Doubao-pro-32k輸入價格定價0.8元/百萬tokens;5月21日,阿里云宣布旗下九款通義大模型全降價,其中對標GPT-4的主力模型Qwen-Long價格直降97%,來到了0.5元/百萬tokens。
阿里云這邊剛起鍋燒水,百度過來就把爐子拆了。通義宣布降價僅幾小時后,百度可能懶得算那幾塊幾毛的賬了,直接把兩款文心輕量級模型ERNIE Speed和ERNIE Lite免費了。
百度把調子起高了,后邊上臺的選手也只能硬著頭皮唱。5月22日,科大訊飛宣布訊飛星火Lite API調用免費;“跟跑大師”騰訊云隨即也宣布旗下混元模型混元-lite免費、混元-standard-256k輸入價格下調87.5%,降至15元/百萬tokens。
透過現象看本質,國內外的動作雖不相同,但都隱隱指明了當下大模型廠商的發力方向——大模型應用的落地。
阿里云智能集團資深副總裁劉偉光明確指出,大幅降低大模型推理價格的目的,在于加速AI應用的爆發。
從行業角度看的確如此,但降價幅度如此之大、且降價的均是API調用費而不是訂閱費等特點來看,本次價格戰廠商們爭奪的目標就是B端客戶和開發者,一方面。通過降價甚至免費的方式增加自家大模型調用量,是一種推銷、引流手段。
另外,更多客戶使用大模型各自場景里做數據、做微調來優化模型,也能促進更多AI應用的誕生,進而與大模型更深層次綁定。
另一方面,大模型能如此大幅度的降價,其推理成本肯定通過某種方式實現了降低,推理成本的下降得益于模型優化技術的快速迭代。
阿里云表示,通過構建彈性的AI算力調度系統并結合百煉分布式推理加速引擎,阿里云優化了大規模推理集群,大幅壓縮了模型推理成本并加快推理速度。
火山引擎總裁譚待在豆包大模型發布后表示,字節通過優化模型結構、將單機推理改為分布式推理、混合調度云計算算力等方式優化了成本。
DeepSeek 相關負責人此前表示,DeepSeek-V2通過MoE模型架構實現了模型結構創新,成本降低的同時,功能也更加強大。
本次價格戰,真正把戰火擴大的是云廠商。云廠商具備算力集中和規模效應優勢,大模型落地是工程化實踐,工程化做得越好,大模型成本也就降得越低。
最后還有一點原因不得不提,宣布超低價、免費的很多都是輕量級模型。比如百度宣布免費的ERNIE Speed和ERNIE Lite,是兩款輕量級模型,支持8k和128k上下文長度。
雖有誠意不大的嫌疑,但大部分用戶的場景可能也不需要太大的參數。就像只玩掃雷,就沒必要給電腦配個4090顯卡。輕量級模型也許剛好能滿足使用場景,價格還更低,“效價比”拉滿。
不過從這里也能看出很多廠商既要流量,又要賺錢的心思。先用低價產品“請君入甕”,培養用戶粘性。后續就可以用各種方式刺激用戶使用高性能模型了,這些模型可并不便宜。就像網盤和下載工具,免費體驗付費才有的高速下載,久而久之有的用戶自然就忍不了免費但很慢的下載速度了。
這次的大模型的降價真正的誠意有多少呢?會不會像一些游戲廣告,宣傳“注冊送手機”,結果想要領取需要達成海量前置條件呢?
拿豆包大模型來看,其通用模型pro-32k版推理輸入價格為0.8元/百萬tokens,宣稱比行業低99.3%。乍一看很便宜,但這是輸入價格,其輸出價格為2元/百萬tokens,加權平均輸入輸出后,綜合收費為1元/百萬tokens。很多大模型和豆包一樣,降價公告著重宣傳輸入價格的低廉,而對輸出價格和綜合費用等閉口不談。
豆包的價格規則最離譜的地方是其限制RPM為60,意思是只有每分鐘60個請求的話,才是這個價格。可在真實的業務場景中,如果用戶想高頻次調用模型,那抱歉,沒有這個優惠了。
另外,如前所述,很多參與降價的輕量級模型,等于是給了用戶一個“閹割版”大模型,無論從參數、生成速度,還是功能上肯定都是大打折扣的。當期無法滿足用戶需求時,用戶可能會選擇價格更昂貴的同廠商的高性能大模型。
雖說這些都是正常的商業宣傳行為,但勢必會對很多沒加入價格戰的創業公司帶來巨大打擊。不同于云廠商大模型的背靠大樹好乘涼,很多創業公司承受不住如此大的降價。
所以本次價格戰并沒有卷入太多創業公司,也有人對價格戰的行為表示不理解。“我覺得大模型公司不會這么不理智,因為技術是最重要的,如果技術不行,純粹靠貼錢方式去做生意,我們絕對不會跟這樣的定價做對標。如果以后中國就這么卷,大家寧可賠光通輸都不讓你贏,那么我們就走海外市場。”零一萬物創始人李開復如是說。
這次的價格戰本質上還是在技術遇到瓶頸、產品同質化嚴重的大環境下,大模型廠商寧愿燒錢也要打淘汰賽,今年注定會再次上演大模型行業新一輪淘汰賽。
正如云計算市場的競爭,大模型的價格戰一經開打就很難回頭,這種非良性的競爭狀態或許會長期持續。
硝煙散去,滿地狼藉,可能剩者為王,也可能全盤皆輸。