精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
大模型“618大促”,硝煙下的真相
userphoto

2024.05.24 河北

關注

作者 | 萬泉河

編輯 | 阿文

看得見的硝煙

AI少閑月,五月人倍忙。

5月的AI行業格外熱鬧。國外,OpenAI、谷歌、微軟相繼發布了AI在多模態和端側應用的新產品GPT-4o、Astra和AI PC ,賺足看客眼球的同時,競爭的硝煙也在彌漫。

而國內,大模型廠商的競爭則更直接和露骨,他們沒有征兆地開啟了價格戰。沒有鋪墊和試探,降價幅度堪比蹦極,仿佛置身“618大促”直播間,賣貨主播聲嘶力竭地喊:“幫家人們把大模型價格打下來!”。

很多人認為價格戰的導火索是字節的豆包大模型降價,其實并不準確。真正打響第一槍的是幻方旗下的大模型公司DeepSeek,它于5月6日開源了DeepSeek-V2,并將輸入價格定為1元/百萬tokens,僅為GPT-4-Turbo價格的近百分之一。

隨后智譜AI入局,宣布個人版GLM-3Turbo模型產品的調用價格下調80%,輸入價格也定為1元/百萬tokens。

接下來,云廠商的加入把戰斗推向高潮,這下整個“晉西北”正式亂成一鍋粥了。

5月15日,字節宣布豆包主力模型Doubao-pro-32k輸入價格定價0.8元/百萬tokens;5月21日,阿里云宣布旗下九款通義大模型全降價,其中對標GPT-4的主力模型Qwen-Long價格直降97%,來到了0.5元/百萬tokens。

阿里云這邊剛起鍋燒水,百度過來就把爐子拆了。通義宣布降價僅幾小時后,百度可能懶得算那幾塊幾毛的賬了,直接把兩款文心輕量級模型ERNIE Speed和ERNIE Lite免費了。

百度把調子起高了,后邊上臺的選手也只能硬著頭皮唱。5月22日,科大訊飛宣布訊飛星火Lite API調用免費;“跟跑大師”騰訊云隨即也宣布旗下混元模型混元-lite免費、混元-standard-256k輸入價格下調87.5%,降至15元/百萬tokens。

透過現象看本質,國內外的動作雖不相同,但都隱隱指明了當下大模型廠商的發力方向——大模型應用的落地。

降價空間從何而來?

阿里云智能集團資深副總裁劉偉光明確指出,大幅降低大模型推理價格的目的,在于加速AI應用的爆發。

從行業角度看的確如此,但降價幅度如此之大、且降價的均是API調用費而不是訂閱費等特點來看,本次價格戰廠商們爭奪的目標就是B端客戶和開發者,一方面。通過降價甚至免費的方式增加自家大模型調用量,是一種推銷、引流手段。

另外,更多客戶使用大模型各自場景里做數據、做微調來優化模型,也能促進更多AI應用的誕生,進而與大模型更深層次綁定。

另一方面,大模型能如此大幅度的降價,其推理成本肯定通過某種方式實現了降低,推理成本的下降得益于模型優化技術的快速迭代。

阿里云表示,通過構建彈性的AI算力調度系統并結合百煉分布式推理加速引擎,阿里云優化了大規模推理集群,大幅壓縮了模型推理成本并加快推理速度。

火山引擎總裁譚待在豆包大模型發布后表示,字節通過優化模型結構、將單機推理改為分布式推理、混合調度云計算算力等方式優化了成本。

DeepSeek 相關負責人此前表示,DeepSeek-V2通過MoE模型架構實現了模型結構創新,成本降低的同時,功能也更加強大。

本次價格戰,真正把戰火擴大的是云廠商。云廠商具備算力集中和規模效應優勢,大模型落地是工程化實踐,工程化做得越好,大模型成本也就降得越低。

最后還有一點原因不得不提,宣布超低價、免費的很多都是輕量級模型。比如百度宣布免費的ERNIE Speed和ERNIE Lite,是兩款輕量級模型,支持8k和128k上下文長度。

雖有誠意不大的嫌疑,但大部分用戶的場景可能也不需要太大的參數。就像只玩掃雷,就沒必要給電腦配個4090顯卡。輕量級模型也許剛好能滿足使用場景,價格還更低,“效價比”拉滿。

不過從這里也能看出很多廠商既要流量,又要賺錢的心思。先用低價產品“請君入甕”,培養用戶粘性。后續就可以用各種方式刺激用戶使用高性能模型了,這些模型可并不便宜。就像網盤和下載工具,免費體驗付費才有的高速下載,久而久之有的用戶自然就忍不了免費但很慢的下載速度了。

嘗鮮大模型,或許有“坑”

這次的大模型的降價真正的誠意有多少呢?會不會像一些游戲廣告,宣傳“注冊送手機”,結果想要領取需要達成海量前置條件呢?

拿豆包大模型來看,其通用模型pro-32k版推理輸入價格為0.8元/百萬tokens,宣稱比行業低99.3%。乍一看很便宜,但這是輸入價格,其輸出價格為2元/百萬tokens,加權平均輸入輸出后,綜合收費為1元/百萬tokens。很多大模型和豆包一樣,降價公告著重宣傳輸入價格的低廉,而對輸出價格和綜合費用等閉口不談。

豆包的價格規則最離譜的地方是其限制RPM為60,意思是只有每分鐘60個請求的話,才是這個價格。可在真實的業務場景中,如果用戶想高頻次調用模型,那抱歉,沒有這個優惠了。

另外,如前所述,很多參與降價的輕量級模型,等于是給了用戶一個“閹割版”大模型,無論從參數、生成速度,還是功能上肯定都是大打折扣的。當期無法滿足用戶需求時,用戶可能會選擇價格更昂貴的同廠商的高性能大模型。

雖說這些都是正常的商業宣傳行為,但勢必會對很多沒加入價格戰的創業公司帶來巨大打擊。不同于云廠商大模型的背靠大樹好乘涼,很多創業公司承受不住如此大的降價。

所以本次價格戰并沒有卷入太多創業公司,也有人對價格戰的行為表示不理解。“我覺得大模型公司不會這么不理智,因為技術是最重要的,如果技術不行,純粹靠貼錢方式去做生意,我們絕對不會跟這樣的定價做對標。如果以后中國就這么卷,大家寧可賠光通輸都不讓你贏,那么我們就走海外市場。”零一萬物創始人李開復如是說。

這次的價格戰本質上還是在技術遇到瓶頸、產品同質化嚴重的大環境下,大模型廠商寧愿燒錢也要打淘汰賽,今年注定會再次上演大模型行業新一輪淘汰賽。

正如云計算市場的競爭,大模型的價格戰一經開打就很難回頭,這種非良性的競爭狀態或許會長期持續。

硝煙散去,滿地狼藉,可能剩者為王,也可能全盤皆輸。

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
百模大戰進入新階段,先把價格給大家打下來
大模型“價格戰”爆發,誰能搶占商業化制高點?|價格戰
大模型“以厘計價”,誰能扛住價格戰?
剛剛,字節跳動放大招!
抖音豆包成年輕人AI頂流!字節跳動大模型家族登場,tokens價格比行業低99%
AI逼近,張一鳴比馬云更危險
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 房产| 德昌县| 德格县| 英超| 分宜县| 拉萨市| 宁化县| 仁布县| 新巴尔虎左旗| 吉安市| 浪卡子县| 永定县| 教育| 东乌| 碌曲县| 松江区| 临湘市| 松滋市| 泾川县| 固安县| 巨鹿县| 祁门县| 宜城市| 岑巩县| 伊宁县| 右玉县| 姜堰市| 莱州市| 武川县| 甘南县| 霍山县| 东城区| 晋中市| 武定县| 左贡县| 普兰县| 襄樊市| 磴口县| 留坝县| 榆林市| 鱼台县|