精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
視覺模型訓(xùn)練成本一年下降80%,中國AI廠商“掀起”全球算力降價潮

2024年過去,AI又走過了狂奔的一年,大模型加速落地的熱切、應(yīng)用場景創(chuàng)新的火熱和高投入、商業(yè)化緩慢帶來的“下牌桌”焦慮同時處在這個行業(yè)。

回過頭看來,過往行業(yè)共識的一些問題在2024年中被打上了問號,例如智能算力還是否短缺、中國AI企業(yè)的“算力焦慮”是必要的嗎?Scaling Law(規(guī)模法則)還值得信仰嗎?

辭舊迎新之際,中國AI行業(yè)的“拐點”時刻更受關(guān)注。不再統(tǒng)一的答案背后,值得關(guān)注的是,對中國AI企業(yè)來說,一些好的變化正在發(fā)生,也有更多挑戰(zhàn)等待2025年去回答。

訓(xùn)練成本下降

2024年12月27日,海外社交媒體平臺X被來自中國的大模型DeepSeek-V3刷屏,這一模型能力對標(biāo)頭部模型,但訓(xùn)練的預(yù)算卻非常低,“2048個GPU、2個月、近600萬美元”,相比之下,GPT-4o等模型的訓(xùn)練成本約為1億美元,至少在萬個GPU量級的計算集群上訓(xùn)練。

這是一項展現(xiàn)了極致性價比的訓(xùn)練成本數(shù)據(jù)。在已開源的論文中,幻方量化旗下AI公司深度求索(DeepSeek)強調(diào)了DeepSeek-V3訓(xùn)練成本較低——通過對算法、框架和硬件的優(yōu)化協(xié)同設(shè)計,在預(yù)訓(xùn)練階段,模型每訓(xùn)練1萬億token僅需要18萬個GPU小時,即在團(tuán)隊配備2048個H800 GPU的集群上只需3.7天,也就是說,團(tuán)隊的預(yù)訓(xùn)練在不到2個月的時間完成。加上后訓(xùn)練,DeepSeek-V3完整訓(xùn)練消耗了278.8萬個GPU小時。假設(shè)H800 GPU的租用價格為每塊GPU 2美元/小時,DeepSeek-V3的全部正式訓(xùn)練成本總計僅為557.6萬美元。

DeepSeek的成功并非個例,值得關(guān)注的是,在英偉達(dá)顯卡等高端算力資源受限的情況下,2024年,許多中國AI企業(yè)正在找到降低訓(xùn)練成本的方法。

極佳科技聯(lián)合創(chuàng)始人兼首席科學(xué)家朱政向第一財經(jīng)記者透露,過去一年,極佳科技訓(xùn)練大模型的成本也在大規(guī)模下降。朱政介紹,之前極佳科技訓(xùn)練一個視覺模型大概需要500萬美金,基本上是一個語言模型的1/10,但現(xiàn)在他們已經(jīng)把這個成本降到了100萬美金以下。

從訓(xùn)練成本的降低來看,朱政表示“方法有很多”,一方面,大模型公司正在關(guān)注與云廠商加強合作,通過做一些訓(xùn)練加速、通訊優(yōu)化、設(shè)置優(yōu)化等降低成本。同時,行業(yè)對數(shù)據(jù)優(yōu)化也更為重視,之前行業(yè)用Scaling Law只是在對數(shù)據(jù),但對完數(shù)據(jù)后并沒有做非常多相應(yīng)的優(yōu)化,事實上數(shù)據(jù)優(yōu)化帶來的訓(xùn)練效率提升空間也很大。

中國AI企業(yè)的“搶卡”焦慮也因此有所緩解,朱政表示,例如英偉達(dá)最新發(fā)布的顯卡還是要買,得買最新的架構(gòu)的顯卡,但隨著訓(xùn)練效率的提升,需要的規(guī)模會下降。他同時表示,來到100萬美金以下,未來進(jìn)一步下探大模型的訓(xùn)練成本將是一件更困難的事情,可能不是一家企業(yè)能搞定的事情,可能需要訓(xùn)練框架的支持、編程語言的支持包括顯卡算式的支持。

從全行業(yè)的角度來看,螞蟻集團(tuán)科技戰(zhàn)略與執(zhí)行部副總經(jīng)理彭晉對第一財經(jīng)記者表示,在采購先進(jìn)算力有些困難的情況下,國內(nèi)也在推進(jìn)國產(chǎn)算力的替代,各大公司都在不斷采購一些國產(chǎn)算力,從螞蟻的實踐來看,國產(chǎn)算力已經(jīng)可以支撐很大規(guī)模,比如在千億參數(shù)甚至以上規(guī)模的模型訓(xùn)練中國產(chǎn)算力是沒有問題的。至于到下一步,例如說要建十萬卡規(guī)模的集群,國產(chǎn)算力能否支撐有待進(jìn)一步檢驗。

“遠(yuǎn)慮”仍存,但走過2024年,中國企業(yè)的“算力焦慮”正在回歸理性。

未來趨勢

2025年,中國AI行業(yè)會有哪些變化?

北京智源人工智能研究院在《2025十大AI技術(shù)趨勢》報告中指出,從基礎(chǔ)設(shè)施到產(chǎn)品應(yīng)用,Scaling Law、基礎(chǔ)模型、具身智能、超級應(yīng)用、AI安全等AI發(fā)展的關(guān)鍵方向都可能在2025年迎來新的變化。

報告認(rèn)為,AI4S驅(qū)動科學(xué)研究范式變革;具身智能領(lǐng)域具身大小腦和本體的協(xié)同進(jìn)化;統(tǒng)一的多模態(tài)大模型實現(xiàn)更高效AI;Scaling Law擴展向RL LLMs,模型泛化從預(yù)訓(xùn)練向后訓(xùn)練、推理遷移;世界模型加速發(fā)布,有望成為多模態(tài)大模型的下一階段;合成數(shù)據(jù)成為大模型迭代與應(yīng)用落地的重要催化劑;推理優(yōu)化迭代加速,成為AI Native應(yīng)用落地的必要條件;Agentic AI成為產(chǎn)品落地的重要模式;AI應(yīng)用將迎來Super APP以及AI安全治理體系的持續(xù)完善將成為2025年AI技術(shù)發(fā)展的十大趨勢。

不少中國自研的技術(shù)和產(chǎn)品讓業(yè)內(nèi)看到了這些趨勢的到來。2024年9月,螞蟻發(fā)布了支小寶、螞小財?shù)认盗蠥I管家產(chǎn)品,探索更多服務(wù)類智能體形態(tài),2024年10月,智源研究院發(fā)布了完全自研的基于自回歸技術(shù)的原生多模態(tài)世界模型Emu3,實現(xiàn)了視頻、圖像、文本三種模態(tài)的統(tǒng)一理解和生成,2024年年底,豆包月活躍用戶數(shù)達(dá)到了7116萬,成為國內(nèi)第一、全球第二的AI原生應(yīng)用。

智能研究院行業(yè)研究組負(fù)責(zé)人倪賢豪提到,走過2024年全年來看,與2023年相比,國內(nèi)AI整體的應(yīng)用熱度已明顯升溫,相比2023年第一季度,他所在的團(tuán)隊調(diào)研到,2024年第四季度,整個基礎(chǔ)模型的垂直產(chǎn)業(yè)鏈以及其他賽道AI應(yīng)用的成熟度已有了明顯提升,例如AI在3D內(nèi)容、AI硬件等場景的應(yīng)用以及醫(yī)療文獻(xiàn)處理等未來場景的探索中,都有了明顯拓展。

從國內(nèi)大模型公開中標(biāo)項目的類型分布來看,2024年10月,大模型應(yīng)用類項目數(shù)量首次超過了算力類項目,應(yīng)用類大模型招標(biāo)項目占比已達(dá)到56%,國產(chǎn)大模型在垂直行業(yè)實現(xiàn)了加速落地,或是在諸多中大型企業(yè)扮演中臺性質(zhì)的基礎(chǔ)設(shè)施。

AI應(yīng)用領(lǐng)域的Super APP能否在2025年出現(xiàn)同樣受到業(yè)內(nèi)關(guān)注。從C端的用戶規(guī)模、交互頻次、停留時長等維度來看,目前,國產(chǎn)AI應(yīng)用尚未出現(xiàn)爆發(fā)式增長,倪賢豪表示,隨著大模型推理成本的下降,包括開發(fā)工具的適配、框架的創(chuàng)新以及應(yīng)用安全、決策的可解釋性、魯棒性等問題的解決,未來,推動Agent解決復(fù)雜問題的能力提升將變得更有可能也更關(guān)鍵。他認(rèn)為,從用戶視角切入,以需求反推技術(shù)或許能撬動AI應(yīng)用的用戶存量和增量市場,Super APP在2025年的誕生值得期待。

“當(dāng)前,我們處在人工智能發(fā)展的新拐點,大模型的能力涌現(xiàn)加速通用人工智能時代的到來,原生統(tǒng)一多模態(tài)、具身智能、AI for Science,將進(jìn)一步深化人工智能對世界的感知、理解與推理,連接數(shù)字世界與物理世界,驅(qū)動科學(xué)研究創(chuàng)新突破。”智源研究院院長王仲遠(yuǎn)表示。

(本文來自第一財經(jīng))

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Deepseek V3到底顛覆了什么
幻方大模型概念股梳理
估值2000億!榮耀I(xiàn)PO進(jìn)程漸近
大模型預(yù)訓(xùn)練“狼人殺”,是誰悄悄掉隊了?
大模型“免費”送,廠商們圖什么?
AI領(lǐng)域“神秘東方力量”震驚世界,英偉達(dá)的最大空頭出現(xiàn)了
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 柯坪县| 和平县| 松滋市| 贵港市| 新乡县| 休宁县| 横山县| 青州市| 泽州县| 遂平县| 宁陕县| 梅河口市| 拉萨市| 滨海县| 扎鲁特旗| 普安县| 墨江| 大姚县| 舞钢市| 永康市| 安义县| 泾川县| 昌平区| 武乡县| 宿松县| 淮阳县| 甘谷县| 辛集市| 泽州县| 双江| 长春市| 潢川县| 信阳市| 霍山县| 茂名市| 水城县| 谢通门县| 新绛县| 大理市| 化州市| 南昌县|