精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
張文宇:DeepSeek從“彎道超車”到“換道超車”

浙江財經大學供圖

這個春節的喜慶,相當一部分是DeepSeek給的。杭州深度求索人工智能(AI)基礎技術研究有限公司(DeepSeek)作為2025年春節的“王炸”,其發布的大語言基座模型DeepSeek-V3與推理模型DeepSeek-R1,不久前在中國地區與美國地區應用商店App下載排行榜折桂,也使得微軟、英偉達、亞馬遜、英特爾等科技巨頭爭相上線DeepSeek模型服務,這震撼了全世界AI領域與金融領域,更是讓國人揚眉吐氣過了個大年。回想起在2023年的春節前不久,美國大語言模型ChatGPT狂飆登臺,而當時我國卻還沒有推出可商用的國產AI大模型;在2024年春節期間,美國多模態大模型Sora橫空出世,雖然當時國產大模型已處于跟跑階段,但仍然讓國人為中美之間的AI差距捏一把汗,甚至擔憂中美之間的AI差距越來越大。

DeepSeek的橫空出世,讓國產大模型從跟跑國際頂尖大模型的階段一舉躍升至與國際頂尖大模型的并跑階段,我們從中又能得到哪些啟示?

從“技術跟跑”到“技術并跑”

當美國Open AI公司于2022年11月份推出ChatGPT時,美國在大模型領域處于明顯優勢地位。由于當時的中國還沒有可商用的國產大模型,中文互聯網上一片驚呼“狼來了”。但事實上,中國的部分高科技企業與學術界已經跟跑美國大模型數年了,只是尚未推出商用版而已。到了2023年3月份開始,國產大模型開始像下水餃似地紛紛推向市場。不過,早期的國產大模型與國際頂尖大模型水平相較還是有一到兩個技術代差。好多人測試早期的國產大模型時還鬧出了不少笑話。例如讓它畫一個胸有成竹的男人,竟畫出了身上插滿了竹子的男人。早期的個別國產AI大模型雖然幼稚了些,但其敢于亮劍的精神,依然值得尊敬。

經過數年的技術跟跑階段,中國DeepSeek大模型一經推出即登C位。簡單來看,DeepSeek-R1在數學、代碼、自然語言對話等任務上的性能,都可以比肩OpenAI GPT-o1,實現了與國際頂尖大模型的技術并跑。其最核心的優勢在于對人工智能三要素(數據、算力、算法)等進行了系統級協同創新與工程優化。例如:在數據方面,與OpenAI“海量數據投喂”的方式不同,DeepSeek把數據進行總結和分類,經過選擇性處理之后,輸送給大模型,提高了訓練效率。在算力方面,與OpenAI“算力大氣粗”的方式不同,DeepSeek對低配版GPU集群(甚至多源異構算力)進行智能管理,打破了“大力才能出奇跡”的算力魔咒。在算法方面,與OpenAI打造“全能大模型”的方式不同,DeepSeek進行了基于群智協同的系統工程優化,主要包括混合專家模型、負載均衡、多頭潛在注意力機制、大小模型協同、強化學習推理,以及諸如FP8混合精度和負載均衡、通信優化、內存優化、計算優化等工程優化方法。

DeepSeek-R1的輸出價格為2.19美元/百萬Token,相對于GPT-o1的60美元/百萬Token,價格下降了近30倍。

從“彎道超車”到“換道超車”

DeepSeek的大膽創新震撼了全世界的AI領域與金融領域,不少人驚呼:中國大模型一夜之間實現了對美國的彎道超車。但科技領域的創新不可能一蹴而就或輕易實現彎道超車的,而是需要長期的孵化后才能厚積薄發。DeepSeek是2023年7月份才成立公司,表面上讓人感覺是短時間內實現了對OpenAI的彎道超車。但早在2008年起,DeepSeek創始人梁文峰便開始帶領團隊研發機器學習、深度學習等技術探索全自動量化交易,這意味著團隊在深度學習領域已經深耕16載了。

DeepSeek成立公司后,當時的國際背景是OpenAI剛在2024年2月15日推出Sora之后,又于2024年5月14日又推出了可實時進行音頻、視覺和文本推理的升級大模型GPT-4o。“o”代表“omni”,代表“全能”。這使得中美AI大模型競爭局勢進一步升級。當時,國產大模型與國際頂尖大模型確實存在著技術上的代差。但是,若在“卷算力”賽道上盲目跟跑美國、進而實現“彎道超車”并不明智。以2016年的人機圍棋大賽為例,表面上是英國DeepMind公司出品的AlphaGo以4:1贏了韓國9段棋手李世石。但是,當時訓練AlphaGo花費了40天,需要耗費算力、電力合計約3500萬美元,且每下一局還要耗費約3000美元,而李世石下一盤棋只花費了2碗米飯。可見在資源受限的情況下實際是人類贏了。因此,通用人工智能AGI的發展方向應該借鑒人類大腦的進化路徑。

于是,DeepSeek不懼個別國家發起的“芯片禁令”和構筑的“小院高墻”,開始在算力資源受限下另辟蹊徑,通過對人工智能三要素(數據、算力、算法)等進行了一系列的系統級協同創新與工程優化,并選擇向全世界開源,這無疑走出了與OpenAI等國外公司不同的技術路線,可謂是一個“筋斗云”實現了“換道超車”。與其說DeepSeek在性價比上超越了OpenAI,更準確的表達應該是在國際大模型賽道又做了新一輪的迭代,這也是DeepSeek對大模型進行開源的初衷。

從“差距越來越大”到“差距越來越小”

當美國Open AI公司于2024年2月15日推出Sora時,正值中國正月初六。由于Sora在視頻生成能力上一騎絕塵,遠超當時國產的多模態大模型,使得中文互聯網上一片驚呼“連個年都沒有過好,難道中美之間的AI差距進一步拉大了”。但自從DeepSeep這匹黑馬通過“小米加步槍戰勝飛機大炮”的方法殺出算力圍堵的重圍后,有人又覺得中國AI已經完全突破了“芯片禁令”和 “小院高墻”,甚至已經遙遙領先美國了。

Meta創始人兼CEO扎克伯格表示:“DeepSeek非常先進,中美之間的AI差距已經非常小”。斯坦福大學計算機科學系客座教授吳恩達力挺DeepSeek:“中國在生成式 AI 領域正趕超美國”。確實,DeepSeek縮短了中美之間的AI差距,但遠遠達不到中國AI已經遙遙領先。無論是唱衰中國AI水平還是“捧殺”中國AI水平,兩者都不可取。

AI產業分基礎層、技術層、應用層。我國在AI應用層處于國際領跑,在AI技術層處于國際并跑,在AI基礎層處于國際跟跑。無論是OpenAI還是DeepSeek,它們都基于美國谷歌公司在2017年提出的Transformer架構,不屬于從0到1的顛覆性基礎理論創新,皆屬于從1到100的大規模工程整合創新。DeepSeek的創新更是包含了一種從架構設計到工程優化全流程的系統級技術突破與技術創新。

我國在AI基礎層目前尚處于國際跟跑,主要原因包括:(1)雖然我國的數據總量超過美國的數據總量幾十倍,但我國高質量的數據量不足;(2)我國的算力總量不小,僅略低于美國,但高端智能算力缺口很大;(3)雖然我國的AI工程師與AI創業者總量全球第一,但我國頂尖AI科學家數量還不足。未來AGI賽道的核心競爭力更會來自于基礎層的大數據、大算力與強算法。我國在AI基礎層與國際先進水平的差距當然會影響中國版AGI的性能。因此,要改變這個局面,中國科技人才、包括青年學生需要在基礎研究、特別是從0到1的創新上有更多的定力、花更大的功夫。以后,中美之間在AGI賽道上你追我趕會是常態,中國不會永遠是跟跑,也常常會領跑,但目前還遠遠談不上遙遙領先。

當機器越來越像人,人要更像人

在AGI成為大趨勢、新質生產力成為熱詞的背景下,AI作為激發新質生產力的重要力量,帶來的是巨大的“AI+X”人才需求缺口。但培養適應AGI時代的人才,常常面臨學科跨界與人機跨界的雙重挑戰。這樣的跨界不僅僅是人機物的三元融合,更是思維、認知和組織結構的跨越。隨著弱AI向AGI邁進,可謂是人類為機器打開了籠子。然而,部分學生還在采取上一代人的學習方法,花費大量時間對知識點進行反復地死記硬背,提高自己的重復腦力勞動能力,這簡直是把自己關進了刷題的籠子啊。但是,人的腦算力能快得過云計算嗎?人的腦容量能趕得上大數據嗎?不管人類的重復腦力勞動能力有多厲害,在機器面前都是小兒科。過于大量刷題就像現在的士兵花費大量時間去耍大刀一樣毫無意義。

在工業文明時代大顯身手的愛迪生有句名言:“天才來自1%的靈感和99%的汗水”。但隨著ChatGPT敲開了AGI大門后,99%的搬磚汗水將會逐漸被機器所取代,只有那1%的人類靈感是不容易被機器取代的。因此,在讀書階段,年輕學子要用基于自主學習的創新汗水去灌溉那1%的人類靈感——蘊含著人類意識與人性光輝的基礎創新、平臺創新、內容創新、模式創新以及文理商工跨學科融合創新能力,提升自己的人機協同能力、并鶴立機群。當機器越來越想人,人要更像人。

目前,浙江大學、復旦大學、浙江財經大學等高校已將人工智能作為全校大學生通識必修課程,并且推出了“AI+X”微專業,以進一步加強人工智能通識教育和交叉學科教育。浙江省多地的大中小學AI教育一體化建設也已經得以有利推進。例如,在浙江財經大學的支持下,杭州市青少年科技教育協會發起了“以AI為愛,溫暖起跑線”行動,為廣大中小學生推出了一系列的AI公益講座、AI玩樂會、AIGC實操等活動,這啟迪了廣大青少年的創新能力和AI應用實踐能力,并共同探尋“人機共智”的“青春路徑”。

(張文宇:浙江財經大學盈陽金融科技學院院長、浙江財經大學人工智能研究院院長、二級教授、博士生導師)

“轉載請注明出處”

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
人工智能[1504]周鴻祎:Sora意味著AGI實現將從10年縮短到1年
2024,“大模型六小虎”逐夢AI圈
從Chatgpt到文生視頻Sora,AI給文化產業帶來了哪些機遇和挑戰?
楊立昆狠批Sora不是世界模型,生成式路線注定失敗
智譜 AI完成新一輪融資,CEO張鵬:正加緊布局Sora領域技術|鈦媒體AGI
對標OpenAI?智譜AI與200+企業共創國產大模型商業化
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 娱乐| 关岭| 江都市| 阿拉善右旗| 泾源县| 梨树县| 宝应县| 湾仔区| 高密市| 聂荣县| 临武县| 淳化县| 宁安市| 中牟县| 罗江县| 秦安县| 屏边| 武邑县| 建阳市| 陆丰市| 边坝县| 长乐市| 滨州市| 武山县| 灵寿县| 故城县| 张掖市| 潼南县| 遵义县| 华坪县| 工布江达县| 昌吉市| 克拉玛依市| 娱乐| 东港市| 霍林郭勒市| 临安市| 五大连池市| 葵青区| 雷州市| 长泰县|