作者丨燕大
1月20日,DeepSeek老板梁文峰進(jìn)京開會(huì)。
當(dāng)天晚上,DeepSeek(深度求索)的推理模型 DeepSeek-R1 發(fā)布,開源、免費(fèi)、可驗(yàn)證,因?yàn)樗麑⒓夹g(shù)報(bào)告也一同開源了。
沒人想得到,僅過4個(gè)工作日,這一家不起眼的小公司,竟掀翻了美國(guó)科技巨頭,一舉將中國(guó)大模型硬生生拉到世界領(lǐng)先水平。
墻內(nèi)開花墻外香,緩慢發(fā)酵數(shù)天后,首先被點(diǎn)“爆”的是大洋彼岸的科技界,接著這兩天“DeepSeek”(深度探索)這個(gè)英文在各大平臺(tái)沖上熱搜、頻繁刷屏。
就是這家來自中國(guó)的、名不見經(jīng)傳的小公司,卻在美東時(shí)間周一,讓美股震動(dòng),出現(xiàn)少有的暴跌,尤其是芯片、AI科技股。
標(biāo)普500指數(shù)跌了1.46%,納斯達(dá)克指數(shù)暴跌3.07%,科技巨頭方面,谷歌大跌4.03%,微軟下跌2,14%,最最意外的是,全球AI芯片的王者——英偉達(dá),在昨晚暴跌近17%,差點(diǎn)跌了近1/5!市值蒸發(fā)約6000億美元,約合4.27萬億人民幣!
外媒說這是史上最大的一次暴跌,心態(tài)都快跌崩了。
說出來你可能都不敢相信,這家來自中國(guó)的小公司——DeepSeek,背景是一家炒股的量化公司,名叫幻方量化,炒股的應(yīng)該都聽過。
同樣是炒股,量化私募公司不像干金融的,更像搞科研的,從創(chuàng)始人到員工,不少都是學(xué)計(jì)算機(jī)和數(shù)學(xué)的,崗位包括數(shù)據(jù)科學(xué)家、AI算法研究員、AI架構(gòu)工程師等,你還在用個(gè)人經(jīng)驗(yàn)炒股的時(shí)候,量化公司的決策早就依靠大數(shù)據(jù)和AI人工智能。
就好比幾十年前贏了國(guó)際象棋大師的計(jì)算機(jī),收割對(duì)手的不是另一個(gè)象棋高手,而是來自另一個(gè)領(lǐng)域的降維打擊。
這幾年在股市里,能賺到錢賺到打錢的,可能也就是量化私募公司了,跟玩?zhèn)€人經(jīng)驗(yàn)的完全不是一個(gè)級(jí)別。
說到這里,我都有種感覺,咱們的大A貌似都成了它訓(xùn)練超級(jí)大腦的超級(jí)“訓(xùn)練基地”。
DeepSeek公司,是梁文峰在幻方量化私募之外,于2023年5月搞的一個(gè)“副業(yè)”,單獨(dú)研究AI大模型技術(shù),沒有西方資本風(fēng)投,員工也多來自國(guó)內(nèi)高校剛畢業(yè)的大學(xué)生或AI 職業(yè)生涯剛起步的開發(fā)人員。
為什么不挖更有經(jīng)驗(yàn)的人?梁說話一段話,“如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗(yàn)的人是對(duì)的,但如果看長(zhǎng)遠(yuǎn),經(jīng)驗(yàn)就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛等,更重要。”
但沒想到,這個(gè)并不老練的團(tuán)隊(duì),僅用一年多時(shí)間,就推出了模仿人類思維的DeepSeek-R1,在數(shù)學(xué)、編程自然語言推理等任務(wù)上,性能比肩當(dāng)前“地球最強(qiáng)大腦”——OpenAI o1。
外國(guó)選手已經(jīng)驗(yàn)證,對(duì)比很直觀:
案例1,“編寫一個(gè) Python 腳本,讓黃色小球在正方形內(nèi)彈跳,確保正確處理碰撞檢測(cè)。讓正方形緩慢旋轉(zhuǎn)。用 Python 實(shí)現(xiàn)。確保小球停留在正方形內(nèi)”。
左邊是OpenAI o1,右邊是DeepSeek R1:
案例2,“要求實(shí)現(xiàn)一個(gè)帶有紅球的旋轉(zhuǎn)三角形。”
左邊是OpenAI o1,右邊是DeepSeek R1:
這兩個(gè)對(duì)比非常直觀,DeepSeek-R1在數(shù)學(xué)、編程等復(fù)雜推理的性能,與OpenAI o1旗鼓相當(dāng)甚至超越。
對(duì)咱們普通老百姓來說,輔導(dǎo)孩子做數(shù)學(xué)作業(yè)、編程作業(yè)甚至奧數(shù)都不用燒腦了,用這個(gè)app再簡(jiǎn)單不過。
在語言領(lǐng)域的性能,有從業(yè)者舉了個(gè)更通俗的比喻,用ChatGPT寫套路性很強(qiáng)的應(yīng)用文很好用;
但一旦涉及到高語境、調(diào)侃、諷刺之類,就有濃厚的AI味,沒有幽默感,但DeepSeek對(duì)高于境內(nèi)容和中文網(wǎng)絡(luò)上的梗都能理解明白,內(nèi)容可以達(dá)到脫口秀水平。
根據(jù)公布的技術(shù)文檔,DeepSeek-V3模型的訓(xùn)練成本只有557.3萬美元,使用的還是“閹割版”的英偉達(dá)H800 GPU集群。
而同樣是開源模型的Meta旗下某一模型的訓(xùn)練成本就超過6000萬美元,OpenAI-4o的訓(xùn)練成本為1億美元,且用的是性能更爆棚的英偉達(dá)H100 GPU集群。
換句話說,即使哪天DeepSeek模型要收費(fèi)了,估計(jì)也是白菜價(jià)。兩相對(duì)比,更差的裝備、更低的成本,卻干掉了裝備精良武裝到牙齒的王者,這你找誰說理去!
上架10天不到,用實(shí)力擊敗ChatGPT,登頂蘋果應(yīng)用商店排行榜。以極低的成本構(gòu)建出了一個(gè)突破性的人工智能模型,DeepSeek橫空出世,甚至導(dǎo)致一個(gè)籌集了10億美元的前沿實(shí)驗(yàn)室,因?yàn)楫a(chǎn)品比不過DeepSeek,連發(fā)布都不敢發(fā)布了。
到現(xiàn)在很多人也有點(diǎn)難以置信,中國(guó)一個(gè)不起眼的小公司,進(jìn)京開了個(gè)座談會(huì)后,發(fā)布的AI模型,竟然比肩甚至超越美國(guó)“最強(qiáng)大腦”O(jiān)penAI o1,真的匪夷所思。
但現(xiàn)實(shí)又再真實(shí)不過!DeepSeek的橫空出世,直接打破西方前沿科技只可追趕無法超越的神話。
其實(shí),關(guān)注時(shí)政的人應(yīng)該能察覺,1月20日,新聞聯(lián)播報(bào)道DeepSeek創(chuàng)始人梁文峰獲邀參加高層座談會(huì),就是個(gè)重大信號(hào)。
首先,肯定是這個(gè)小公司在AI領(lǐng)域有了特別重大突破;其次,就是這個(gè)突破在世界上都屬于領(lǐng)先。
要知道,這些年國(guó)家為了應(yīng)對(duì)西方科技封鎖,解決卡脖子問題,拉近中美之間硬科技的距離,急迫性,人所共知,要政策給政策、要錢給錢,普遍撒網(wǎng),為的就是有朝一日有人能夠取得突破性進(jìn)展。
在硬科技、前沿賽道上,國(guó)家高度關(guān)注,要不然也不會(huì)出現(xiàn)DeepSeek創(chuàng)始人在最新模型發(fā)布前進(jìn)京開會(huì)那一幕。
DeepSeek的橫空出世,讓美國(guó)科技圈睡不著覺,同樣也讓很多國(guó)人睡不著覺。
無他,實(shí)在是沖擊太大了,對(duì)國(guó)人來講,美國(guó)從0到1、中國(guó)從1到100是腦子里的固定模式,突然出現(xiàn)中國(guó)AI技術(shù)比肩甚至超越世界頂尖,非常不可思議。
其實(shí),中美網(wǎng)民小紅書對(duì)賬,讓很多國(guó)人對(duì)歐美文化、生活環(huán)境祛魅,而DeepSeek再一次證明,哪怕是前沿科技,也應(yīng)該對(duì)西方祛魅。
任正非說過,從國(guó)外引進(jìn)來的高新技術(shù),打開后發(fā)現(xiàn)竟是中國(guó)雞下的蛋。中國(guó)從來不缺人才,也不缺天才,缺的是敢想象,敢獨(dú)立自主走自己的路。
不起眼的小公司DeepSeek,靠性能較差的硬件和并不老練的團(tuán)隊(duì),掀翻英偉達(dá),有人說,這是以少勝多、以弱勝強(qiáng)。
但我認(rèn)為,這些都是表象,本質(zhì)上都是國(guó)運(yùn)加持罷了。