作為一家成立僅一年多的人工智能(AI)初創公司,DeepSeek憑借突破性的AI模型在硅谷收獲了驚嘆和錯愕:該模型的性能不亞于全球最強的那些聊天機器人,而成本看起來只有它們的一個零頭。
DeepSeek的異軍突起,或對AI向前發展將需要越來越多電力和能源的普遍看法構成挑戰。
隨著DeepSeek創新引發的熱度越來越高,投資者開始消化它對其美國競爭對手及它們的硬件供應商的影響,全球科技股在1月末大跌。
DeepSeek究竟是什么?
DeepSeek是一家于2023年成立的中國初創企業,創始人是AI驅動量化對沖基金幻方量化的掌門人梁文鋒。該公司開發開源AI模型,這意味著廣大的開發者社區可以檢查和改進軟件。其移動應用程序(app)于1月初發布,然后迅速登頂美國iPhone下載榜。
該app與OpenAI旗下ChatGPT等其他聊天機器人的區別是,它會在對提示做出回應之前闡明其推理過程。該公司聲稱,其R1版本的性能與OpenAI的最新版本相當,并且允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
DeepSeek R1與OpenAI或Meta AI比起來怎么樣?
盡管該公司沒有詳細說明培訓和開發DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳產品的一個零頭。該模型的效率高出了這么多,使得人們懷疑斥巨資購買英偉達等公司最新、最強大AI加速器的必要性。
DeepSeek R1在幾個主要基準測評中的表現接近或優于競爭對手模型,例如數學領域的2024年美國數學邀請賽、常識領域的大規模多任務語言理解(MMLU)和問答領域的AlpacaEval 2.0。在加州大學伯克利分校相關的排行榜Chatbot Arena上,該模型也名列前茅。
DeepSeek何時引發的全球關注?
自2023年發布最早一版模型以來,這家AI開發商就受到了密切關注。然后在11月,它向世界展示了一下旨在模仿人類思維模式的DeepSeek R1推理模型。該模式支撐起了其移動聊天機器人app,今年1月,作為一種比OpenAI便宜得多的替代品,其app及網頁版在全球聲名鵲起,投資人Marc Andreessen稱其為“AI的人造衛星時刻”。
市場跟蹤機構App Figures的數據顯示,截至1月25日,DeepSeek移動app在澳大利亞、加拿大、中國、新加坡、美國和英國的iPhone應用商店下載量達到160萬次,排名第一。
DeepSeek的創始人是誰?
梁文鋒1985年出生于廣東,擁有浙江大學信息與電子工程系學士和碩士學位。天眼查數據顯示,他創立DeepSeek的注冊資本只有1000萬元人民幣。
梁文鋒曾表示,主要員工大多是中國頂尖高校的應屆畢業生,并強調英偉達的領先是整個西方技術社區和產業共同努力的結果,中國AI的發展需要類似的生態。
“更多的投入并不一定產生更多的創新,否則大廠可以把所有的創新包攬了,”他說。
DeepSeek在中國AI版圖中處于什么位置?
從阿里巴巴集團、百度到騰訊,中國的科技龍頭企業投入了大量資金和資源來為它們的AI企業獲取硬件和客戶。DeepSeek和李開復的初創公司“零一萬物”則另辟蹊徑,采取了開源方式,旨在快速招募盡可能多的用戶,然后再以這些大量用戶為基礎制定變現策略。
由于DeepSeek的模型更便宜,它已經在幫助降低中國開發AI成本方面發揮了作用;大公司打起了價格戰,在過去一年半時間里已經多輪降價。
對全球AI市場影響幾何?
DeepSeek的成功可能會促使OpenAI和其他美國供應商降價以保持現有的領先地位。如果更高效的模型能夠以少得多的支出參與競爭,那么人們就會質疑Meta和微軟等公司的巨額支出 —— 它們分別承諾了今年至少650億美元的資本支出、主要是在AI基礎設施上。
全球市場掀起風浪,阿斯麥、英偉達等之前受益于AI服務需求欣欣向榮的股票大跌。科大訊飛等與DeepSeek相關的中國股票上漲。
世界各地的開發人員已然在測試DeepSeek的軟件,并考慮用它來構建工具。這可能會加速先進AI推理模型的采用 —— 同時也可能引發對是否需要限制使用的更多擔憂。DeepSeek的進步可能會加緊旨在控制AI開發的監管。
DeepSeek有什么缺點?
DeepSeek的云基礎設施可能會經受流量激增的考驗。該公司曾在1月27日短暫大宕機,而隨著新老用戶向其聊天機器人發去更多問題,其將得管理甚至更大的流量。