Deepseek V3的發布為什么震動業界,他到底顛覆了什么呢,你說他完全超越了openAI?那到沒有?
另外別的大模型發布,一般都會伴隨著相關概念股的大漲,比如算力股,那為什么Deepseek V3發布,概念股跌了呢?
Deepseek V3算是巔峰了我們對大模型與算力的關系的傳統認知,在他發布之前,我們一般會認為,越厲害的大模型,其訓練過程所需要的算力是約大的,所以一直以來大家都在比拼算力,比誰的卡多。
但是,Deepseek顛覆了這一傳統認知,比如,Meta的Llama-3.1的訓練投資可能超過了5億美元,但是訓練DeepseekV3只用了不到600萬美元,但是DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上與世界頂尖的閉源模型GPT-4o以及Anthropic的Claude-3.5-Sonnet不相上下。
所以對于大模型而言,算力可能并非是絕對瓶頸了。
而且Deepseek V3這么一個比肩閉源的模型,居然開源了。
同時Deepseek V3的API價格也是便宜的離譜,就連大模型也開始卷價格了。不過這也不用奇怪,幻方量化是干嘛的啊?人家是:使用 AI 進行投資的對沖基金。股市才是提款機,大模型只是從股市提款的工具而已。
后續我再分享部署體驗的效果。