時間回到2022年11月,此時英偉達的股價近乎腰斬,跌至不足3000億美元。
就在這個時候OpenAI發布了ChatGPT聊天機器人,這一基于生成式人工智能的AI Bot,一時間成為了科技界的頭條。此時,甚至Google創始人慌亂,回來緊急發布應對策略。因為在這個時候大家不知道它是如何實現的。
英偉達GPU芯片可以加速AI基礎模型的訓練,同時具有完善的CUDA平臺,它抓住了向上的“新風口”,其股價開始回升,市值逐步恢復。
到2024年的今天,僅僅兩年過去,英偉達市值達到3.012萬億美元,成為了全球市值第二的公司。
英偉達的GPU芯片依然在加速生產中,而且他們現在擁有至高無上的定價權,每個人訓練大模型的公司都必須接受 Nvidia 用金湯匙喂養他們的東西。
當前 H100的毛利率超過 85%,可以說英偉達成了AI2.0時代最賺錢的公司,沒辦法賣“鏟子”的總比“挖金礦”的要先一步掙到錢。
而對于這波風口上的大模型公司來說,所有人都在關注無利可圖的支出還將會持續多久。當前大模型創業公司的明確目標還是在趕上甚至超越 OpenAI,以及構建更大性能更好的模型,來掙取更多的預期收益。
而OpenAI也一樣,OpenAI必須不斷推出新的震撼世界的產品,同時推出可以直接觸達用戶的產品,否則它將陷于Meta 和 Google包圍之中。
當前許多公司在聊天機器人 ELO 方面與 OpenAI 最新的 GPT-4 相差無幾,而在上下文長度和視頻模式等某些方面,一些公司已經領先。
前不久Sora和GPT-4o的發布,并未引起像ChatGPT剛發布時引爆的破圈討論風潮,這是因為ChatGPT剛發布時,我們并不知道它是如何實現的,我們也不知道如何追趕。而現在我們基于開源基礎模型,可以大概判斷出其實現的技術方案,只是需要時間來進行復現而已。
顯然,只要有足夠的計算能力,最大的科技公司都可以匹敵 OpenAI 的 GPT-4。據傳,阿里最新發布的Qwen-2.0的開源模型已經可以比擬GPT-4 Turbo,Meta 的 Llama 3 405B 也將在開源的同時匹敵 GPT-4,Gemini 2 Ultra 已經在各方面超越 GPT-4 Turbo。
OpenAI 現在的優勢之一是他們在收集使用數據方面一直處于領先地位,但這種情況相信很快就會改變。所以OpenAI才說人才是第一位的,其他沒有什么是不可替代的,OpenAI也在不斷的開出百萬美元的年薪從Meta 和 Google等競爭對手的公司挖人。
如果OpenAI沒有不斷的推出新的技術產品,可以說其技術優勢正在逐漸縮小。
雖然說微軟宣布將為OpenAI 投入超過 100 億美元的資本支出,而且這其中還有一大部分事用于推理,以便在自己的產品和服務中部署 OpenAI 模型。
由于 OpenAI 的怪異結構,微軟也并未完全押注于OpenAI,一大部分資源被用于微軟自己開發的模型上。
OpenAI 是一個非營利組織,其主要目標是創造安全且造福全人類的通用人工智能 (AGI)。OpenAI可以而且會違反允許微軟訪問 OpenAI 模型的協議,而微軟對此沒有任何追索權。
這是因為OpenAI 仍然是一家完全獨立的公司,由 OpenAI Nonprofit 管理。微軟是無投票權的董事會觀察員,沒有控制權。AGI 明確地排除了所有商業和 IP 許可協議。對于微軟來說,最令人擔憂的是,OpenAI 董事會可以在沒有任何微軟投票的情況下隨時決定他們已經實現了 AGI。
雖然說現在OpenAI的產品可以通過微軟來直達消費者用戶,但他們之前并非完全背靠背的合作關系,OpenAI依然需要尋求獨立的產品路線。
而微軟也在減少對 OpenAI 的依賴,包括 Copilot 和 Bing 計劃。微軟最新發布的Phi-3模型,使用來自大型模型的大量合成數據訓練小型模型,效果非常出色。其次,微軟也正在使用 MAI-1 ~500B 參數 MOE 模型,利用了 Inflection 預訓練團隊及其數據集,并結合了微軟自己的一些合成數據,來訓練自己的GPT-4 類模型。
OpenAI的缺點其實非常明顯,它并沒有擁有像 Meta 和 Google 可以更直接地接觸消費者終端流量產品。
相比于Google的瀏覽器,Meta的聊天軟件,ChatGPT的用戶量還是比較少的,而且其中大多數只使用過幾次,不會繼續使用它。
未來的大多數可以預見的消費者,將通過現有平臺來使用大語言模型,包括 Google、Instagram、WhatsApp、Facebook、iPhone/Android。
雖然 Meta 尚未找到如何將賺錢的方法,但他們的 Meta AI(由 Llama 3 70B 提供支持)已在 Facebook、Instagram 和 Whatsapp 上可用。
并且已宣布的推廣范圍已擴展到包括美國在內的 14 個國家/地區,這些國家/地區的總人口為 11 億。大量用戶已經可以使用比 ChatGPT 免費模型更好的模型。Meta AI 正處于其增長曲線的早期階段,距離實現其 32.4 億每日活躍用戶群的目標僅完成了三分之一。
Google也宣布將AI 融入了 Workplace 辦公工具中,使得Gmail、Google Drive、Docs、Sheets 和 Slides 都可以一鍵使用AI,同時未來也將打造新的搜索—-用AI組織搜索,同時Gemini 生成式人工智能模型添加到廣告服務中,探索賺錢方法。
所以在這個背景下,OpenAI推出了自己的手機APP和桌面APP,用于直接面向用戶,一方面便捷用戶的使用,減少使用上復雜操作的時間成本;另一方面可以直接面對用戶和占有用戶。
此外,OpenAI也積極與蘋果合作,打造新一代的siri,占有這個巨量的終端用戶群體。如果OpenAI真的iPhone 上獨家提供服務,那么OpenAI將一舉成功占用最重要的終端市場。
價格戰的序幕應由 DeepSeek-V2 的問世拉開,這款產品以其卓越的性能和低廉的運行成本,成功超越了 Meta 的 Llama 3 70B。
DeepSeek-V2 的定價策略極具競爭力,它不僅在成本效益上明顯優于市場上的其他競爭模型,而且其價格之低,甚至打破了風險投資支持的推理 API 提供商之間的價格戰局面。這些提供商在為 Meta 和 Mistral 模型提供服務時,已經面臨著虧損的壓力。
DeepSeek-V2 的推出,無疑在這場激烈的市場競爭中掀起了新的波瀾。
DeepSeek 聲稱,一個由 8卡 H800 GPU 組成的節點可以實現每秒超過 50,000 個解碼token的峰值吞吐量,其API定價為每百萬 tokens 輸入 1 元、輸出 2 元。即使在這樣的情況下,依然可以實現高達 70% 以上的毛利率。而且DeepSeek-V2 沒有照搬國外的開源模型,針對MoE、RoPE 和 Attention 都有全新的創新。
緊接著,智譜 AI 、字節豆包大模型和阿里Qwen-Long API也都相應的大幅下調價格。百度則直接宣布 ERNIE Speed 和 ERNIE Lite 兩款模型免費。
OpenAI則對于非企業用戶優先采取了免費優先的策略,雖然有一定的頻次限制,但對于非企業用戶來說是足夠的。這標志著他們將去年的定價模式發生了重大商業模式轉變,現在開發者和企業進入了完全補貼消費者的時代。
通過貼補消費者來增加用戶使用終端頻率和習慣,搶占終端用戶市場。對于這些沒有大規模終端使用的大模型公司來說,如果創新遇到瓶頸,那么這些擁有直接終端用戶的企業公司,將可能快速將其包圍。
國內價格戰時間線:
DeepSeek 發布全球最強開源 MoE 模型:2024-05-06,DeepSeek-V2(32K 上下文) API 的定價為:每百萬 tokens 輸入 1 元、輸出 2 元
用大模型 API 就上 bigmodel.cn!:2024-05-11,智譜 AI 的 GLM-3 Turbo API 價格調整為 1 元/百萬 tokens(輸入輸出同價)
2024 春季火山引擎 FORCE 原動力大會上: 2024-05-15 ,字節 Doubao-pro-128k(128K 上下文) API 的定價為:每百萬 tokens 輸入 5 元、輸出 9 元;Doubao-lite-128k(128K 上下文) API 的定價為:每百萬 tokens 輸入 0.8 元、輸出 1 元
智譜 AI 最新推出 Batch API:2024-05-21,支持的模型以及價格:GLM-4 API 價格為 50 元 / 百萬 tokens,GLM-3-Turbo API 價格為 0.5 元 / 百萬 tokens(輸入輸出同價)
降價,立即生效!:2024-05-21,阿里云 Qwen-Long API 價格調整為每百萬 tokens 輸入 0.5 元、輸出 2 元。
免費,立即生效!:2024-05-21,百度宣布 ERNIE Speed 和 ERNIE Lite 兩款模型宣布免費。
OpenAI 面臨的最大風險就是芯片。
盡管 OpenAI 的芯片野心已經傳聞了一段時間,最近OpenAI對谷歌TPU芯片的頂尖人才開始了大膽的偷獵行動。
OpenAI自己做芯片和基礎設施也是迫不得已。
一方面,與購買 Nvidia 芯片相比,它大大降低了計算成本。當前Google的 TPU 建設速度非常快,而且成本會非常便宜。Meta 和亞馬遜正在將其內部硅片的產量提升到不同程度,這讓他們的大模型獲得了計算成本優勢。
另一方面,OpenAI公司目前處境尷尬,不能完全依賴微軟的芯片和云服務,因為兩者的關系緊張且微妙,而且微軟正在認真制定自己的AI計劃。
從長遠的角度來看,OpenAI 在成本節約方面可能難以從微軟那里獲得顯著的優惠,因為微軟的商業策略傾向于通過向'外部'用戶出租其內部芯片和云服務來實現盈利。OpenAI 有著更為深遠的愿景,它渴望自主設計芯片和系統,以更貼近制造成本的方式打造定制化的解決方案,從而實現成本效益的最大化。
然而,OpenAI 對于微軟芯片的設計缺乏必要的控制權,這可能導致微軟提供的芯片及其系統無法完全滿足 OpenAI 的特定需求。這種局限性可能會影響 OpenAI 在實現其技術目標和優化成本效益方面的靈活性和效率。
當前AI大模型還處于發展的初期,巨量上升的空間使得資本可以無限制的投入,然而這種無限制的投入會持續多久呢?
在整一條產業上,目前只有賣芯片的英偉達賺到了錢,其他公司都是在賺取對未來期望的錢。一旦OpenAI所帶來的創新性不足,那么也就意味著AI2.0將進入平臺期。
OpenAI必須利用當前的優勢,快速的占領終端用戶,吸納自己的用戶群體。否則一旦式微,Google和Meta這種已經擁有巨量流量的現成產品公司,將具有非常大的后發優勢。
所以說,終端產品成為市場競爭的關鍵,Google和Meta等公司擁有直接接觸消費者的平臺和產品,而OpenAI則需要通過推出自己的APP和與蘋果等公司的合作來拓寬用戶基礎。通過價格戰和補貼消費者將成為搶占市場份額的重要手段。
最后,芯片或許會成為OpenAI面臨的最大風險。盡管OpenAI有意自主開發芯片和基礎設施,但與微軟的合作關系緊張,OpenAI需要在芯片開發和成本效益之間找到平衡,以保持其在AI領域的領先地位。