關于大模型開源還是閉源的爭論,看起來還要持續很久。繼今年4月舉行的Create 2024百度AI開發者大會上,百度創始人李彥宏宣稱,“開源模型會越來越落后”。緊接著互聯網圈大佬中另一個經常談論AI的周鴻祎則表示,“我是一直相信開源的力量,至于說網上有些名人胡說八道,你們別被忽悠了。”
就在不久前舉行在2024世界人工智能大會(WAIC 2024)上,李彥宏又向開源大模型“開炮”,并直言開源模型就是智商稅,“當你理性地去想,大模型能夠帶來什么價值,以什么樣的成本帶來價值的時候,就會發現,你永遠應該選擇閉源模型。今天無論是ChatGPT、還是文心一言等閉源模型,一定比開源模型更強大,推理成本更低?!?/p>
但這一次與李彥宏打擂臺的不再是自稱開源信徒的周鴻祎、而是阿里云CTO周靖人,后者在同一場活動中表達了對開源大模型的支持。周靖人認為,國產大模型的主動開源,可以極大地縮短了開源與閉源模型之間的差距,使普通開發者也能使用頂尖的AI模型,將顯著加速大模型的應用落地進程。
大模型究竟應該開源或者閉源,在國內既是技術之爭、其實也是路線之爭。
先來看看技術層面,目前業界對于開源大模型的質疑主要是安全性存疑和缺乏推理(reasoning)能力上。對于開源模型安全性的質疑其實有一定道理,因為開源軟件的運行規則就是一旦將代碼開源后,產品的命運就不完全掌握在作者手中,變為了屬于所有開源參與者或社區的。
只要遵循相應的開源協議,其他開發者拿著開源軟件干什么都行,例如在大名鼎鼎的AOSP的基礎上,就誕生出了MIUI等等一大批第三方的Android ROM??墒茿I大模型與傳統的開源軟件不同,因為大模型的“主觀能動性”太強,它可能存在的破壞性是史無前例的,因此也就有了AI對齊概念的問世,要求大模型的價值觀需要與人類對齊。
問題是AI對齊已經被證明會降低大模型的性能,因此業界擔心會有“瘋狂科學家”不使其模型與人類的整體利益對齊,開源模型會成為后者的幫兇。此外長期以來,開源模型不僅在基準測試中表現比閉源模型較差,而且缺乏涌現功能。如果忽略文心一言,被李彥宏掛在嘴邊的ChatGPT、GPT-4、Claude-3,確實就證明了閉源模型的強大。
在這里李彥宏其實也用了話術,GPT-4不是因為閉源而強大,而是因為強大選擇了閉源。就如同OpenAI的閉源邏輯是因為產品的競爭力足夠強,但其GPT-2在2019年發布時則是開源的,到了ChatGPT(GPT-3.5)、GPT-4o的時候就轉為了閉源。彼時OpenAI發現自家大模型處于“一覽眾山小”的狀態,閉源顯然是利益最大化的手段,要不然ChatGPT Plus可不會賣爆。同樣,Anthropic的Claude-3也一樣,正是因為產品力強到具有了不可替代性。
至于說開源大模型的推理成本更高,其實也不太站得住腳,因為決定大模型推理成本的關鍵因素不是大模型本身,而是云服務提供商。在此前國產大模型的價格戰背后,其實是騰訊、阿里、京東、華為等云服務廠商新一輪價格戰的表象。更何況在Martian的Provider Leaderboard(推理成本排行榜)中,開源模型和閉源模型的表現是伯仲之間,并沒能在統計學層面拉開差距。
此外,閉源模型和開源模型的路線之爭還表現在對開發者的爭奪上。國產大模型“不服跑個分”的時代已經過去,現在是追求AI應用場景的階段,這時候就需要第三方開發者群策群力了,正一如當年Android和iOS的故事。彼時蘋果iOS率先起步、谷歌的Android作為追趕者,如今國內的百度以及海外的OpenAI也都是AI領域的先行者,并都選擇了閉源,而擁抱開源的阿里、Meta則在后面奮起直追。
眾所周知,iOS和Android在移動操作系統市場的市占率是2:8,但蘋果App Store每年貢獻的收入卻比谷歌的Google Play更高。所以有了蘋果的珠玉在前,只要這一輪AIGC能復刻移動互聯網的成功,堅持閉源路線的廠商就有資格復刻蘋果的成功。同理,選擇開源路線的廠商則在效仿Android。
最后放一個小彩蛋,對于開源模型是不是智商稅這個問題,我們咨詢了文心一言的意見。它的說法是,“它(智商稅)過于簡化了開源模型和閉源模型之間的復雜關系?!?/p>