當下的人工智能也是如此。今年以來,大模型和生成式AI作為重要的科技突破,刷新了大眾對人工智能的認知,也為AI的商業化落地打開了廣闊空間。
其中,以商湯科技為代表的龍頭企業憑借著布局深耕多年構筑的競爭壁壘,在令人眼花繚亂的新技術、新產品比拼中脫穎而出。
前路漫漫亦燦燦,上下求索終有得。近日,商湯公布了2023年中期業績,大模型驅動全線業務升級,生成式AI相關收入多倍增長。
直到2022年底,聊天機器人ChatGPT正式發布,再次刷新人工智能技術應用的新高度,作為其背后重要技術支撐的大模型,在全球掀起了關注熱潮。
為什么大模型如此重要?簡單點說,一個模型通常由輸入、算法(計算)、輸出組成,大模型的優勢在于參數量足夠大,能夠包含各種各樣的變量,假若把大模型視為一位“智者”,它的見識越多,即數據維度多,泛化能力就越好,解決問題的效果也越好;與此相應,大模型通用能力就越強,處理各種類型的單個問題成功率也就越高。
這正是當前AI領域所急需的重要能力。目前,各行各業對AI場景提出大量需求,尤其是出現的很多長尾問題,表現為差異化、碎片化和細節化需求。
但這些與真實世界擬合度極高的需求,對AI基礎設施提出了一般廠商難以滿足的要求,如指數級增長的算力工程能力、高復雜度的識別算法模型,以及強大的深度學習通用模型。
而這類新興產業的基礎設施建設,需要源源不斷的資金、人力和技術投入,當大模型浪潮來臨之際,乘勢而上、一展所長的往往都是龍頭企業。
首先是先進的算力基礎設施,在商湯的持續升級下,目前,SenseCore上線GPU數量從2萬7千塊提升至3萬塊,算力規模提升20%達到6 ExaFLOPS,為日益增長的大模型訓練提供可靠、先進的算力供應,今年以來,1000多個參數量數十億至上千億的大模型在此之上完成訓練。
其次是海量的有效數據集,多年的模型開源和商業化實踐為商湯積累了大量原始語料數據,沉淀了很多寶貴know-how(如專業知識),每月可產出2萬億token(數據處理量),高質量訓練數據將應用到大模型上,復現相應改進效果。
此外是穩定的大規模集訓,在大裝置的支持下,商湯很早就具備千卡并行的系統能力,即使用上千張GPU卡進行單任務訓練,以實現千億參數量超大規模的訓練,每個季度甚至能迭代1到2個版本的基模型,保持長期領先。
在如此強大的AI大裝置支撐下,今年以來,商湯大模型成果疊出。4月商量SenseChat1.0發布,是國內最早推出的基于千億參數大語言模型的聊天機器人產品之一;6月,商湯聯合上海人工智能實驗室等多家國內頂尖科研機構發布了首個綜合能力超越GPT-3.5-turbo的大語言模型書生·浦語(InternLM)。
8月,新模型InternLM-123B完成訓練,語言、知識、理解、推理和學科五大能力顯著提高,在全球51個知名評測集的30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo、LLaMA2-70B等模型。
值得一提的是,商湯大模型在開源上也走在了前列,系統開源能讓更多的人接觸并應用大模型,促進技術的共享和交流,推動大模型生態的建設,并加速AI的發展。
商湯已與多家科研機構合作推進AI開源平臺建設。2018年至今,商湯開源的AI大工具涉及決策智能、大語言模型、數據平臺、高性能訓練、推理框架和AI智能體框架等。
其中,InternLM-7B(70億參數)模型的部分訓練數據、訓練代碼及基模型權重已向學術界和工業界開放、支持商用,并登頂多個模型測試榜單成為性能最好的輕量級基模型。能力更強的InternLM-20B模型(200億參數)也將于近期開源。
現實因素來看,AI的商業化需要落地到具體的應用場景,賦能下游企業,實現降本增效,才會有人愿意“買單”,AI企業也才能獲得相應的經濟效益。
長遠因素來看,長期的商業化探索能助推大模型技術迭代,反哺AI應用的落地和優化,持續提升AI的市場滲透率,形成行業發展的良性循環。
而2021年底登陸港交所之時,商湯的AI商業化模式已經“五臟俱全”,在當時的招股說明書中,將要打造的業務結構總結為“一個平臺、四個支柱”。
其中,“一個平臺”指商湯的AI大裝置SenseCore,“四大支柱”分為智慧商業、智慧城市、智慧生活、智能汽車等板塊,囊括了所有的落地場景。
今年上半年,基于AI大裝置SenseCore和“日日新”大模型系列,商湯發布了一系列生成式AI產品,如,自然語言交互的“商量”、AI文生圖的“秒畫”、數字人視頻生成的“如影”、3D大場景重建的“瓊宇”、3D小物體生成的“格物”,并將之應用于各個業務板塊,賦能行業創新。
商湯的“大模型力量”正驅動著集團全線業務升級。半年報顯示,今年上半年,商湯集團的生成式AI相關收入同比增長670.4%,對集團業務的貢獻迅速提升至20.3%。
例如智慧商業板塊,大模型技術下誕生的企業級AI應用打開極為廣闊的商業應用場景,成長為商湯第一大收入來源。商湯深入能源、金融、地產等十個行業的數百家客戶深度定制行業大模型,如針對頭部金融機構,以商量賦能關鍵業務,包括智能客服、營銷培訓等,并開展金融大模型合作研發;針對頭部保險機構,提供基于AI遙感大模型的農作物承保數據交叉驗證,效率提高60倍。上半年,智慧商業營收8.54億元,同比增長50.2%。
在智慧生活板塊,大模型產品提前搶占tob市場空間,“商量”和“秒畫”深受移動互聯網行業用戶青睞,如影落地電商、直播、銀行客服場景,格物與香港最大的珠寶集團之一實現商品3D數字化合作等。上半年,智慧生活營收3.12億元;客戶數達270個,同比增長47.5%。
趁著AI東風,智能汽車板塊也成為商湯的重要發展引擎,并由研發轉化為規模量產。上半年,絕影量產業務同比增長573%,量產交付數量39萬臺,規模量產帶動單車毛利提高29%。基于大語言模型“商量”打造的車艙內智能助理備受關注,智能座艙前裝產量同比增長3倍。
智慧城市板塊,則是持續推進業務轉型,聚焦頭部城市,優化收入結構、改善現金流。上半年商湯在一二線城市的智慧城市收入占比由去年同期的34%上升至64%。
與當年移動互聯網之爭一般無二,AI之爭最終也會從單個應用的流量爭奪走向整個生態系統的比拼。
而在AI生態中基礎軟硬件、基礎模型和創新應用這三大層次中,基礎模型可謂是AI生態的“支點”,大模型向下能帶動AI基礎軟硬件發展,向上能支撐AI智能應用賦能社會各行各業。
業內普遍認為,大模型用一套算法、一套模型結構、一套訓練思路,就能解決AI中的很多碎片化問題,標志著通用人工智能時代的到來。
“AGI催生了新的研究范式,即基于一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。商湯科技聯合創始人、首席科學家王曉剛指出,“AGI將實現從'數據飛輪’到'智慧飛輪’的演進,最終邁向人機共智。”
這種技術層面上的演進也將延伸至應用層面。與此前“空中樓閣”般的AI,存在研發成本高、規模生產難、落地場景模糊大等問題相比,大模型時期的AI重視泛化能力、產業結合和安全保障,有望成為拉動全球經濟增長的新引擎。
據IDC預測,2026年中國AI大模型市場規模將達到211億美元。而生成式AI更有可能是個萬億市場,麥肯錫的報告指出,在其研究的63種應用中使用生成式AI,將為全球經濟帶來每年2.6萬億-4.4萬億美元的增長。
嗅到機遇的不止有商湯,當年日新月異的互聯網行業里,“一步慢步步慢”的競爭態勢,被普遍認為在AI領域只會愈演愈烈,引得一眾廠商紛紛下場。
正如手機系統一樣,過多的大模型并不利于AI的標準化、統一化發展,持續的巨額投入也意味著這是個少數人的游戲,大模型,尤其是通用大模型的數量終將從上升轉向下探。
生成式AI更是打響爭奪用戶“第一槍”。8月31日,首批國產AI大模型獲批面向公眾開放,包括百度“文心一言”、商湯“日日新大模型”、抖音“云雀大模型”、中科院“紫東太初大模型”、智譜AI“智譜清言”等。商湯“商量SenseChat”也在31日當天全面向用戶開放服務。
AI企業該如何迎戰?答案是始終向前迭代,以持續領先的技術優勢,建立獨特的市場定位,快速搶占市場份額,而商湯早已做好準備。
今年上半年,在“基建”成果的大力支持下,商湯全力投入在基模型研發,與頂尖科研機構聯合發布的InternLM成為了中國首個全面超越GPT-3.5-turbo性能的大模型。下半年,商湯將借助豐厚的數據和算力資源,制作更強的基模型。2024年,通過開源和商業化的雙重推動,商湯想要打造領先的生成式AI應用生態平臺,類似當年的AI助手、操作系統等互聯網應用生態平臺,成為新的流量入口。
對于商湯來說,大模型的技術優勢和平臺的賦能服務,能夠牢牢把握住生成式AI市場的剛性需求。對于其他企業來說,它們可以更快更好地利用AI解決生產經營痛點,或是構建AI商業生態,這也是商湯的初心與愿景。“商湯的長遠目標仍然是向AGI持續迭代,用我們的創新力為AGI時代更快到來做出努力。”
近年來,AI在技術突破和應用方面,都取得了突破性的飛躍進展。但正如愛因斯坦所說,科學絕不是也永遠不會是一本寫完了的書,每一項重大成就都會帶來新的問題,任何一個發展,隨著時間的推移,都會出現新的嚴重的困難。
AI未來已來,卻仍需要如商湯這類頭部從業者,持續向新技術與新產品迭代,用自身的創新力為更多的行業與企業全面賦能,加速推動AGI時代到來,讓AI真正成為解放人類雙手、補足人類大腦的最強力量。