我們在Gemini大模型發布前的本周周報《ChatGPT一周年:AI盛宴才剛剛開始》首次指出多模態AI應用、算力國產化、AI終端重構是新的三大AI機會方向,恰是Gemini大模型此次發布所代表的新趨勢:
1)多模態AI應用:Gemini大模型最核心亮點在于對視頻多模態的理解能力,擁有視頻數據與應用卡位的企業或有重估機遇。
2)算力國產化:Gemini并沒有依賴英偉達芯片算力,是由Google自研TPU v4和TPU v5e訓練出來的大模型,值得關注的是谷歌設計的TPU細節的論文《數據中心的TPU效能解析》大量引用致敬我國【寒武紀】的研究工作,一方面給予我們國產算力崛起的信心,另一方面國內真正大客戶互聯網巨頭開始批量采購華為昇騰、寒武紀為代表國產AI芯片拐點已經到來。
3)AI終端重構:谷歌同時發布Gemini Nano這一專門為移動設備訓練的模型。針對不同內存的設備,訓練了兩個版本,參數量分別是18億和32.5億。大模型重構各類終端的趨勢再度確認,我們將迎來前所未有終端硬件創新潮。
投資建議:
1.建議關注芯片基礎算力國產化與一體機相關標的:華為昇騰一體機:科大訊飛、云從科技、軟通動力、恒為科技、安恒信息;國產核心算力:寒武紀、浪潮信息、海光信息、超訊通信、匯納科技。
2.從AI PC到AI pin的AI終端變革:大模型重構有望從AI PC開始共振,逐步延伸至汽車、手機與機器人等各類終端,或將迎來全面一輪的AI終端硬件創新潮,建議關注充分布局AI終端相關標的:中科創達、螢石網絡、漫步者等。
3.海外在大模型持續賦能下,已明確其商業化規模落地的成功之路。國內在各大模型基本具備GPT3.5水平能力下,以及政策的持續推動,AI應用有望復制海外的成功路徑,建議關注相關AI應用標的:效率辦公-金山辦公、AI司法-金橋信息、GPTs分發渠道-夢網科技、AI空間計算-超圖軟件、AIGC創作-萬興科技、超訊通信、教育-佳發教育、郵箱-彩訊股份、社交-掌閱科技等
1.1谷歌發布全球首個端到端多模態大模型——Gemini
Gemini系列模型是一開始就使用多模態數據(包括文字、音頻、圖片、視頻、PDF文件等)訓練的大模型,其中視頻數據訓練是通過將視頻編碼為一系列幀序列,視頻幀(圖像)可以與文本或音頻實現混合訓練。
圖1: Gemini大模型架構圖
資料來源:谷歌Gemini技術報告,民生證券研究院
Gemini系列模型分為Ultra、Pro、Nano三個版本,都支持上下文32K理解,其中:
1)Ultra版本是性能最強的版本,在對應的TPU基礎設施中能夠展現出最高效率,在多項測試中Ultra版本性能超過GPT4V(后文有詳細測試結果);
2)Pro版本是性價比優化的版本,在推理、多模態等方面有較強能力,Pro版本具有良好延展性,可以在幾周內完成預訓練,在多項測試中僅次于GPT4V,強于PaLM2、Claude2、LLaMA2、GPT3.5等主流大模型;
3)Nano是通過對其他模型蒸餾得來的4位模型,有1.8B和3.25B兩個版本,分別針對低內存和高內存設備,支持在本地部署
Gemini Ultra版本在32個學術基準中,有30個超過GPT4V處于全球最先進水平。據谷歌黑板報,Gemini Ultra 的得分率為 90.0%,是第一個在 MMLU(大規模多任務語言理解)測試中超過人類專家的模型,MMLU 綜合使用了數學、物理、歷史、法律、醫學和倫理等 57 個科目,用于測試世界知識和解決問題的能力,在包括文本和編碼在內的一系列基準測試中,Gemini 的性能都超過了當前最先進的水平。
圖2:Gemini Ultra在文本領域各類測試表現
資料來源:谷歌黑板報微信公眾號,民生證券研究院
介紹其自行設計的AI芯片TPU細節的論文《數據中心的 TPU 效能解析》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多達 70 人,領銜第一作者是計算機體系架構硬件大師 Norman Jouppi。令人震驚的是,這篇 詳細介紹TPU細節的 論文引用了國內剛剛剛成立不久的AI芯片公司寒武紀團隊成員前期發表的 6 篇學術論文,并有專門段落回顧一系列學術工作顯示尊重,這在幾乎由美國壟斷的計算機基礎體系架構設計領域,在全球范圍內都是極為罕見的。
1.2.1 谷歌TPU與中國AI芯片企業寒武紀有著微妙聯系:
2012年,陳天石等中科院計算所的科研人員,與首次提出“AI加速器”概念的法國教授Olivier Temam,共同啟動神經網絡處理器(AI芯片)項目進行了一系列開拓性學術工作,已經成為全球AI芯片領域引用次數最多的學術論文,成為世界范圍內研發智能芯片必讀的文獻。這也是寒武紀的技術來源。
2014年12月,DaDianNao(又稱寒武紀2號神經網絡處理器,面向大規模神經網絡的應用)榮獲2014年度Micro最佳論文,這也是Micro自1963年創辦以來,第一次由美國以外的研究者摘得該獎項。
2017年,美國人工智能的領軍企業谷歌首次發表了詳細介紹其自行設計的AI芯片TPU細節的論文《數據中心的 TPU 效能解析》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多達 70 人,領銜第一作者是計算機體系架構硬件大師 Norman Jouppi。令人震驚的是,這篇 詳細介紹TPU細節的 論文引用了國內剛剛剛成立不久的AI芯片公司寒武紀團隊成員前期發表的 6 篇學術論文,并有專門段落回顧一系列學術工作顯示尊重,這在幾乎由美國壟斷的計算機基礎體系架構設計領域,在全球范圍內都是極為罕見的。
圖6:2017年4月谷歌首次發表了詳細介紹其自行設計的AI芯片TPU細節的論文《數據中心的 TPU 效能解析》
資料來源:集微網,民生證券研究院
據CSDN,TPU相比GPU通用性更弱,但特定任務的處理速度和能耗優化程度將顯著領先,AI時代TPU商業化能力的一大前瞻指標為TPU適配大模型情況:
1)谷歌TPU:據谷歌云官網,AI大模型客戶、Huggingface等;
2)寒武紀:據英偉達官網,寒武紀思元(MLU)系列云端智能加速卡與百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配,寒武紀思元(MLU)系列產品性能均達到國際主流產品的水平;
1.3模態AI應用浪潮或開啟
谷歌Gemini演示視頻所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。據CSDN,Gemini演示視頻中仿佛可以實時觀察人類的行為,如觀察人類在做什么,并給予反饋:例如,Gemini看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團、辨別各種手勢、重新排列行星草圖等;后續,針對網絡質疑,谷歌DeepMind研究副總裁Oriol Vinyals追加補充視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。
Gemini開始在谷歌多種產品和平臺推出。據谷歌黑板報, Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、規劃和理解等;Pixel 8 Pro 是首款搭載 Gemini Nano 的智能手機,它可以支持錄音應用中的“總結”等新功能,并在 Gboard 中推出“智能回復”功能,從 WhatsApp 開始,明年還將推出更多信息應用;未來幾個月,Gemini 將應用于我們更多的產品和服務,如 Search、Ads、Chrome 和 Duet AI;公司已經開始在Search中試驗 Gemini,它能夠為用戶提供更快的搜索生成體驗(SGE),用戶在美國的英語搜索延遲降低了 40%,同時在質量方面也有所提高。
領銜第一作者是計算機體系架構硬件大師 Norman Jouppi。令人震驚的是,這篇 詳細介紹TPU細節的 論文引用了國內剛剛剛成立不久的AI芯片公司寒武紀團隊成員前期發表的 6 篇學術論文,并有專門段落回顧一系列學術工作顯示尊重,這在幾乎由美國壟斷的計算機基礎體系架構設計領域,在全球范圍內都是極為罕見的。
圖6:2017年4月谷歌首次發表了詳細介紹其自行設計的AI芯片TPU細節的論文《數據中心的 TPU 效能解析》
資料來源:集微網,民生證券研究院
據CSDN,TPU相比GPU通用性更弱,但特定任務的處理速度和能耗優化程度將顯著領先,AI時代TPU商業化能力的一大前瞻指標為TPU適配大模型情況:
1)谷歌TPU:據谷歌云官網,AI大模型客戶、Huggingface等;
2)寒武紀:據英偉達官網,寒武紀思元(MLU)系列云端智能加速卡與百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配,寒武紀思元(MLU)系列產品性能均達到國際主流產品的水平;
1.3模態AI應用浪潮或開啟
谷歌Gemini演示視頻所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。據CSDN,Gemini演示視頻中仿佛可以實時觀察人類的行為,如觀察人類在做什么,并給予反饋:例如,Gemini看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團、辨別各種手勢、重新排列行星草圖等;后續,針對網絡質疑,谷歌DeepMind研究副總裁Oriol Vinyals追加補充視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。
Gemini開始在谷歌多種產品和平臺推出。據谷歌黑板報, Bard 將使用 Gemini Pro 的微調版本來進行更高級的推理、規劃和理解等;Pixel 8 Pro 是首款搭載 Gemini Nano 的智能手機,它可以支持錄音應用中的“總結”等新功能,并在 Gboard 中推出“智能回復”功能,從 WhatsApp 開始,明年還將推出更多信息應用;未來幾個月,Gemini 將應用于我們更多的產品和服務,如 Search、Ads、Chrome 和 Duet AI;公司已經開始在Search中試驗 Gemini,它能夠為用戶提供更快的搜索生成體驗(SGE),用戶在美國的英語搜索延遲降低了 40%,同時在質量方面也有所提高。