? 導 讀
AI大模型熱潮狂飆,華為盤古大模型突然刷屏。
來源 | 數(shù)據(jù)觀
沉寂兩年后,華為“盤古”AI大模型即將上線。
3 月 27 日,華為產(chǎn)業(yè)鏈開盤大漲,多支概念股高開。
消息面上,華為盤古大模型即將發(fā)布的消息刷屏,受到極大關注。事實上,這來自人民日報 3 月 25 日刊發(fā)名為《人工智能產(chǎn)業(yè)化應用加速》的文章。該文章稱,近幾年,國內(nèi)外廠商紛紛加碼巨量模型的投入與研發(fā),讓人工智能產(chǎn)業(yè)落地找到了新的方向,其中提到了華為云盤古大模型在新藥開發(fā)上發(fā)揮的重要作用。
華為云團隊于 2020 年立項 AI 大模型,并且于 2021 年 4 月發(fā)布“盤古大模型”。目前,盤古大模型已經(jīng)發(fā)展出包括基礎大模型(L0)、行業(yè)大模型(L1)、行業(yè)細分場景模型(L2)三大階段的成熟體系。
2022 年 11 月,在華為全聯(lián)接大會 2022 中國站上,華為云進一步迭代盤古大模型的技術能力,擴展盤古大模型的服務范圍,發(fā)布盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項重磅服務。
資料顯示,盤古大模型由NLP大模型、CV大模型、多模態(tài)大模型、科學計算大模型等多個大模型構(gòu)成。通過模型泛化,解決傳統(tǒng) AI 作坊式開發(fā)模式下不能解決的 AI 規(guī)模化、產(chǎn)業(yè)化難題。
根據(jù)華為云官網(wǎng)信息,華為即將上線的盤古系列 AI 大模型分別為NLP大模型、CV大模型、以及科學計算大模型(氣象大模型)。
據(jù)華為云介紹,盤古NLP大模型可用于內(nèi)容生成、內(nèi)容理解等方面,并首次使用Encoder-Decoder架構(gòu),兼顧NLP大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。在下游應用中,僅需少量樣本和可學習參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配。
2019 年權(quán)威的中文語言理解評測基準CLUE榜單中,盤古NLP大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分83.046,多項子任務得分業(yè)界領先,是目前最接近人類理解水平(85.61)的預訓練模型。
盤古CV大模型可用于分類、分割、檢測方面,也是首次實現(xiàn)模型按需抽取的業(yè)界最大CV大模型,首次實現(xiàn)兼顧判別與生成能力。基于模型大小和運行速度需求,自適應抽取不同規(guī)模模型,AI 應用開發(fā)快速落地。使用層次化語義對齊和語義調(diào)整算法,在淺層特征上獲得了更好的可分離性,使小樣本學習的能力獲得了顯著提升,達到業(yè)界第一。
盤古氣象大模型實現(xiàn)氣象預報精度首次超過傳統(tǒng)數(shù)值方法,速度提升1000倍,提供秒級天氣預報,例如重力勢、濕度、風速、溫度,氣壓等變量的1小時-7天預測。借助創(chuàng)新的3DEST網(wǎng)絡結(jié)構(gòu)以及分層時間聚合算法,盤古氣象大模型在氣象預報的關鍵要素(例如,重力勢、濕度、風速、溫度等)和常用時間范圍上(從一個小時到一周)精度均超過當前最先進的預報方法,同時速度相比傳統(tǒng)方法提升1000倍以上。
按上述描述來看,相比定位于多模態(tài)大語言模型的文心一言,華為盤古大模型除了NLP(自然語言處理)能力之外,還可應用在分子、金融、氣象等更廣泛的領域。
華為發(fā)布會背后:各大機構(gòu)關注升溫
在不久前的 2023 華為春季旗艦新品發(fā)布會上,華為帶來全新智慧搜圖功能。該功能基于多模態(tài)大模型技術,在手機端側(cè)對模型進行小型化處理,實現(xiàn)了首創(chuàng)的、精準的自然語言手機圖庫搜索體驗。除了手機,未來智能音箱、手表等IOT設備有望也能搭載端側(cè)處理功能,從而實現(xiàn)大模型在各個智能終端上的輕量化應用。
基于此,華為的盤古大模型成為市場各大機構(gòu)關注的焦點。
招商證券認為,國內(nèi)應用軟件 AIGC 投資邏輯可以分為四類:
1、模型類企業(yè):除去百度文心一言、華為盤古、以及阿里騰訊等互聯(lián)網(wǎng)企業(yè)自研大模型外,目前A股有望推出類GPT模型企業(yè)包括三六零、科大訊飛。
2、海外映射應用:基于對微軟企業(yè)級服務產(chǎn)品 AI 應用情況的研究,判斷辦公及企業(yè)級服務領域?qū)⑹菄鴥?nèi) AIGC 能力應用的優(yōu)質(zhì)場景。
3、有望接入 ChatGPT 應用:目前中國地區(qū)應用軟件無法直接接入GPT模型,而海外地區(qū)應用則具備接入GPT的潛力,因此判斷海外業(yè)務占比高的企業(yè)有望率先在AIGC領域有相關應用產(chǎn)品落地。
4、“AIGC+”應用:判斷在“AIGC+”的垂直領域中具備數(shù)據(jù)基礎優(yōu)勢的企業(yè)有望率先落地。
民生證券認為,盤古NLP大模型可以賦能千行百業(yè),應用于各種場景。
在智能營銷領域,盤古NLP大模型可以通過文本匹配,問答和對話系統(tǒng)、意圖識別等關鍵技術更好地賦能銷售環(huán)節(jié),取代目前逐漸上升的人力成本和低成功率的智能客服與營銷系統(tǒng),幫助服務人員快速提升業(yè)務水平,重塑消費者體驗。
在智能輿情方面,盤古NLP大模型可以利用文檔信息抽取、情感分類、文檔自動摘要等技術在金融,電商,政務領域?qū)崿F(xiàn)精準輿情分析、企業(yè)運營軟件分析。
天風證券認為,盤古NLP大模型可以實現(xiàn)一個 AI 大模型在眾多場景通用、泛化和規(guī)模化復制,減少對數(shù)據(jù)標注的依賴,讓AI開發(fā)由作坊式轉(zhuǎn)變?yōu)楣I(yè)化開發(fā)的新模式。未來隨著盤古系列AI大模型的上線,將持續(xù)賦能金融、電力、交通、氣象、物流等行業(yè)。
浙商證券研報也對其進行了分析,具體來看,華為云盤古藥物分子大模型歸為AI輔助藥物設計服務類。從 AI+制藥降本增效 Drug X 迎來重大突破、科技平臺與科研團隊聯(lián)手AI與生物醫(yī)藥雙向賦能、全流程輔助藥物設計 AI 未來大有可為三個角度列舉了華為云盤古藥物分子大模型的應用實例。
大模型增強了 AI 技術的通用性,助力普惠 AI 的實現(xiàn)。未來,大模型有望于場景深度融合,配合專業(yè)工具和平臺支持應用落地,開放的生態(tài)來激發(fā)創(chuàng)新,形成良性循環(huán)。
頭部企業(yè)均采取“模型+工具平臺+生態(tài)”三層共建模式,有助于業(yè)務的良性循環(huán),也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度、騰訊、阿里、商湯、華為等企業(yè),也有智源研究院、中科院自動化所等研究機構(gòu),同時英偉達等芯片廠商也紛紛入局。
3 月16日下午,百度CEO李彥宏在發(fā)布會上正式揭開了“文心一言”的面紗。“文心一言”是百度新一代知識增強大語言模型,它基于百度ERNIE及PLATO系列模型的基礎進行研發(fā),其大模型的訓練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等。李彥宏表示,雖然“文心一言”的實際能力還并不完美,但希望通過發(fā)布后的真實用戶反饋來幫助大模型快速迭代,加速模型能力的提升。
“文心一言”具備五大能力——
文學創(chuàng)作:發(fā)布會現(xiàn)場以《三體》為例,“文心一言”能夠?qū)Α度w》進行續(xù)寫,并能回答事實相關問題,體現(xiàn)出了強大的總結(jié)分析與推理能力。
商業(yè)文案創(chuàng)作:“文心一言”能夠為公司起名提供創(chuàng)意,并能直接進行商業(yè)新聞稿的創(chuàng)作,展現(xiàn)了模型的理解表達與創(chuàng)作能力。
數(shù)理邏輯推算:“文心一言”能夠看出題目本身存在的錯誤,并能給出正確題目的解題步驟,具備較強的數(shù)理邏輯能力。
中文理解:“文心一言”基于大量中文語料進行訓練,能夠解釋“洛陽紙貴”背后的經(jīng)濟學原理,并能寫出藏頭詩,展現(xiàn)了對中文的強大理解能力。
多模態(tài)生成能力:“文心一言”可以輸入文字生成圖像、音頻和視頻,并支持多種方言生成。文字生成視頻的能力現(xiàn)階段還未對外開放,但百度旗下的百家號已經(jīng)在使用這項技術。
李彥宏在發(fā)布會上宣布,已有 650 家企業(yè)首批接入了“文心一言”,涵蓋了互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行 業(yè),百度大模型在 B 端的生態(tài)圈迅速擴大。
2022 年 4 月,騰訊首次對外披露 HunYuan 大模型,協(xié)同了騰訊預訓練研發(fā)力量,完整覆蓋NLP大模型、CV大模型、多模態(tài)大模型及眾多行業(yè)/領域任務模型。
HunYuan-NLP:萬億級別中文NLP預訓練模型,參數(shù)量達1T,排名CLUE1.1總排行榜第一。
HunYuan-vcr:排名VCR(Visual Commonsense Reasoning)榜單第一。
HunYuan_tvr:跨模態(tài)文字-視頻檢索AI大模型。
HunYuan 先后支持了包括微信、QQ、游戲、騰訊廣告、騰訊云等眾多產(chǎn)品和業(yè)務,降本增效。依靠 HunYuan 的多模態(tài)理解能力,在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的應用,在為騰訊廣告帶來大幅GMV提升的同時,也初步驗證了大模型的商業(yè)化潛力。
HunYuan 大模型和騰訊廣告精排大模型基于太極機器學習平臺,共同完善優(yōu)化了廣告理解、用戶理解、廣告和用戶匹配的整個流程,提升對廣告理解、匹配效率、精準度和轉(zhuǎn)化效率。
HunYuan 大模型的生成能力,可以提升廣告制作的效率:“圖生視頻”功能,可以將靜態(tài)的圖片自動生成不同樣式的視頻廣告;“文案助手”功能,可以為廣告自動生成更恰當?shù)臉祟},提升廣告的效果;“文生視頻”功能,未來只需要提供一句廣告文案,就可以自動生成與之匹配的視頻廣告。
2022年9月,在阿里巴巴達摩院主辦的世界人工智能大會“大規(guī)模預訓練模型”主題論壇上,發(fā)布“通義”大模型系列,并宣布相關核心模型向全球開發(fā)者開源開放。阿里達摩院基于其AI統(tǒng)一底座構(gòu)建了通用模型與專業(yè)模型協(xié)同的層次化人工智能體系。
統(tǒng)一底座層:M6-OFA模型作為單一模型,在不引入新增結(jié)構(gòu)的情況下,可處理超過30種跨模態(tài)任務。
通用模型層:NLP模型“通義–AliceMind”;CV模型“通義-視覺”;多模態(tài)模型“通義-M6”。
專業(yè)模型層:深入電商、醫(yī)療、娛樂、設計、金融、工業(yè)、制造業(yè)等行業(yè)。
通義-M6為多模態(tài)大模型,已經(jīng)從 2020 年 6 月的 3 億參數(shù)基礎模型發(fā)展到2021年10月的10萬億參數(shù)全球最大預訓練模型到 2022 年 1 月的業(yè)界首個通用統(tǒng)一大模型M6-OFA。
2021 年 3 月,發(fā)布通義–AliceMind,為達摩院開源的深度語言模型體系,CLUE1.1總排行榜第二。
AliceMind生態(tài)體系包括:通用語言模型StructBERT、多模態(tài)語言模型StructVBERT、多語言模型VECO、生成式模型PALM、文檔圖像理解模型StructuralLM、表格理解模型SDCUP、超大中文理解與生成模型PLUG(24層StructBERT編碼器+“24-6”層的PALM編碼器-解碼器)、超大圖像-文本模型mPLUG等。
東方證券研報指出,目前人工智能最火熱的兩個賽道分別是生成(Generation)和通用(General),這兩條賽道相互交織并行,AI領域也進入了“雙G時代”。
在生成領域,以DALLE-2、StableDiffusion等引領的生成式AI技術與AIGC概念如火如荼;在通用領域,AI研究者們現(xiàn)在都在朝著通用人工智能(Artificial General Intelligence,AGI)的方向不斷努力,大模型不斷增強的多模態(tài)感知能力就是邁向AGI的重要途徑。
毋庸置疑,OpenAI及其GPT系列模型是當前人工智能賽道上的領跑者,超大規(guī)模模型帶來的知識涌現(xiàn)能力是ChatGPT出圈的關鍵。
OpenAI持續(xù)在GPT模型上發(fā)力,陸續(xù)推出規(guī)模更大的迭代版本GPT-2和GPT-3,在OpenAI的研究中,發(fā)現(xiàn)了當模型參數(shù)到達一定規(guī)模時,模型會開始涌現(xiàn)出In-contextlearning(上下文學習)、ChainofThoughts(思維鏈)、Zero-shot(能夠處理未見任務)等能力,而這樣的能力成為了ChatGPT能夠“更像人”的關鍵。
對比來說,我國的人工智能技術起步晚,經(jīng)驗積累不足,但是發(fā)展速度較快。隨著我國相關科技公司大力投入生成式AI、大語言模型的研究,我國在AI的“雙G時代”中將持續(xù)扮演追趕者的角色,爭取和國際領先水平縮小差距。