【潮汐商業(yè)評論/原創(chuàng)】
最近,人工智能領域現(xiàn)象級產(chǎn)品ChatGPT在海內(nèi)外引發(fā)熱議,掀起一陣全球科技競速賽。百度將在3月16日圍繞其生成式AI產(chǎn)品、大語言模型“文心一言”召開新聞發(fā)布會,消息一出就引起了業(yè)界人士的廣泛關注。這意味著百度有機會成為全球第一個做出類ChatGPT的大語言模型的科技大廠。有外媒評價稱,中國的百度已將自己投入到全球商業(yè)化競賽中,這場關于生成式AI這樣的下一代人工智能技術將會給互聯(lián)網(wǎng)帶來重大變革。
1、多年AI沉淀,百度厚積薄發(fā)
文心一言由最新大語言模型(LLM)提供支持,是百度的生成式AI產(chǎn)品。雖然今年百度才對外宣布開發(fā)類ChatGPT產(chǎn)品文心一言,但這對于百度來說并不是從零開始,更不是突擊了一兩個月做出來的。
百度的文心大模型和OpenAI的GPT模型類似,早在2019年就已推出,且經(jīng)過了多次的迭代了,從剛開始單一的自然語言理解延伸到目前的多模態(tài),包括視覺、文檔、文圖、語音等多模態(tài)多功能,因此“文心一言”所基于的ERNIE系列模型也已經(jīng)具備較強泛化能力和性能。
百度是全球為數(shù)不多、進行全棧布局的人工智能公司,進入人工智能時代之前,IT的技術棧一般可以分三層,底層的芯片,中間的操作系統(tǒng)和上層的應用。進入人工智能時代之后,百度的技術棧變成四層,分為芯片層、框架層、模型層和應用層。
從這個節(jié)點上我們?nèi)タ矗还苁敲绹€是中國,全球范圍內(nèi)能夠在四層都有較強布局的公司是寥寥無幾。
具備四層全棧能力的好處是可以實現(xiàn)端到端優(yōu)化,大幅提升效率。針對一些特定場景,四層之間互相可以有較多反饋,做到極致的優(yōu)化。像在搜索場景,百度的芯片在百度的搜索上已經(jīng)優(yōu)化了十年,所以今天百度AI芯片,在搜索場景上,就是全球效率最高的。
而即將發(fā)布的文心一言是基于百度自主研發(fā)的產(chǎn)業(yè)級知識增強大模型,全景圖由模型層、工具與平臺層、產(chǎn)品與社區(qū)層構(gòu)成。在模型層,文心大模型已經(jīng)包括36個大模型,涵蓋基礎大模型、任務大模型、行業(yè)大模型的三級體系,全面滿足產(chǎn)業(yè)應用需求,構(gòu)建了業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系;在工具與平臺層,通過大模型開發(fā)套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發(fā)平臺,全方位降低應用門檻;產(chǎn)品與社區(qū)層,包括AI藝術與輔助創(chuàng)作平臺“文心一格”、產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”和旸谷社區(qū),讓更多人零距離感受到最先進的AI大模型技術帶來的新體驗。2023年2月IDC發(fā)布《2022中國大模型發(fā)展白皮書》顯示,百度文心大模型處于行業(yè)第一梯隊,產(chǎn)品能力、應用能力、生態(tài)能力全面領先。
2、AI市場最佳代表,百度位居浪潮之巔
OpenAI、微軟想通過ChatGPT實現(xiàn)商業(yè)化落地,而他們的主要市場在英文場景,所以他們?yōu)橛⒄Z優(yōu)化是合理的。相反,百度并不試圖占領英語市場,作為中文自然語言處理起家的百度,必定會針對中文市場進行優(yōu)化。
李彥宏也公開表示,百度的文心大模型是中國市場非常本土化的大模型,這意味著百度現(xiàn)在正在研發(fā)的文心一言,將比國外開發(fā)的模型更適合中國。其先進性不僅體現(xiàn)為對中文語言的理解,還體現(xiàn)為對中國文化的理解。
按照百度的規(guī)劃,文心一言會率先落地在百度搜索。李彥宏也曾表示,文心一言將重塑信息的生成和呈現(xiàn)方式,推動搜索體驗的代際變革,并作用于百度移動生態(tài)服務場景與市場規(guī)模的擴大。一方面帶來更好的搜索和答案,另一方面用戶能直接與大語言模型交互,這將是對傳統(tǒng)搜索體驗的補充、升級,有機會形成新的流量入口,吸引更多用戶,并獲得市場份額,同時賦能平臺廣告商、內(nèi)容創(chuàng)作者和商家。
此外,文心一言將通過百度智能云對外提供服務,這將是百度“云智一體”戰(zhàn)略的里程碑,也意味著云市場游戲規(guī)則的根本性改變。
云服務從數(shù)字時代躍遷至智能時代,之前選擇云廠商更多看算力、存儲等基礎云服務,未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用之間的協(xié)同。與此同時,文心一言還將與小度進行集成,升級小度智能設備和服務。
在馬太效應愈發(fā)凸顯的當下,科技競賽本身就是快魚吃慢魚,誰先卡位誰是贏家。所以從某種程度上來說,中國一定要有自己的ChatGPT,哪怕初期階段無法做到完美無缺,但若能達到ChatGPT去年問世的水平就實屬難得了。畢竟作為中國企業(yè)的唯一代表,能在此時第一個站在全球技術競賽的“奧運賽場”上,“上場”這個行動本身就是一種勝利。
況且只要文心一言對外發(fā)布,數(shù)據(jù)、query閉環(huán)起來后,早上線一個月都意義非凡,且擁有巨大優(yōu)勢。同時,隨著真實的用戶、開發(fā)者調(diào)用和模型迭代之間的飛輪開始轉(zhuǎn)動,大量訓練會快速積累經(jīng)驗,系統(tǒng)會顯著提升,初期的不完美也會被不斷迭代。