沒想到啊沒想到,百度這次居然玩的這么大!
10月17日,百度舉辦了“2023百度世界大會”。一開場,李彥宏就興奮地宣布“文心大模型4.0正式發布”,甚至還說出“文心大模型4的綜合水平完全媲美GPT-4”的豪言壯語。要知道,GPT-4被認為是迄今為止最強大的AI模型,不只是陪你聊天幫你畫畫的那種強,而是“律師模擬考排名前10、GRE口語接近滿分”的那種強。
▲圖:李彥宏宣布文心大模型4.0正式發布
李彥宏覺得,當下流行的、在原有產品中加入AI輔助(AI-based)的混動模式,未來將無法為火力全開的AI提供足夠的燃料,所以,百度要全面轉型“AI原生”。不是所有產品都接入AI的那種全面,而是“所有百度產品全部重做”的那種全面。
并且,不是光說的喔!這次百度真的拿出了十余款“AI原生應用”,包括重構的百度搜索、新文庫、網盤(云一朵)、地圖等,以及號稱國內首款生成式商業智能(GBI),可以實現秒劃重點、一鍵差旅等功能,并在現場進行了演示。
我們也試著體驗了一下百度網盤的AI功能。
▲圖:在百度云盤種,利用AI對視頻進行解讀
盡管如此,我們還是有一個巨大的疑問,到底百度AI發展到了什么程度,才會讓李彥宏說出“不輸GPT”“全面轉原生”的話?
01、媲美GPT的,不只是版本號
自從AI誕生之日起,科學家就一直夢想著有朝一日,AI可以像人類一樣思考。既能理解人類的需求,也能理解背后的潛臺詞和隱含的信息,同時,AI還應該能夠進行邏輯推理,并且在多輪對話中不會斷片,隨時接得上之前的話茬。
簡單來說,AI的核心能力體現在理解能力、生成能力、邏輯能力以及對上下文的記憶和推理能力上。
通過4個案例,李彥宏展示了文心大模型4在理解、生成、邏輯、記憶這4個方面的表現。
值得一提的是,這次沒有放錄像,而是現場演示。
▲圖:李彥宏展示文心大模型記憶能力
在展示文心理解能力時,李彥宏要求文心回答在承德買房能否使用北京公積金的問題。但李彥宏挖了個坑,并沒有直接說出要用北京公積金,只說“想在承德用公積金買房,在北京工作”。然而文心不僅準確的理解了這個前后亂序的表述,甚至還理解了背后的潛臺詞:在北京工作,很可能在北京繳納公積金;想在承德買房,很可能是承德戶口。
最終,文心給出了準確且詳細的解答。
接下就更神了。
李彥宏只給了文心一張汽車圖片,然后讓它做出帶文字的海報,甚至要求“結合已有視頻,生成一個數字人口播視頻,用于投放信息流廣告”,AI都很好的完成了,全過程不到3分鐘。
隨后,李彥宏還不忘詢問在座的各位文案工作者,如此一人能頂一個隊伍的效果,大家是否感受到了大模型的威力?
在考驗文心邏輯能力時,李彥宏舉了一個輔導孩子作業的例子。文心不僅僅可以詳細的給出解題步驟,同時還能對題目中用到的知識點給予解答。
為了展示文心的記性有多好,李彥宏只提了一個要求:“武俠小說,主人公是女生,情節要跌宕起伏”,文心就生成了一個天選之子對抗武林黑惡勢力的故事大綱,并將主角設定為名叫靈兒、擁有操縱內力和飛行力量的女生。
接下來就好玩了。李彥宏開始不斷的增加需求,而文心就像個乙方一樣不斷的給出解決方案。最后李彥宏突然像老師抽查學生一樣,問它主角的能力是什么?不出預料,文心沒有忘記自己開頭的那個設定。
除了C端應用案例外,百度還展示了AI在B端的落地實踐。
無論是C端還是B端,百度都在不斷強調“AI原生應用”這個概念。那我們不禁要問,什么樣的應用才算“AI原生應用”?而AI原生應用和我們平時感受到的AI應用有什么區別,難道說我給自己的AI應用加個“原生”,它就啟動了?
02、AI原生,讓AI徹底放飛自我
首先我們要明確一個設定,那就是:AI原生(AI Native)≠AI混動(AI-based)。
目前我們能享受到的AI能力,絕大部分都是AI功能的整合或接入,這類應用很早就被科技公司部署到了產品中。例如亞馬遜對AI的應用可以追溯到1998年,而根據網信辦數據,當時美國的互聯網普及率也只有18.6%。
隨著AI技術的發展,AI整合和接入的場景變得更加多樣化,大有一種從開發者專武到多行業泛用、從少部分人受益到更多人受益的趨勢。
▲圖:百度AI原生應用“全家桶”
2021年GitHub推出AI編程助手Copilot,只需要給出一句話描述,就能自動生成一段代碼,極大的提升了編程效率(體驗)。此時Copilot的受眾,僅限于具有一定經驗的開發者。
而到了2023年,微軟將Copilot集成到Office套件中,只要能用到Word、Excel、PowerPoint、Outlook、Teams的地方,都能享受到AI帶來的效率提升,使得Copilot能夠為更廣泛行業的用戶群體服務。
盡管如此,此時的AI依舊只是作為產品的一個附贈功能,用戶仍然需要先熟練使用原有產品,才有機會享受到AI帶來的輔助加成。而填補用戶和AI之間鴻溝的重任,被寄予到了AI原生身上。
AI原生和AI-based的關鍵區別,在于是否將AI作為核心。
AI-based應用中,核心是原有產品,AI只是加分項,有了更好、沒有也不耽誤;而在AI原生應用中,AI是根基,沒有AI就沒有AI原生應用。
一句話:AI原生產品的每一個細胞都帶著AI的基因。
▲圖:AI原生和AI-based應用的區別
AI原生具有以下幾個特點:數據驅動、持續學習、自適應和自主性,以及NLP。
相比AI-based,由于AI原生本就建立在AI的基礎之上,所以不需要向后兼容原有產品。而AI-based因為是將AI功能整合到原有應用中,不可避免要做出取舍,影響AI發揮全部能力。
更重要的是,AI原生將有可能改變人機交互方式。在AI原生應用中,用戶只需要給出提示詞,即可一站直達目的地,如此一來,復雜的多級菜單就顯得沒有必要了。
例如一個創作者使用視頻剪輯工具制作視頻,需要操作很多選項,尤其是在時間線上的反復跳轉,十分耗費精力和時間。而在AI原生應用中,用戶只需要描述出想要的結果,編輯軟件會自己去調整各種參數。在時間線上,用戶只需要說出視頻內容,AI會自動跳轉到對應的片段。這樣一來,很多下拉菜單、右鍵點擊、快捷鍵等操作都不需要了。
而李彥宏的設想更激進,他覺得所有AI原生應用交互不會超過兩級菜單,因此現有的百度產品,全部要基于AI原生進行重構。可想而知,一旦這個巨大的工程真的實現了,整個產品的邏輯、交互的方式等等都會產生巨大的變革。
可是,別的大廠都不做,百度為什么這么頭鐵?
03、百度的勇氣,來自一把刷子
百度的勇氣,來自一把“刷子”
去年百度世界大會上,李彥宏說“每個人、每家企業都要有一把自己的刷子,技術就是百度的那把刷子。”目前看來,這把刷子還挺好用。
在IDC 發布的《AI大模型技術能力評估報告,2023》中,共選取了9家大模型技術廠商進行重點研究,通過用戶訪談調研,從用戶關注的技術能力、產品功能、生態服務等方面進行評估,得出結論“百 AI大模型整體競爭力位于領先水平,在模型能力、工具平臺、生態布局以及行業覆蓋上優勢明顯,并已提前進入商業化落地探索階段”。
而據多個公開測評結果,文心大模型3.5的綜合能力已超過ChatGPT 3.5。
▲圖:李彥宏
新的文心大模型,則在已有基礎上,進行了大幅提升。號稱可以媲美GPT-4的文心大模型4.0,在參數量、訓練數據量以及推理成本上,比3.5高出一個數量級,其理解、生成、邏輯、記憶核心能力都有極大的提升。
文心大模型4.0在9月已開始小流量上線,過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今,用戶規模已經達到4500萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。
據王海峰介紹,通過文心大模型生成的代碼,采納率在百度內部達到了40%,高頻用戶甚至高達60%。并且,文心大模型4.0還在以下方面獲得了突破:
· 萬卡算力上運行飛槳平臺,通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化,支持了大模型的穩定高效訓練
· 建設了多維數據體系,形成了數據挖掘、分析、合成、標注、評估閉環,充分釋放數據價值,大幅提升模型效果
· 基于有監督精調、偏好學習、強化學習等技術進行多階段對齊,保證模型更好地與人類的判斷和選擇對齊
· 可再生訓練技術通過增量式的參數調優,有效節省了訓練資源和時間,加快了模型迭代速度
▲圖:王海峰介紹文心大模型4.0的創新和突破
而這一切,靠的就是更大更好的模型、更大算力、更多數據,以及更強算法。
04、AI的最大價值,人人受益
AI技術的發展,讓人們看到了未來無限的可能性。
視頻制作公司Waymark使用Dall-E創作了一部12分鐘的短片《The Forst》(霜),從腳本、到畫面完全由AI生成,最終效果和好萊塢大片相比也毫不遜色。
▲圖:AI制作的短片《The Forst》鏡頭
電商軟件加入AI機器人,可以做到24小時隨時隨地秒回復用戶的提問;辦公軟件接入AI,讓很多復雜的流程變得簡化,檢索文檔、數據變得更加方便;利用AI的識圖能力,用戶可以拍下眼前的食材直接讓AI生成食譜;而通過AI的語音識別能力,可以為視頻、錄音等生成字幕,并對內容進行總結。
但李彥宏覺得這還不夠。
他認為AI的潛力,是每個人都能夠從中獲益、每個行業都能夠得到提升的能力,這就需要更多人參與進來,開發出更多行業應用。而檻最低,也最容易上手,能讓開發者、創業者快速加入到生態中的方式之一,就是插件。
依托文心大模型,百度為開發者、創業者提供了一個創造AI原生應用的土壤,之后,就可以像滾雪球一樣,開發出更多、更能滿足用戶多樣化需求、提升不同行業效率的AI原生應用。
隨著這個雪球越滾越大,未來的“AI原生世界”,越來越讓人期待了!
作者|吳狄
編輯|胡展嘉
運營|陳佳慧
出品|零態LT(ID:LingTai_LT)