2023年10月17日,文心一言發布后的第7個月,百度在世界大會上,對AI成果做了全面的復盤。
相較于2023年3月16日“文心一言”初次發布,李彥宏在世界大會上顯得游刃有余得多。
李彥宏 圖源:百度
在開場演講中,他宣布文心大模型更新到4.0版本,并且給出了百度對文心大模型綜合能力的判斷:
“綜合能力與GPT-4相比毫不遜色。”
模型底座能力的更新,帶來的是應用生態的更新和重構。李彥宏認為,“理解、生成、邏輯、記憶”,這四大能力是AI原生應用的構建基礎。
“革舊迎新”,是文心大模型4.0發布后,百度一系列舉措的主題。
一方面,文心大模型對搜索、辦公、營銷等原有移動生態的業務矩陣,全線產品都基于AI改造完畢;
另一方面,作為8月首批獲得服務許可證的大模型廠商,百度基于文心大模型推出了第一批自研的AI原生應用,落地到了百度網盤、如流、千帆大模型平臺、GBI、智艙等場景。
基于更大的算力和數據,并且擴大參數規模,是文心大模型迭代到4.0的主要方法。在9月初,文心大模型4.0已經達到了上線標準,并提供了小范圍測試。
接入文心大模型4.0的文心一言。圖源:作者截圖
百度CTO王海峰表示,文心大模型4.0理解和生成能力的提升幅度相近,提升比較顯著的是邏輯和記憶能力,邏輯的提升是理解的3被,記憶的提升幅度是理解的2倍。
相較3.5版本,4.0版本分別在輸入和輸出環節都做了知識點增強:在輸入環節,搜索引擎可提升對知識圖譜的理解和查找能力;在輸出環節,通過數據庫的反饋機制,提升輸出結果的準確性。據了解,從3月以來,訓練算法的效率提升到了3.6倍。
如今,大模型競爭已經進入第二階段——拼落地、拼應用,百度在這一側顯然不愿落下。在世界大會上,千帆還推出了自己的“App Store”——AI原生應用商店,為基于文心大模型開發的應用提供了交易平臺。
目前,應用商店已經針對智能辦公、營銷服務、行業職能、生產提效、分析決策5個場景上線了百度自研以及客戶開發的AI應用。
AI原生應用商店。圖源:百度
“中國有豐富的應用場景,中國用戶又天然愿意擁抱新技術,有了先進的基礎大模型,我們就能構建起一個繁榮的AI生態,共同創造新一輪經濟增長。”李彥宏總結。
圖源:百度
要做應用,工具也必不可少。對此,千帆平臺推出了AI原生應用開發平臺。這一開發平臺分成了應用框架和應用組件兩個部分,分別提供應用開發的“樣板間”,以及工具。
截至目前,千帆平臺上已經入駐了包括Llama2在內的42個國內外主流大模型入駐,已經用17000家企業通過調用不同模型的API,進行應用的開發。
與此同時,即日起企業客戶可在千帆平臺上申請文心大模型4.0 API的內測。
AI原生應用開發平臺。圖源:作者拍攝
在應用框架之下,百度提供了檢索增強生成(RAG)和智能體(Agent)。這也是百度首次推出RAG框架,RAG的原理是將文檔分割成不同的切片,利用向量數據庫統一成可供訓練的數據。基于RAG,企業就能夠基于大模型根據業務需求開發文檔問答等應用。
關于應用RAG的價格,百度集團執行副總裁、百度智能云事業群總裁沈抖透露,文檔問答開發的成本僅數百元,而單次文章分析的成本在幾分錢。
李彥宏認為,插件是一種特殊的AI原生應用,門檻最低,最容易上手,并且可以完善大模型的功能。此前,百度云推出了靈境矩陣插件平臺。
目前,已經有2.7萬開發者申請入駐,覆蓋了20多個領域,包括法律、口語練習等。
重構搜索,是自ChatGPT發布后,業界認為最先能落地的場景。
百度搜索上線數據整合生成圖表功能。圖源:百度
百度搜索通過大模型理解,能夠在頁面首條給出整合后的答案。在呈現方式上,百度搜索還可以結合多模態能力,在數字、趨勢相關的問題上,給出相應的動態圖表。在解答后,百度搜索能推薦更為相關的一些問題。同時,百度在搜索過程中加入多輪交互的能力,用戶可以不斷追問。
類似于ChatPDF,百度文庫的AI改造主要瞄準的是用戶的文檔理解和整理的需求。
此前在與溝通會上,百度副總裁、互娛與垂類負責人王穎介紹,當下百度文庫每周實現2-3個新功能的迭代,近一個月就陸續上線文檔生成PPT、文生圖表及分析洞察、PPT圖表生成、文檔智能總結及問答等功能。
值得一提的是,如今百度文庫不止能夠在文檔內容上做文章,還能根據文章內容,自動生成不同風格的PPT。李彥宏表示,新百度文庫已經吸引了超過200萬用戶的使用。
百度文庫PPT生成功能。圖源:百度
而針對內容創作者,百度在App上線了AI創作引擎,根據營銷、攻略、內容分享等不同需求生成文案和圖片。
在直播電商上重新出發的百度,這次基于文心大模型推出了AI Native營銷平臺“輕舸”。
“輕舸”不僅集成了智能營銷對話機器人“品牌BOT”等AI工具,還為商家提供了生成式AI時代營銷方法論“AIA營銷科學”,以及上線了提供用戶洞察、分析、內容制作的AI工具和服務的商業引擎“揚楫”。
此前,百度網盤已經推出了內嵌在App內的“云一朵文件助手”。“云一朵”好比是針對網盤內容的智能助手,用戶通過輸入自然語言指令,就可以找到網盤存儲的相對應的文檔、視頻等文件。
相較于以語言、圖像處理為重心的智能助手,“云一朵”的優勢在于還能處理視頻,完成提煉視頻內容、添加字幕、將字幕導出文檔、添加文稿標題等功能。
云一朵的視頻理解功能。圖源:百度
此次“云一朵”能力的最大升級,在于連接了微信生態,能夠智能總結用戶轉發的任意公眾號文章。據百度介紹,百度網盤云一朵用戶已達到2000萬。
在釘釘、飛書相繼基于大模型,推出針對工作場景的AI助手后,如流也逐漸完善了AI功能。當然,三家的功能也大同小異,主要針對會議、休假、差旅、知識庫幾大場景做文章。
在企業微信、飛書和釘釘市占率已經超過90%的情況下,如流絕地反擊的難度并不小。百度的策略是,先讓如流的超級助理勝任更為負責的工作,并具有自主決策的能力。
百度智能辦公平臺部總監和為認為,此前如流上線的AI功能工具屬性很強,但不是真正意義上的智能工作。百度提供的數據顯示,如流上線的“AI會議洞察”功能,目前已經讓會議內容閱讀量增長了3.5倍。
如流超級助理可支持差旅安排。圖源:百度
BI(Business Intelligence)本質上是分析系統與數據庫的交互,是商業數據分析環節中不可缺少的一部分。傳統BI的使用門檻高,用戶需要遷就系統,通過輸入專業問題,才能得到準確的數據。
此前,百度推出的Sugar BI已經融合了AIGC能力,推出“文心問數 Sugar Bot”,支持用戶通過對話來完成數據檢索、報表制作等工作。
在大模型能力的加持下,百度推出了GBI(Generative BI,生成式BI)。GBI的“生成”,體現在支持自然語言對話式的交互,降低了使用門檻。
GBI。圖源:百度
與此同時,GBI具有較強的擴展性,可以支持鏈接各行業領域的數據源。為了應對“行業黑話”,企業還可基于專業知識數據庫對GBI進行訓練,滿足專業領域的分析需求
GBI的優勢還在于,預制了多元的接入方式。企業既可以在GBI平臺上上傳數據進行查詢和分析操作,也可以私有化部署完整的GBI能力。而對于數據高敏、但預算有限的企業,GBI也可僅提供GBI智能問數的接口,企業可以直接接入原有的OA、ERP等系統。
通過融合億級POI(Point of Interest,興趣點)知識和萬億級交通感知,文心一言完善了百度地圖的功能。
在世界大會上,百度地圖上線了出行地點、中間聚會點、出行方式、出行路線的智能推薦、規劃功能。
百度地圖AI向導。圖源:百度
這次,百度也將加入Apollo智艙大模型的極越01搬到了世界大會現場。
極越01.圖源:作者拍攝
體驗極越01的最大感受,就是語音成了車內的主要交互形式,AI可以在嘈雜或者多人交談的環境中,識別不同用戶的需求,應用于導航、用車、娛樂、信息服務等場景。
在百度智能駕駛事業群組(IDG)智能汽車業務部總經理蘇坦看來,大模型時代下汽車座艙中的人機關系,是人和虛擬人之間的關系。
以文心大模型為底座,百度基于Apollo百萬量級智能汽車在不同場景下的數據積累,推出了Apollo智艙大模型和智艙開發工具鏈。目前,除了極越01,基于Apollo智艙大模型的車載語音產品已經在凱迪拉克銳歌、別克E5、吉利銀河L7、吉利銀河L6等車型中量產搭載。
接入大模型的小度,衍生出了三款更為細分的硬件種類。
針對家庭陪伴場景,小度推出了添添家庭機器人,能夠針對家庭生活中看護、娛樂、日程安排等需求,智能變換為機器人、平板、音響形態。添添家庭機器人計劃在2024年春季上市。
與此同時,針對教育場景,小度推出了青禾學習一體機;而針對哪些對音質有更高要求的用戶,小度推出了智能音響的高端線“Tiantian Casa”。
小度新品。圖源:百度