“搜索是AI規模最大的應用場景”,在日前舉辦的WISE2022新經濟之王大會上,百度集團資深副總裁、百度移動生態事業群組(MEG)總經理何俊杰表示,目前,百度搜索、百度APP是AI規模最大的應用場景,隨著AI預訓練大模型、AIGC、數字人等新技術的規?;涞?,其AI帶來的創新優勢將更加凸顯。
近十年來,AI與搜索結合得愈發緊密,AI從搜索獲取數據和反饋不斷進化,反過來也在大幅提升搜索的智能化水準,兩者形成類似于DNA的“雙螺旋”結構,可謂取之于搜索也用之于搜索。
當AI技術滲透到千行百業的傳統產業時,它在互聯網業務上也一直在持續落地,搜索引擎就是最重點的一個場景,也可以說是目前應用最早、最廣、最深的場景。
作為最廣泛的基礎互聯網應用,搜索一直伴隨用戶左右,也正因為此,它日積月累的進化很難被用戶感知。不過,如果將時間線拉長,人們將很容易感受到這樣的變化。把同一個關鍵詞鍵入搜索引擎,今天的搜索結果和10年前的已大不一樣。
10年前PC時代的搜索引擎長什么樣?聯想一下我們用得最多的百度:簡潔的白色頁面有一個搜索框,鍵入關鍵詞后,就會得到一個網頁列表,而決定用戶體驗的只有一個因素:結果是否足夠多,排序是否足夠準。彼時的搜索引擎背后的原理也相對簡單:爬蟲服務器持續爬取海量網頁內容形成“關鍵詞-結果頁”的索引數據庫,搜索引擎收到請求后拆解關鍵詞再到索引數據庫查找答案,根據算法對結果進行篩選、排序,最后給出用戶看到的搜索結果頁。
不過,今天在人們普遍使用的百度App,搜索結果頁已不再是簡單的網頁列表,而是個性化、智能化的聚合內容,比如搜索“馬云”,聚合頁除了馬云的百科、新聞,還有相關的互聯網大佬,馬云演講視頻等等;再比如搜“天氣”,我可以看到身處地廣州的天氣組件,以及科普、天氣小程序等等。
除了搜索結果頁面更個性化外,搜索也更能理解用戶的問題了。
用戶可以像問身邊朋友一樣用口語提問,比如“韓國有部電影野獸輪船在空中飄著叫什么名字”,搜索引擎可基于深度語義理解問題并匹配答案。
用戶可以直接搜索導購這樣的服務,比如問“智能鎖哪個品牌好”,結果中就是品牌榜單。
搜索還能理解視頻內容,基于AI可智能節選視頻中能夠回答搜索問題的片段。比如當用戶問“揚子鱷多長”時,就能得到更直觀的視頻內容。
今天用戶使用百度App已不再需要任何“專業搜索技巧”就能進行“傻瓜式”提問。除文字外,用戶也可以圖片、聲音進行更簡單的搜索,在語音搜索這一功能上,除了普通話外,百度App還支持了粵語的提問與回答。中華語言博大精深,有些地方還有“五里不同音,十里不同調”的說法,百度App未來支持更多方言是可預見的。
上面這一切的搜索進化都得益于AI技術的應用。AI技術一方面更好地理解內容,另一方面更好地理解用戶搜索請求,結果就是可以給出更加精準的答案,這對移動搜索至關重要。隨著IoT時代搜索入口的多場景化,用戶對搜索的準確性要求越來越高,比如語音助理就只會給搜索引擎一次回答機會。因此搜索的終極發展目標是只給用戶一個答案——他最需要的答案,少即是多。要做到這一點很難,但方向卻一直都很明確:做AI技術驅動的搜索引擎,這正是百度搜索這10余年進化的方向。
這兩年,在深度學習經過10余年發展后,預訓練大模型成為AI產業新的技術熱點。由于工業化階段的AI需支撐更廣泛普適的場景、滿足更大更復雜的AI計算需求,人工標注的數據模型訓練模式已捉襟見肘,具有“巨量數據、巨量算力、巨量算法”特性的AI預訓練大模型成了產業智能化的基礎工具,其可采取自監督學習的方式對海量無標注數據中的規律和知識進行提煉、學習。百度、谷歌等巨頭的探索表明,基于預訓練大模型的NLP技術的效果已超過過去最好的機器學習能力。2022年紅極一時的AI作畫、AI作文、AI外交官等應用,背后都是AI大模型在驅動。
百度也已將AI大模型應用在搜索這一核心業務中,在2022年萬象大會上,百度發布了跨模態大模型“知一”和新一代索引“千流”?!爸弧笨衫斫庖曨l、文字、圖片、信息流等全網形態各異的資源,使得搜索不再受限于信息的形態?!扒Я鳌?nbsp;則可對海量內容進行索引,更快地篩選出搜索相關的答案,相較于傳統搜索引擎而言,成本降了一半、速度快了兩倍。
在“智能搜索+智能推薦”的雙引擎模式下,百度搜索每天響應來自100多個國家、幾十億次的搜索請求。由于搜狗等老牌搜索玩家出局,很多人以為搜索行業在走下坡路。但百度數據卻給出了相反的結論。百度財報顯示,今年9月百度App MAU已達到6.34億,同比增長5%。而據何俊杰在WISE大會上介紹,“過去一年,百度搜索的規模有增無減,年同比實現了17%的增長。百度APP也強勁增長,第三季度移動端搜索查詢次數同比實現兩位數的增長,百度App信息流內容分發量同比增長23%?!?/p>
搜索引擎是最古老的互聯網應用之一,到今天為止也是最基礎的互聯網應用之一。從百度給出的最新數據來看,搜索引擎“國民剛需應用”的屬性并未改變。不論短視頻、直播等媒體內容形態如何變遷,人們都需要用搜索。而從百度發布的跨模態大模型“知一”和新一代索引“千流”來看,搜索引擎一直都在“吃”著最前沿的AI技術,不斷進化。
何俊杰說“搜索已經成為AI規模最大的應用場景”,這可能在一些人的意料之外,但在羅超頻道看來卻是情理之中。一直以來,搜索都是AI最核心的練兵場。AI技術生于實驗室,但卻發展于搜索。時至今日,搜索引擎仍舊是AI技術的核心練兵場。
AI有著多年發展歷史,1982年物理學家約翰·霍普菲爾德就發明了Hopfield神經網絡,1986年深度學習之父杰弗里·辛頓提出BP算法加速了神經網絡發展,不過因為缺乏對應的算力、場景與數據,AI并未迎來爆發。2012年前后隨著谷歌大腦項目被曝光,深度學習開始為大眾關注。此后,深度學習算法在圖像識別等應用中不斷取得進展,2016年谷歌AlphaGo擊敗人類讓其一戰成名。
不過AI技術真正大規模商用,最先還是從搜索引擎開始的。在谷歌大腦啟動的同一時間,國內的搜索巨頭百度也在積極探索AI,只不過它最先沒將AI應用到圖片識別或者下棋上,而是從自然語言處理開始的,這是搜索的基礎技術之一。2010年百度成立以“理解語言,擁有智能,改變世界”為使命的自然語言處理部(NLP),此外還有互聯網數據研發部(包括知識圖譜和互聯網數據挖掘)、推薦引擎和個性化部、多媒體部(包括語音和圖像技術)、圖片搜索部、語音技術部等,這些部門研發的技術都是AI強相關,特別是自然語言處理技術,更是被視作是人工智能皇冠上的明珠。
2013年百度又正式成立了深度學習實驗室(IDL)。當2014年李彥宏宣稱“百度大腦智力已接近三歲小孩”時,AI技術已在百度被大量應用,語音搜索、圖像搜索、百度翻譯、百度地圖…都有大量人工智能技術支撐,即便是最簡單的文字搜索,百度的結果也變得更準,因為在AI驅動下它可以更好地理解用戶需求與理解海量內容。2016年深度學習被坊間熱議時,百度已經走出很遠。
AI率先在搜索引擎場景大規模商用并不讓人意外。
第一,AI與搜索都具備“數據驅動”的本質。AI技術的出現給搜索引擎帶來了全新的可能:基于海量數據訓練的模型讓搜索引擎“自學習”,進而更好地理解需求和內容,給用戶帶來更好的體驗。
第二,AI與搜索的終極目標都是具備“認知”能力。
圖像識別、語音識別等AI技術只有“感知”能力,是弱人工智能,但強人工智能需要機器具有認知能力,也就是知識獲取與應用的能力。知識對搜索也是基石般的存在,當前谷歌、百度等主流搜索的底層也都有一個巨大的知識圖譜,它們進化的主要方向就是基于AI技術不斷強化認知能力。
第三、幾乎所有AI技術都能在搜索找到應用場景。
搜索引擎不等于一個搜索框。今天的搜索已無處不在,除了智能手機、PC等傳統設備外,智能音箱、智能汽車、智能家居、可穿戴設備等等智能設備都有大量的搜索應用。大量的搜索場景給AI技術創造了大量應用空間,語音、圖像、智能預測、智能翻譯、智能推薦、數字人、AIGC等AI技術都已在搜索引擎上落地。
AI在搜索引擎得到了大規模商用,同時也擴散到了社交IM、信息流、短視頻、美圖、在線教育等等互聯網應用,如今則滲透到更多行業成為各行各業數智化基礎設施。在從搜索這一“圓心”不斷擴散出到更多“圓圈”的過程中,AI也在數據與場景的反哺下不斷進化,先后出現了深度學習框架、預訓練大模型等重磅AI技術。如今搜索依然是AI的核心應用場景。
很多人覺得自動駕駛、智能交通、工業互聯網等產業場景才是“AI密集型產業”,實際上搜索引擎也屬于AI創新應用的排頭兵。從一開始,搜索就是AI最核心的場景,因此在全世界范圍內AI最強的公司,都是以搜索引擎為主業的公司,比如國外的谷歌,國內的百度。在被騰訊收購前搜狗也是國內AI行業的強勢玩家,騰訊吞下它更多是看中它在搜索與輸入法中錘煉出來的NLP、知識圖譜、語音等AI技術。
做好AI不只是要有強大的算法,更要有大規模可商用的場景,場景意味著數據意味著反饋。做AI最早的是科技巨頭是IBM。1997年它研發的計算機“深藍”(Deep Blue)戰勝了國際象棋冠軍卡斯帕羅夫;2011年又研發了沃森超級計算機,作為一個有10臺普通冰箱那么大的計算機系統,其在AI上的表現還不如Siri。IBM做AI很早卻不能進入第一陣營?因為沒有場景,沒有數據,沒有反饋。
在WISE大會上,何俊杰也談到了反饋對技術創新的重要性,他甚至表示百度能持續實現科技創新的心法就是“反饋驅動創新”,只有“市場不斷地在給你反饋,你才有機會去一步一步地往前走,實現創新。”由此可以看出,倘若一項技術走不出實驗室,不能落地到應用場景,很可能就是閉門造車。而當技術成功走出實驗室,它就可以在場景中不斷得到反饋,得到反哺,得到進化。這一點也是百度搜索可以成為最大的AI應用場景的關鍵。
為什么百度搜索成了AI規模最大的應用場景,并扛起AI創新應用的大旗,有幾點核心原因:
1、AI技術必須要在真實場景中錘煉,通過“吃數據”不斷進化。AI的四要素是算力、算法、數據和場景。不論是AI芯片、深度學習平臺、大模型還是語音等AI應用算法,都需要真實場景的數據反哺。百度搜索是國民級互聯網應用,百度APP擁有6.34億月活,百度搜索每天響應幾十億次的搜索請求。此外,隨著萬物互聯時代到來,搜索已從“搜索框”走向“無處不在”,呈現出多場景、多設備、多入口的特征,從小度智能音箱、Apollo無人駕駛車、小度添添智能健身鏡,到百度App、百度地圖、好看視頻、百度貼吧、百度輸入法、百度網盤、百度健康、YY直播以及百度生態中的海量互聯網應用,再到數字人、元宇宙……百度智能搜索已服務于用戶生活的方方面面,包括家庭、工作、出行、娛樂到虛擬等全部場景。也正因為此,何俊杰才有底氣說,百度移動生態擁有“離用戶最近的一個反饋窗口,能夠不斷的檢驗新技術、新產品。”
2、百度深耕AI 10余年,練就了一身AI真功夫。
百度2010年成立多個AI相關團隊的目的均是為了改進搜索,可以說百度是最早做AI+搜索場景的。
此后10余年,百度將AI當成公司核心戰略,在前段時間的2022聯想創新科技大會上,百度創始人、董事長兼首席執行官李彥宏透露了一組關鍵數據:“作為一家技術公司,百度過去十年累計研發投入超過1000億元?!倍|級巨量資金,均被投入到AI前沿、底層技術以及相關應用技術的研發中。
當然,百度千億的AI投入不只是全部被應用到AI搜索上,除昆侖AI芯片、飛槳深度學習平臺、文心AI大模型等AI基礎組件外,還有AI與量子計算、科學計算、生物計算、航空航天等前沿技術的融合,以及依托百度智能云所推動的AI產業化應用。但這些年百度一直都沒停下來的一件事,就是持續探索AI與搜索的結合。從底層芯片到預訓練大模型再到上層算法應用,百度全棧自研的AI能力都會被率先應用在搜索場景。
比如今年上線百度App的個性化AI伙伴度曉曉,它底層是文心大模型在驅動,也是百度在數字人上的最新技術成果。作為國內首個可交互虛擬偶像,它可在百度APP給用戶提供全程AI陪聊式交互搜索功能,刷新了搜索體驗。
百度為何總會搜索這一“本業”上先大規模應用一項AI技術?除了搜索引擎本就是AI天然的“練兵場”外,我認為百度此舉一箭雙雕:
一方面AI技術加持可直接提高搜索體驗,不論是更準確的搜索還是更創新的搜索,都可助其強化在搜索行業的地位,鞏固核心業務就能穩住基本盤。何俊杰說,百度做AI“能攀珠峰,就不爬玉龍雪山。”通過壓強式、馬拉松式的投入,百度人工智能的各個層面都有領先的自研技術。百度搜索則“近水樓臺先得月”,率先應用其強大的AI技術不斷進化,日拱一卒升級體驗,我想這是百度搜索這些年來穩居中文搜索一哥位置的關鍵所在。
另一方面,在溢出效應下,將AI技術開放給產業已成為百度新的增長曲線,其Q3財報里智能云、智能交通等業務都已在貢獻增量。而經過大規模C端消費級應用“驗證”與“錘煉”的AI技術,在開放給產業時也更具競爭力、號召力與吸引力,這跟阿里云強調其技術是“雙11同款”的道理是一樣的。
以昆侖芯片為例,作為中國第一款自研云端全功能AI 芯片,其在國產芯片、AI芯片領域已成為領先IP。為什么可以?這一點何俊杰給出了解釋:昆侖芯片前端有一個巨大的應用“搜索”,可以基于反饋,實現端到端的優化,比如昆侖1代已在百度搜索引擎、小度等業務中部署超過2萬片,服務50多家外部客戶,是國內唯一一款經歷過互聯網大規模核心算法考驗的云端 AI 芯片。“在搜索這樣國民級產品實時、海量的反饋下,新技術、新產品就不只有實驗室里的理論高度,還有大市場里的實踐力度。”
百度早已從搜索引擎升級成AI公司,但這并不意味著百度不做搜索了,相反,百度是真的將“AI+搜索”這件事給做透了,搜索與AI形成了很強的協同效應,兩者都受益。
3、百度不只是搜索引擎,更是超級內容平臺。
移動時代不同平臺都在建籬笆,將內容圈起來,這對搜索引擎不是好消息。好在百度很早就未雨綢繆,一方面通過投資、合作、小程序等手段不斷聚攏第三方內容;另一方面則持續完善自有內容生態,構建超級內容平臺。在搜索與信息流的雙引擎分發機制下,百度移動的內容生態已涵蓋第三方網站/app、百家號/好看視頻創作者、小程序、托管頁等各式各樣的內容供給。
如何讓內容生態更有活力?提供更強的創作工具幫助創作者降本增效、創作創新至關重要。在這一點上百度的答案是AIGC,也就是AI創作內容,這里的一個技術背景是AI技術正在從感知到認知進化。
在預訓練大模型加持下,AI將有望從弱AI進入到強AI時代。相較于圖像識別、人臉識別、語音助理強調“感知”而言,強人工智能更需要“認知”,不只是可以理解內容(圖片、文字、視頻等等),還能創作內容,今年爆發的AI作畫、AI作文都屬于典型的強AI應用,這需要AI具有一定的認知能力,而認知的底層是“知識”而不只是“數據”,這正是搜索引擎以及百度的長處,百度知識圖譜早在2014年上半年就已開始提供線上服務,基于飛槳訓練的文心大模型也具有“知識增強”這一差異化特性。
在AI文心大模型加持下,2022年高考期間,度曉曉挑戰高考作文,得分超過了75%的高考考生,也就是說在“作文”水平上,AI可能已經超過大部分人的水平了。AI創作內容除可助力百度移動生態創作者生產更好內容外,未來還可糾錯內容、聚合內容,升級用戶搜索體驗。
除了AI作文外,AI制作視頻已在百度APP大規模應用,有些視頻內容是AI從百家號的圖文內容自動轉換過來的,筆者的百家號“羅超頻道”已開啟這一功能,發布內容后很快就會自動生成圖文并茂還有配音的視頻,前段時間甚至有同行問我,為什么寫文章了能這么快地做視頻?是不是有團隊?我告訴他是AI生成的,這表明AI生成視頻這個技術已經比較成熟了。
作為一名創作者,我堅信AI不可能完全取代創作者,但大幅提高創作者效率卻是可以期待的,何俊杰在WISE大會上也表示:“未來,AIGC 將顛覆現有內容生產模式,可以實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容?!?/p>
何俊杰介紹,百度發布了“創作者AI助理團”,基于AI技術可實現從文案、圖片到圖文轉視頻的自動化創作。百度認為創作將迎來“人機共創”模式,媒體、創作者可以進一步把寶貴的精力專注用在創造力上,創作者們能實現“一個人就是一支隊伍”,互聯網的內容生態也會因此發生新的革命。
2022年流行的數字人也是百度移動生態AI創新的一大看點。今年9月百度百家號推出了數字主持人解決方案,已有多家媒體機構率先應用,比如中國青年報和中國青年網官方短視頻品牌“青蜂俠”,就依托百家號平臺推出了數字主持人“青小霞”,其可高度復刻真人主播的聲音及表情動作,實現高質多量的內容生產和播報,降低媒體運作和內容生產成本。
何俊杰在WISE大會說,百度要讓內容創作者實現“數字人自由”,將陸續開放更多“數字人能力”,進一步降低“人均一個數字人”的成本。如果數字人自由變為現實,以后很多創作者都可以擁有自己的數字人主播,善于寫作不善于出鏡的可以做直播,主播也可在自己睡覺時讓“虛擬分身”“不間斷直播帶貨”了。
從文章創作到視頻生成再到數字人,百度針對創作者推出了一套AIGC的組合拳,此舉勢必讓其內容供給高質量增長,形成更多創新、優質、差異內容,給用戶更好的搜索體驗。
寫在最后:
關于創新行業有很多說法,比如微創新、漸進式創新、顛覆式創新等等。而在WISE大會上,何俊杰則談到了百度的創新觀:“反饋驅動創新”。
百度做AI創新,既要攀珠峰(實現技術創新和突破),也要接地氣(從用戶側吸收反饋),還要持久戰(與生態伙伴一起長效經營)。而搜索引擎是百度與用戶最近的窗口,是其獲得市場反饋的一線。如今AI工業化時代來臨,從搜索開始爆發的AI正在加速走向千行百業,越來越多的AI應用在涌現甚至成為人們生活與工作的一部分。但在可見的未來,搜索依然會是最核心且最大的AI應用場景。在AI技術加持下,結合大規模用戶場景的“反饋驅動創新”,搜索引擎未來也一定會給用戶、給行業、給AI產業帶來更多可能。