2015年3月29日清晨,博鰲的一個早餐會上坐著三個嚴肅的男人:蓋茨、馬斯克和李彥宏。
所謂早餐會,就是三個大佬每人一瓶礦泉水,然后餓著肚子看臺下的媒體記者們享用早餐。不過能把三個頂級人物湊在一起,放眼全球每年也沒幾次,在李彥宏流利的英文主持下,蓋茨和馬斯克這兩位日后經常隔空互懟的冤家,此刻也乖巧地相敬如賓。
在早餐會之前,李彥宏特地在百度貼吧上向網友征集問題,這些問題的“成功學”濃度很高,比如問蓋茨“要怎么超過你成為首富?”,問馬斯克“你怎么能做這么多偉大的事情?”在沐浴了一鍋雞湯之后,李彥宏終于問出了那個他最想問的問題:
“你們怎么看人工智能[1]?”
這并非一個會讓媒體老師豎起耳朵來的問題。回到2015年,此時距離Alpha Go大戰(zhàn)李世石還有一年,主流輿論更關心硝煙未盡的移動互聯網大戰(zhàn),或許人工智能在某些主流人群聽不懂的領域里取得了突破,但還遠遠算不上是熱門的商業(yè)話題。
這個問題的正確答案,對于知乎網友,可能是幾千點贊;對于求職的程序員,可能是一個豐厚的offer;而對于商業(yè)巨頭掌舵者來說,則可能價值百億甚至千億美金。“怎么看”三個字,背后指向的是微軟、特斯拉和百度三家企業(yè)的戰(zhàn)略思考。
作為計算機浪潮的受益者,蓋茨抓住了個人計算機普及的浪潮,李彥宏和馬斯克則抓住了web1.0的浪潮,后者又締造了電動車的風口。但所有企業(yè)家都害怕在酣睡時被列車拋下,所以這個問題的第二層含義是:人工智能會是下一波超級浪潮嗎?
對于李彥宏的問題,蓋茨和馬斯克給出的答案并沒有過份展現野心,但在之后的行動更能說明他們的態(tài)度:馬斯克在會談結束不久后便跟Sam Altman勾勒了OpenAI的雛形,而微軟更是連續(xù)多年重金投資AI,最后成功擠進了人工智能的舞臺中央。
百度面臨的選擇可能更加復雜。倒回到2015年甚至更早,那是一個中國移動互聯網雄心未泯的時代,巨頭們仍然圍繞著DAU和GMV來激烈廝殺,打車、外賣、短視頻、在線教育甚至共享單車看起來都是百億美金的賽道,略顯冷門的人工智能值得“托付”嗎?
8年之后的2023年3月,三個人的答案水落石出:馬斯克參與創(chuàng)辦的OpenAI已經成為超級明星,自家的無人駕駛技術也遙遙領先同行;微軟成為了OpenAI的新主人,剛推出的Copilot給全球熱議添了一把火;百度則在3月20日正式發(fā)布了文心一言。
為什么現在發(fā)布?李彥宏回答道:
“其實百度在過去十幾年中持續(xù)在AI研發(fā)上堅持投入,文心大模型第一個版本2019年就發(fā)布了,此后的每一年都發(fā)布一個新版本,從這個意義上說,文心一言的發(fā)布只是我們過去多年努力的一個自然延續(xù)。”
不過,李彥宏也在發(fā)布會上大方承認文心一言并不完美,很多內測截圖也顯示了文心一言還有很大的改進空間。盡管不完美,但百度的確是中國在這波浪潮里為數不多的追趕者,而且無論對文心一言論充滿希冀還是飽以嘲諷,都不應該忘記一個事實:
當年百度踏上人工智能這條路時,其實是一種孤注一擲。
其實在博鰲早餐會三年前,百度已經決定入局人工智能——這一年也是人工智能發(fā)展史上極為重要的一年。2012年9月,深度學習領域的大神Hinton帶領團隊在李飛飛創(chuàng)建的ImageNet大賽上一鳴驚人,他們通過全新的深度卷積經網絡的方式,一舉將圖像識別的錯誤率從30%左右降低至16.42%,人工智能似乎已經展示出了接近甚至超越人類的潛力。Hinton團隊奪冠使用的卷積神經網絡叫做AlexNet,團隊里核心成員之一是Ilya Sutskever,他日后成為OpenAI的聯合創(chuàng)始人之一。但倒回2012年,無論是AlexNet、Hinton、Sutskever甚至是李飛飛,在AlphaGo掀起人工智能的第一波出圈浪潮之前,有幾個人會去主動了解這些人的工作?BAT這個級別的互聯網巨頭,自然對這些技術突破有著極強的敏感性,但驅動百度投入AI的“內因”可能更加重要。2012年百度凈利潤首次突破100億人民幣,但李彥宏本人卻有一種強烈的危機感。一方面百度的核心業(yè)務依然在貢獻著穩(wěn)定增長的利潤;但另一方面,移動互聯網正在快速滲透,商業(yè)世界的巨大變革呼之欲出,這讓百度陷入了某種迷茫。2012年11月,臨近年底,李彥宏寫了一封在名為《改變,從你我開始》的內部信中,在信中說[2]:“當業(yè)務還在快速成長時,不應該快速追求凈利潤,而是要把更多的錢投入到更多的新業(yè)務和創(chuàng)新上。” 他甚至寫道,“我們要淘汰小資、呼喚狼性。”西村吉雄在《日本電子產業(yè)興衰錄》中解釋過日本電子產業(yè)的坍塌:日本公司很擅長研究“怎么做”,卻疏于判斷“做什么”。這其實是大型科技公司都面臨的問題,它們往往有很高的毛利和大把的現金,但選擇一個方向進行堅定的“豪賭”,卻有極大的風險。不過到了2013年的年初,李彥宏不想再等了。在1月份的百度年會上,他宣布百度將成立專注于Deep Learning深度學習的研究院——即Institute of Deep Learning,簡稱IDL。這是百度歷史上第一個研究院,李彥宏親自擔任院長。日后業(yè)界回顧這段往事,總帶著思維慣性認為百度做人工智能是因為轉型移動互聯網步調放緩。但再過10年人們就會發(fā)現,與其把大量真金白銀變成外賣紅包和打車券,的確不如把錢砸進人工智能——只有下游創(chuàng)新被卡住的時候,人們才會重視上游創(chuàng)新的重要性。李彥宏為IDL提出的的目標是:要做中國人工智能領域的貝爾實驗室,吸引全球最頂級的人才。貝爾實驗室是高科技行業(yè)一個極具象征意義的符號,而作為大公司的研究部門本身,其成果同樣矚目。成立后的數十年里,貝爾實驗室一共獲得了三萬多項專利,這些專利在字面意義上改變了人類的命運,比如晶體管,太陽能電池和UNIX操作系統(tǒng)。貝爾實驗室的幕后英雄既有高智商高學歷的科研團隊,但更關鍵的是壟斷當時坐擁美國通信市場90%份額的AT&T,可以義無反顧的將利潤投向技術科研。從這個角度看,2012年的百度也符合這樣的特征:有雄厚的業(yè)務基本盤,但對未來充滿危機感。百度也拿出了足夠多的誠意,IDL先后吸引了吳恩達、張亞勤、樓天城等一大批國內外知名AI學者。同一時期,AlphaGo連挑李世石和柯潔,讓普通人第一次見識到了AI的神奇。AI浪潮再次洶涌而來:創(chuàng)業(yè)圈里,一度狂熱到以科學家數量給創(chuàng)業(yè)公司估值。但這條路線并非完美無瑕。過去半個多世紀里,AI浪潮已經出現兩次,最終都潦草收尾。第一次興起于1956年,AI只會依據規(guī)則證明中學數學定理;1976年,第二次人工智能浪潮興起,專家系統(tǒng)登臺,能力的上限也只是下贏國際象棋。另一方面,AI是一個需要巨大投入的“豪賭”。在加盟百度之前,吳恩達一度想開發(fā)一個讓AI識別貓臉的算法,但即使是斯坦福大學,在當時也供養(yǎng)不起這樣一個簡單算法所需要的算力消耗,每一次數據訓練迭代背后都要花上幾十甚至上百萬元。事實證明,那時無論是李彥宏、IDL還是百度,都大大低估了AI研究所需要的成本,以及它能夠帶來的回報。2018年,百度CTO王海峰帶著一位名叫吳甜的總監(jiān)殺到了李彥宏面前,開了一場兩個半小時的會議,議題只有一個:要不要把百度的AI框架“飛槳”做的更大[6]。王海峰的身上有諸多名號,最標志性的是ACL迄今50多年歷史上首位華人主席,這是自然語言處理領域世界上最具影響力的國際學術組織。吳甜則是在2005年就為百度知道引入AI技術的老員工,作為百度AI技術平臺體系執(zhí)行總監(jiān),她還兼任深度學習技術及應用國家工程實驗室副主任。“飛槳”則是IDL自2013年開始研發(fā)的AI框架。所謂框架,可以理解為一個集成了主流算法模型和模型訓練工具的超級工廠。它向上承接各種模型和行業(yè)應用,向下連接芯片,在AI產業(yè)中起到了類似操作系統(tǒng)一樣承上啟下的關鍵作用。但直到2018年,飛槳也還是一個只存在于百度內部和實驗室的小眾產品。此時,這兩位為百度AI開疆拓土的老將站在了同一條戰(zhàn)線上:他們想讓百度飛槳從一個少數科學家、大企業(yè)才用得起的產品,變成整個社會的基礎設施。不夸張地說,要普及人工智能,做出一個好用的框架是第一步。另一方面,則是基于框架之上的AI模型,兩者的關系可以簡單理解為硬件與操作系統(tǒng)。對于百度來說,AI框架的開發(fā)者越多,框架的開發(fā)迭代速度就越快;開發(fā)迭代內容越豐富,使用的用戶也就越多。所以在那次會議上,李彥宏當場拍板:我們決定要做,要什么資源都給。2019年,僅僅為推廣一站式開發(fā)平臺 AI Studio ,百度就拿出總價值1億元的免費算力開放;2020年,為培養(yǎng)高校AI人才,飛槳啟航計劃投入總價值5億元的資金與資源;2021年,飛槳再發(fā)布“大航海”計劃,3年投入15億元資金和資源,李彥宏稱,要為中國培養(yǎng)500萬AI人才。目前,飛槳的開發(fā)者數量達到535萬,生態(tài)內創(chuàng)建模型量達到67萬個,服務20萬家企事業(yè)單位,位列中國深度學習平臺市場綜合份額第一,并一舉超越谷歌 TensorFlow 成為全球第二大AI框架[3]。五年過去,百度對飛槳的支持力度,顯然超出了王海峰與吳甜的預想。而飛槳也的確如李彥宏所愿,成功實現了從專業(yè)到普惠的破圈。同一時期,恰好是外界對百度的爭議和質疑最猛烈的一段時間。一方面,隨著新經濟公司輪番上市,“百度錯過移動互聯網”似乎板上釘釘;另一方面,高附加值產業(yè)、尤其是芯片產業(yè)核心技術的缺失,成為彌漫在中國科技領域最大的焦慮,對中國公司的苛責也與日俱增。這其實是百度的AI探索相對尷尬的地方:AI這類前沿科技的成長曲線往往不是線性的,而是大量的研發(fā)投入和資本開支的積累,才能形成一個突破的里程碑,其發(fā)展路徑與制造業(yè)中技術突破后的產能規(guī)模膨脹,遠不可同日而語。同時,AI在近幾年的應用大多集中于數據中心、智慧城市等企業(yè)和公共服務領域,即便是在消費市場的應用,也往往集中在某些功能和特性層面,普通消費者對其感知并不算強。比如2020年,百度發(fā)布了自己的第一塊量產AI芯片昆侖芯1代。和消費者日常接觸的CPU、GPU與手機SoC不同,昆侖芯主要用于數據中心和云計算業(yè)務。到了2021年量產的昆侖2代,百度在無人駕駛場景,實現了端到端的性能適配。很少有人知道,百度搜索其實是當前最大的AI應用場景之一。截至目前,百度的搜索服務每天響應幾十億次用戶需求,需要進行1萬億次深度語義推理與匹配[7]。圍繞AI,百度用十年時間,搭建起了一個由芯片層、框架層、模型層以及應用層組合起來的技術架構,每一層之間,都可以通過不斷互相反饋,實現端到端優(yōu)化。在這背后是百度近十年累計投入超過1000億元的研發(fā)開支,核心研發(fā)投入占核心收入比例連續(xù)8個季度超過20%。正如ChatGPT今年引起的熱潮一樣,前沿科技的探索總是隱藏在一個又一個不為人知的角落,以至于它的所有成功看起來都像是橫空出世。2022年9月,紅杉發(fā)表了一篇題為《Generative AI: A Creative New World》的文章,盛贊大模型背后的商業(yè)應用潛力,并預言很快會出現“殺手級應用”。而該文的署名作者GPT-3,一個來自OpenAI團隊的大模型。緊接著,基于大模型的AI繪畫問世,在全世界范圍內卷起一陣AI作畫浪潮;時隔幾個月,OpenAI團隊的新一代大模型ChatGPT推出,能寫代碼、寫小說、做數學題,還能與人類連續(xù)對話,越來越接近科幻小說中AI該有的樣子。事實上,Chat-GPT的本質,其實是以GPT-3模型為框架,通過“對話”這一場景,搭建了一個普通用戶也能使用的AI應用。換句話說,Chat-GPT在技術上已經非常成熟,但由于GPT-3模型長期以來離主流消費者太遠,在一定程度上塑造了Chat-GPT本身的驚艷。不過伴隨Chat-GPT熱潮持續(xù),對國內公司的質疑又一次甚囂塵上,但翻一翻前兩年的新聞能發(fā)現,早在GPT-3時代,中國公司已經與世界先進水平幾乎齊頭并進。2019年,百度在內部推出了“文心”大模型,從轟動一時的AI繪畫產品文心一格,到產業(yè)級搜索系統(tǒng)文心百中,以及即將推出的AI對話產品文心一言,基礎都是類似GPT-3的“文心大模型”。
文心一格根據要求進行的不同風格AI繪畫
無論是GPT-3還是文心大模型,其難度都遠遠不止于技術。有機構算過一筆賬,訓練一個GPT-3,至少需要1024張A100顯卡持續(xù)運轉足足一個月,簡單估算下來,僅硬件成本支出就高達兩千五百萬美元。同時,大模型在訓練過程中需要的參數量大、消耗的計算資源大,整個算力集群調度、模型調優(yōu)同樣讓人頭大。考驗的是企業(yè)在算法、數據、框架、資源調度等全棧和全流程的綜合能力。更關鍵的其實是資源,更通俗來說是優(yōu)質數據。ChatGPT發(fā)布之后,不甘人后的谷歌也迅速推出了大模型Bard,可惜首秀即翻車,甚至編造了“太陽系外行星的第一張照片,是用 JWST 拍攝”這樣的謠言,問題正是出現在訓練所用的數據質量上。英文大模型的訓練背后,是一座由數不清的英文文獻資料庫,Quora 、Reddit、github等高質量社區(qū)組成的富礦;而中文環(huán)境下,不同APP之間是一座座信息的孤島。另一方面,以中文的博大精深,對上下文語境理解要求更高。百度的優(yōu)勢在于,旗下不僅有面向專業(yè)的百度文庫,還有日常向的百度知道、百度貼吧、百家號,同時還向外投資了知乎這樣的高質量社區(qū)。而在技術層面,百度是市場上少有的全棧布局自研的人工智能公司。所謂全棧,即人工智能從芯片、框架、模型,再到應用的四大環(huán)節(jié)。在技術和資源的雙重加持之下,百度基于文心大模型研發(fā)的數字人度曉曉去年“參加高考”,針對“本手、妙手、俗手”這樣的拗口題目,40秒寫下40篇高考作文。文心行業(yè)大模型已經在很多個高精尖領域落地,比如在航空領域,文心大模型能夠應用在故障部位信息抽取、工程文獻情報分類、文獻檢索與摘要生成等多個應用場景。在傳統(tǒng)制造領域,TCL-百度·文心大模型能夠在訓練樣本減少到只有30%~40%的情況下,即可達到原有產線效果,從而縮短產線上線的開發(fā)周期。除此之外,百度的行業(yè)大模型還覆蓋了能源電力、金融、文娛等多個領域,與國家電網、吉利汽車、泰康保險、浦發(fā)銀行等多家機構展開了合作。能夠為各行各業(yè)帶來實際的好處,這是AI從科學變成產業(yè)的第一步,也是最關鍵的一步。2021年3月,百度赴港二次上市之際,李彥宏在致股東信里再次回顧了創(chuàng)業(yè)21年來的風風雨雨:過去的21年中,每當百度徘徊在十字路口,我都會問自己,什么能夠讓你真正制勝未來?我認為就是兩方面:一是你信仰什么,二是你有多大的決心。從過去到現在,我們的信仰沒有變,我們相信技術可以改變世界。對李彥宏來說,在技術改變世界之前,它得先改變百度。在過去十幾年間,AI帶來的變革,實實在在地在百度內部發(fā)生著:2005年,百度知道上線,在AI的作用下匹配問題和回答者;2012年,在語音識別領域,百度僅用了三個月就上線了語音搜索,55天就開發(fā)完成了語音助手。在圖像處理上,百度上線了全球首個人臉搜索產品,以圖搜圖準確率從20%提升到80%。作為百度支柱業(yè)務的搜索,也在被AI悄無聲息地改變著。以框計算、智能計算為代表的AI技術,已經替代了李彥宏二十年前發(fā)明的超鏈,成為如今搜索引擎的核心技術支撐。拿百度去年發(fā)布的新索引技術“知一”來說,借助跨模態(tài)大模型,它可以從文字、圖片、視頻、結構化信息等資源中不斷學習,從而更精準地呈現搜索結果。與之同時發(fā)布的還有一個叫做“千流”的索引技術,它通過AI技術解決了內容質量參差不齊的問題。最核心的搜索之外,AI也改變了公眾對于百度是誰的認知。在2017年之前,公眾對于百度的印象仍然停留在“搜索”上面,直到這一年的百度AI開發(fā)者大會才恍然大悟:百度竟然還是一家科技公司。大會當天,李彥宏坐在一輛自動駕駛汽車趕來會場。在全程直播畫面中,百度的自動駕駛汽車在車水馬龍的北京道路上穿梭,完美避障、行駛平穩(wěn)。這次的亮相讓李彥宏和百度自動駕駛引起了轟動,但卻不是以技術實力,而是上了社會新聞:有網友發(fā)現,當時北京尚不允許無人駕駛汽車上路,李彥宏“違章駕駛”了;于是,百度先吃到了一張來自交警的罰單。但就連百度也沒有想到,這個計劃外的烏龍開頭卻間接改變了中國自動駕駛法律法規(guī)的進程:四個月后,北京自動駕駛路測新規(guī)落地;此后幾年內,百度的無人車又相繼落地上海、廣州、深圳;去年,百度在重慶、成都等地實現了全無人自動駕駛出租車的商業(yè)化運營,曾經遙不可及的Robotaxi也似乎照進了現實。此時,距離李彥宏決定做自動駕駛已經過去了四年。一直以來,李彥宏都將自動駕駛視作是人工智能最頂級的工程,他堅信智能汽車會像是智能機器人一樣,徹底改變人類的工作和生活。百度的許多業(yè)務都是如此,它們在改變百度的同時,也改變了我們對未來世界的想象。在百度AI改變世界的故事里,不只是有科學家、工程師們的身影,還有形形色色的普通人:12歲的初中生,通過使用飛槳中零門檻的easy DL,開發(fā)出了一款口罩佩戴檢測程序,實現了三千多次調用。零基礎的小白,也能在工具的幫助下,快速步入AI的世界。有年輕人借助百度的AI算法簡單訓練,就開發(fā)出了盲人頭戴式露面實時信息采集設備,以語音或震動形式為盲人導航。有了低成本的AI加持,善意加速流向那些不曾被關注的角落。還有西藏的邊區(qū)醫(yī)生,利用百度的電子圖像識別技術,訓練AI識別寄生蟲卵,準確率高達97%。即便是在缺醫(yī)少藥的西藏邊區(qū),也能享有國內頂尖專家的醫(yī)療服務[8]。無論是文心大模型、飛槳平臺,還是自動駕駛,百度AI正在以不同的方式越來越多地介入到我們的工作和生活中,李彥宏距離那個AI改變世界的夢想,也越來越近了。1962年,肯尼迪總統(tǒng)在賴斯大學做了個演講,號召美國人支持登月計劃。說起這個,他激情澎湃:“我們決定登上月球,并非因為它輕而易舉,正是因為它困難重重。”在當時,登月計劃并不被美國民眾所理解,一些人認為這只是無意義的太空競賽,并不能對社會帶來什么實質性的好處。登月很貴,這讓它招致了大量的批評。登月計劃發(fā)布之后,美國宇航局NASA的開支水漲船高:第一年就花掉了100萬美元,四年后變成了每三個小時就要花100萬美元,NASA一躍而成為預算第三大的聯邦機構,與農業(yè)并列。一項數據表明[4],這是人類迄今為止做過的最難的事情。巔峰時期,超過41萬美國人為了這項計劃而努力。從宇航員到一線工廠工人,數十萬人在地球上工作了28億小時——換來了11次載人任務中,宇航員在太空中停留了2502個小時。這個野心勃勃的計劃不像原子彈那樣實現了一項基礎科學的重大突破,卻在科學、工程、計算機等多個領域催生了數以千計的創(chuàng)新。拿芯片來說,1960年,德州儀器做出了全球第一款商用集成電路產品。但它的真正落地,卻是在兩年后的阿波羅計劃中。
公文包大小的阿波羅計算機
當時,MIT要為NASA設計阿波羅計算機,便從德州儀器那里買了64塊集成電路。結果,MIT發(fā)現這款集成電路的速度相比晶體管提升了2.5倍,同時所需空間少了40%——即便是“小型”計算機也有冰箱那么大,而阿波羅計算機只有公文包大小,每秒可以處理85000條指令。因為阿波羅對大規(guī)模計算的需求,自此美國計算機芯片產業(yè)駛上了快速路:1962年,NASA買下了所有的芯片,每個售價1000美元;1963年,NASA采購了3000個芯片,每個芯片降到了15美元;到了1969年,每個芯片只需要1.58美元[5]。結果就是,芯片的價格急速下降,政府采購占比越來越低,越來越多的企業(yè)開始用上了便宜的芯片——現在,iPhone14每秒可以運算17萬億次,當年的阿波羅計算機需要工作2315天。阿波羅計劃暫時還沒能把我們帶向一個太空時代,但數字時代卻是因它而起。眼下,無論是百度的文心大模型,還是海外OpenAI的GPT大模型,正是全人類在AI時代的登月計劃。在這背后,是算力、算法、數據各種核心要素的集中試煉;以此為牽引,人才供給、科研支持、商業(yè)應用,一個龐大的創(chuàng)新生態(tài)系統(tǒng)構建形成,為創(chuàng)新提供了源源不斷的養(yǎng)分。而大模型背后的框架引擎,則是一個時代的核心“根技術”,以開源的理念,平等的共享來自最頂級大腦的思維火花與研究成果,在此基礎上終將會長出萬物智能的參天大樹。正如李彥宏在“文心一言”發(fā)布會的結尾所說的:“我們相信,人工智能會徹底改變我們今天的每一個行業(yè)。AI的長期價值,對各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的里程碑事件發(fā)生。”最引人注目的科技進步,往往來自孤注一擲的決定和漫長時間里的等待。無數人都在暢想星辰大海,但只有極少數人愿意去嘗試摘下那顆星星。參考資料
[1] 博鰲李彥宏對話蓋茨和馬斯克,新浪
[2] 李彥宏內部郵件:從PC到移動互聯網需要狼性
[3] 百度CTO王海峰公布飛槳最新進展:535萬開發(fā)者、20萬企事業(yè)單位,百度
[4] The one statistic that shows that going to the Moon is the hardest thing we’ve ever done
[5] How NASA gave birth to modern computing—and gets no credit for it
[6] 與百度有關的日子,淺黑科技
[7] 百度的十年,中國科技創(chuàng)新的技術路徑,遠川研究所
[8] 人工智能助力提升基層醫(yī)療能力,中國網