精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
巨頭狂煉大模型,百度卻不愿意“卷”參數了

現在只要是跟AI主題有關的活動都繞不開一個話題:AI大模型。

在剛剛結束的Google I/O大會上,谷歌展示了其如何將最先進的預訓練大模型應用在日常工作中,比如谷歌文檔的自動總結功能可將幾十頁文件總結成幾句話。在 4 月提交的論文中谷歌研究人員訓練了一個 5400 億參數的大型語言模型——PaLM,可以自動生成代碼、解決數學問題、修復 bug、解釋笑話的梗。AlphaBet CEO桑達爾·皮查伊表示PaLM的優點在于可區分因果關系,理解上下文中的概念組合,其在數學問題上的準確率提升到 58%,接近 60% 的 9 到 12 歲兒童解決問題的水平。

國內AI巨頭百度不遑多讓,其在2019年就已開始積累AI預訓練模型技術,2021年12月正式發布了全球首個知識增強千億大模型鵬城-百度·文心,參數規模2600億。在5月20日的WAVE SUMMIT 2022深度學習開發者峰會上,百度公布了飛槳文心大模型最新全景圖,提出支撐大模型產業落地的3個關鍵路徑,在業內首發行業大模型。文心大模型是一個大模型家族或者說大模型IP,在WAVE SUMMIT 2022,文心大模型家族迎來十大新成員,涵蓋基礎、任務和行業等不同類型大模型。

跟谷歌一樣,百度也將AI大模型的重點放在了語言、知識等維度,或許這與兩家AI巨頭有著搜索引擎這一共同出身有關,因為搜索引擎本質就是用NLP技術處理知識,知識是AI的內核,因此兩家搜索引擎也成為AI技術的關鍵玩家。

對AI大模型上心的不只是谷歌和百度,2021年國外的微軟、英偉達、谷歌,國內的浪潮、華為和阿里……越來越多科技巨頭都在布局AI大模型。2022年AI大模型競賽正愈演愈烈,大有成為AI技術關鍵角逐場的趨勢。

國內外科技巨頭狂煉AI大模型為哪般?

AI大模型更準確地稱呼是“AI預訓練大模型”,“預訓練”字面意思很容易理解:預先訓練好,這樣應用開發者可得到相對現成的訓練結果,基于此直接開發AI應用,不再需要從0到1訓練數據、建立模型。

AI大模型通過堆疊數據集“貪婪式”地訓練模式,擁有較強的通用性,理論上可泛化到多種應用場景,而小樣本或零樣本的技術實現,則可讓應用開發者快速基于其構建工程應用。

AI大模型是深度學習技術的新突破,進一步增強了AI技術的通用性。

深度學習高速發展十年來,AI技術已被廣泛應用。信息技術在今天已成為世界運轉的基礎設施,AI技術也在走向這一階段,也就是AI工業化。當AI工業化階段來臨,AI要支撐更加廣泛普適的場景,要支撐更大更復雜的AI計算需求,要實現從弱人工智能到強人工智能的升級,依靠傳統訓練模式已很難滿足,具有“巨量數據、巨量算力、巨量算法”特性的AI大模型生逢其時。

可以說,AI大模型本質就是深度學習的“加強版”,通過給模型“填喂”大數據提高其自學習能力,進而具有更強的智能程度,比如在自然語言處理上表現更佳。百度、谷歌等巨頭的探索表明,基于預訓練大模型的NLP技術的效果已超過過去最好的機器學習能力。

AI大模型是AI工業化的關鍵,正是因為此,全球科技巨頭不約而同重注AI大模型。

2021年底微軟董事長兼CEO薩提亞·納德拉就直言,他現階段關注的一個重點方向就是“正在成為平臺的大規模模型,這種大型模型背后的計算,如何繼續構建系統?!彼J為深度學習在過去20年或10年取得巨大進展,大模型則將是下一個值得期待的大事件,是微軟將繼續推進的絕佳領域。微軟和英偉達聯合發布Megatron-Turing自然語言生成模型(MT-NLG),擁有5300億參數,堪稱“巨無霸”,官方宣稱同時奪得單體Transformer語言模型界“最大”和“最強”兩個稱號。

當然,AI大模型依然存在一些不確定性,但這也意味著更大的可能性。AI大模型最終會帶來什么樣的成果無人知曉,它可能是強人工智能的終極模式,也可能只是過渡手段,但截至目前其已經越來越清晰地呈現出魅力:在NLP等領域展現出肉眼可見的優勢,是人類當前看到的最接近強人工智能的訓練方式,是推進AI認知智能突破、挑戰人類智能的關鍵。

AI大模型儼然已成AI產業繼深度學習后的第二波技術浪潮。深度學習技術讓AI從實驗室走向商業化,AI大模型則展現出推動AI從作坊式應用邁向工業化生產的潛力。

這正是百度此時此刻加碼AI大模型的緣故。

作為全球首批、國內最早布局AI技術的企業,百度不會旁落各類AI技術方向的探索。AI大模型技術百度在2019年就已在布局,這一年在首屆WAVE SUMMIT 上百度CTO王海峰前瞻性提出“深度學習推動人工智能進入工業大生產階段”,過去三年,AI工業大生產正在變為現實,特別是在疫情驅動社會數智化、國家大力推動智能數字經濟等因素下,AI工業大生產正在進一步加速,大有進入千行百業成為跟互聯網一樣的基礎設施的趨勢。

AI 大模型生逢其時,從本次WAVE SUMMIT上最新的文心全景圖來看,百度在大模型布局上持續投入加碼,并構建了一套更適宜產業應用的大模型體系,配套工具平臺及開放生態促創新,跟同行們走了一條不太一樣的路。

百度文心AI大模型不卷參數卷什么?

2018年谷歌發布了擁有3億參數的BERT預訓練模型,正式開啟AI的大模型時代,接下來幾年,大模型的“擂臺”上,各路挑戰者接踵而至,但比拼的焦點一直是圍繞參數:

2019年OpenAI推出NLP大模型GPT-2,擁有15億參數,英偉達則發布了83億參數的威震天(Megatron-LM),谷歌又發布了110億參數的T5,微軟發布170億參數的圖靈Turing-NLG;

2020年OpenAI推出NLP大模型GPT-3,擁有1750億參數,首次將大模型參數規模提升到千億級,逼近人類神經元數量,其在傳統的NLP能力外,還可以算術、編程、寫小說、寫論文摘要。

2021年浪潮推出的“源1.0”擁有2457億參數,參數量超越GPT-3,比肩“巨無霸”MT-NLG。源1.0在中文數據集擁有差異化優勢,問鼎全球最大規模的中文AI巨量模型,它可以撰寫對話、續寫小說、新聞、詩歌、對聯。

2022年剛剛結束的谷歌I/O大會上,谷歌公布的PaLM 語言大模型則已擁有5400 億參數。

參數從大到更大再到巨大。

然而,百度在WAVE SUMMIT 2022上發布的飛槳文心大模型系列卻沒有強調參數本身,百度集團副總裁吳甜認為,參數不是AI大模型唯一要追求的方向,落地到真實場景才是關鍵。百度文心一口氣發布十款大模型,都做到在同等規模參數下能力更強、效果更好、效果更高,對此其有一個形象的比喻:“身材合適,內涵豐富。”

此前階段的AI大模型競賽則更像是重量級本身的PK,今天則頗有點拳擊比賽的意味。拳擊比賽,顯然不是越胖的選手越厲害。飛槳文心AI大模型不一味追求參數“虛胖”,而是在“身材合適”(參數足夠)的基礎上強化“豐富內涵”,這里的內涵就是“知識”——這一點跟人一樣。

本次百度文心大模型體系一次性發布10個大模型,涵蓋基礎大模型、任務大模型和行業大模型三級體系,沒有一個大模型強調參數本身,而是強調“產業級知識增強”的特性。

10個AI大模型中最值得關注的是文心·行業大模型,這是行業首個行業級AI大模型。百度基于通用數據訓練的文心大模型,加上行業應用場景中大量存在著行業特有的大數據和知識,結合行業相關的創新算法設計,推出行業大模型更適合在對應行業進行AI工業級應用,比如聯合國家電網研發知識增強的電力行業NLP大模型國網-百度·文心,聯合浦發銀行研發了知識增強的金融行業NLP大模型浦發-百度·文心。

除了兩個行業大模型外,百度還發布了文心基礎大模型和任務大模型一共八個:融合任務相關知識的千億NLP大模型ERNIE 3.0 Zeus,多任務視覺表征學習VIMER-UFO 2.0、商品圖文搜索表征學習VIMER-UMS、文檔圖像表征學習VIMER-StrucTexT 2.0,語音-語言跨模態大模型ERNIE-SAT、地理-語言跨模態大模型ERNIE-GeoL,以及面向生物計算領域的化合物表征學習HELIX-GEM和蛋白質結構分析HELIX-Fold。NLP、CV視覺、跨模態這些都是屬于各行各業都要用的基礎AI大模型,而像地理-語言跨模態大模型這些則是面向特征任務。

從百度文心AI大模型體系來理解一下百度做AI大模型的思路:

一方面,做有知識增強的AI大模型。

AI大模型都在貪婪地吃著“數據集”進行訓練,百度文心AI大模型則是有選擇性地“吃知識”,包括人類普遍擁有的通識型知識、面向任務的領域專業型知識、面向產業的行業場景類知識。

強化知識增強,一方面,可以讓AI大模型學習效果更好、效率更高,用吳甜的話說就是“知識增強的文心大模型,基于語義單元學習,學習效率更高”;另一方面,讓AI大模型真正走向強人工智能。現在AI大模型被詬病的問題較多的是數據多不一定就準、回報存在不確定性、依然存在認知缺陷,知識增強可以規避不少問題,因為知識是更有意義的數據,可以讓機器智能從感知到認知升華。

《人類簡史》認為認知革命是人類走出動物界的一次革命,認知革命本質不是語言能力,因為動物也有,而是想象力,基于此人類擁有獲取和形成知識的能力,再不斷進步。

在2017年的AI World 世界人工智能大會上,王海峰就談到一個觀點:“知識是人工智能的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如狗的嗅覺。而認知是人特有的,語言是人區別于其他動物的能力。同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎?!倍R對于人工智能的價值就在于,讓機器具備認知能力。

百度做AI一直重視基于知識增強的強認知型AI,不論是深度學習技術還是其上的語音、視覺、NLP,還是更上層的搜索、翻譯等AI應用,都追求讓機器從聽清到聽懂,從認識到理解,從感知到認知。

“知識讓機器具備認知能力”的邏輯同樣適用于AI大模型。當科學家、工程師們給AI大模型填喂的不再只是原生數據而是各類知識時,AI大模型就可以讓機器具備跟人一樣的認知能力。

AI大模型的知識增強比參數量本身更重要,這并不難理解。神經元的數量通常與動物的智商有著一定的關系,但也不絕對,比如非洲象的大腦重約5千克,含有2570億個神經元,遠超人腦(約1.4千克,約860億個神經元)。章魚則擁有無脊椎動物中最多的神經元,它們都有9個大腦,兩個記憶系統,且所有大腦中的神經元加起來超過5億個,其中扮演“中央處理器”的主腦就擁有2億個神經元,其余部分就分散于各個“次腦”。

2020年面世的NLP大模型GPT-3擁有1750億參數,已逼近人類神經元數量,但如果不做知識增強,AI大模型參數再上一個數量級也不可能比人類聰明。

AI大模型再單純地拼參數已遠遠不夠。想明白這個道理的百度決定不在參數本身上內卷,而是讓每一個文心大模型擁有更強的知識,比如千億規模參數的NLP基礎大模型ERNIE 3.0 Zeus在學習海量數據和知識的基礎上,進一步學習百余種不同形式的任務知識,增強模型效果;融合層次化提示的預訓練,更好地建模不同任務的共性與特性;將不同任務組織成統一的自然語言形式,統一建模增強模型的泛化能力,其相較于其他NLP大模型在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。也就是說,ERNIE 3.0 Zeus可能不是參數規模最大的NLP大模型,但卻是更具知識屬性能做任務的。強化知識增強而不是參數規模的AI大模型玩家,現在也只有百度。

另一方面,與產業場景深度結合的AI大模型。

百度文心AI大模型的“產業級”要一分為二地看:

一方面是百度文心AI大模型做知識增強本身就重視產業場景相關的知識輸入;另一方面百度文心AI大模型在實踐應用中結合產業場景的應用特性,與產業里面的佼佼者玩家如國家電網、浦發銀行合作,通過結合行業數據、知識和算法,針對性地推出行業AI大模型。

當然,百度文心的行業大模型與基礎大模型不是孤立的,后者給前者提供基礎,比如浦發-百度·文心模型就使用了基于通用文心大模型的行業知識挖掘技術,從海量數據中挖掘金融相關的語料,再與浦發業務場景的大規模無標注數據聯合訓練,訓練中設計了財報領域判別、金融客服問答匹配等算法來做預訓練任務,讓模型學習到金融行業特有知識。

基于這種通用+任務+行業結合的三層模型體系,更有利于產業依據自身特色把AI大模型實際用起來,百度文心也更有機會成為千行百業AI工業化大生產的基礎設施。

強調知識增強和產業結合,讓百度AI大模型成為業界唯一的“產業級知識增強”AI大模型,這也意味著百度AI大模型不需要再在參數上“內卷”。

百度率先打破內卷,是因為百度自身的業務優勢給文心大模型主打“知識增強”構建的基礎。C端業務上,百度有海量的AI應用場景,可提供知識輸入。2019年3月文心ERNIE1.0發布以來,幾乎百度全系列產品都在逐步使用飛槳文心大模型,現在百度搜索、信息流、智能音箱等互聯網產品正在大規模應用文心大模型,文心大模型顯著提升了百度產品的用戶體驗。B端業務上,依托百度智能云、百度飛槳等百度AI開放給各行各業,文心大模型對外日均調用量已超過五千萬次。在更多產業、更多場景、更多產品被使用,百度文心大模型就可以獲取更多知識,進而實現產業級知識增強。

落地到應用場景,是大模型玩家們的頭等大事

“今年是大模型產業落地的關鍵年。”在峰會上吳甜直言:“要做好落地,需要解決的關鍵問題是,前沿的大模型技術如何與真實場景的方方面面要求相匹配。”吳甜給出了支撐大模型產業落地的3個關鍵路徑:建設更適配場景需求的大模型體系,提供全流程支持應用落地的工具和方法,營造激發創新的開放生態。而在WAVE SUMMIT 2022上公布的百度文心大模型的動作,正是圍繞著這三個關鍵路徑。

讓AI大模型與真實場景方方面面更匹配,讓開發者可以更低門檻、更有效率、更低成本地應用AI大模型,讓AI大模型從巨頭的參數游戲成為產業的普惠技術,是百度文心正在努力做的事情。

除了獨特的大模型體系外,百度文心提供了兩大關鍵能力助力AI大模型在應用場景的落地:

一個是全流程支持AI大模型應用落地的工具和方法。

AI大模型在AI產業被寄予厚望。深度學習理論上人人都可參與研發探索,但具有“巨量數據、巨量算法、 巨量算力”三大特征的AI大模型卻成了門檻很高的技術競賽。打造一個大模型需要海量數據、海量算力和海量研發,金錢、時間、人力投入同樣“巨量”——微軟甚至宣稱其用了價值10億美元的超級計算機來訓練其AI大模型,可以說只有科技巨頭才有實力研發可以工業化的AI大模型。

科技巨頭研發再開放給各行各業的開發者是AI大模型的落地方式,然而對于非巨頭開發者來說,AI大模型的應用門檻比深度學習高得多。如何讓開發者可以快速、高效、簡單地應用AI大模型是業界難題。針對此,百度依托飛槳多年服務AI開發者的能力與經驗,在工具和方法上下功夫。

飛槳是我國首個自主研發、功能豐富、開源開放的產業級深度學習平臺,在深度學習平臺開發工具和方法上有著多年的豐富積累,涵蓋訓練、推理等環節。針對開發者使用文心大模型的場景,百度特意發布了一系列大模型開發套件、大模型API和集成文心大模型的飛槳企業版EasyDL和BML開發平臺,面向不同類型的開發者,全面釋放大模型的使用效能,進一步降低應用門檻。

簡單地說,百度文心不只是有更強的AI大模型,也有更完整的配套工具幫助開發者輕松應用。現在EasyDL和BML平臺已有累計超過1萬名開發者基于文心大模型開發,創建超過3萬個任務,并應用到輸電通路巡檢、零部件瑕疵檢測、農業病蟲害識別、新聞資訊創作等大量場景中。 

另一個則是提供應用交流的創新生態平臺。

任何編程語言要普及應用都離不開繁榮的開發者社區,既提供文檔資料分享、技術問題解決等功能,更可營造分享交流的創新環境。AI大模型相對于發展20來年的深度學習技術來說是新的技術體系,對于應用者來說相關資料都比較匱乏,不同場景的應用案例還比較稀缺,針對此,百度文心大模型在飛槳生態下構建AI大模型生態,推出了基于文心大模型的創意社區——文心·旸谷社區,讓更多用戶零距離感受到文心大模型的魅力和應用創新潛力,迸發出更多富有想象力的新事物。

從“不卷參數卷知識”的產業級知識增強的大模型體系,到依托飛槳的全流程的工具、方法論以及創新生態,都能看出百度文心對于AI大模型的努力方向有且只有一個:讓AI大模型不再是巨頭炫技的軍備競賽,而是成為實實在在落地到產業場景的AI基礎設施,最終將讓機器具備認知智能,實現AI工業化大生產,讓產業AI化不再只是口號。

百度已在AI領域深耕超十年,它也是國內最早布局人工智能的企業。最難能可貴的是,盡管這些年科技產業環境不斷變遷,但百度卻一直堅持深耕AI,一方面持續重注AI技術研發,儲備芯片、深度學習平臺、AI大模型、AI應用技術等全棧AI技術;另一方面,則將自身的AI技術能力開放出來,以百度智能云為基礎推動企業實現數字化和智能化升級。

加速產業AI化,推動AI工業大生產,讓AI成為互聯網、電力、信息科技一樣的社會基礎設施是百度的夙愿。AI大模型、飛槳、百度智能云等都是百度實現愿景的工具。正是因為百度的終極目標是AI工業化大生產,因此百度做AI大模型要強調“產業級知識增強”,不拼參數拼落地。百度的選擇,也將成為AI大模型玩家們的共同抉擇。

今天,AI大模型拼參數的軍備競賽時代結束了,更關注產業場景的落地時代正式來臨。

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
***(老文章)谷歌微軟死磕的ChatGPT,門檻沒你想的高
拓爾思會成為大牛股
中國ChatGPT元年,三大“流派”浮出并行
做實大模型的產業價值,度小滿深耕“NLP+金融”
AIGC行業報告:ChatGPT-百度文心一言暢想
文心大模型再發力,重構百度網盤
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 镇原县| 绿春县| 林州市| 花垣县| 安国市| 遂宁市| 罗山县| 达日县| 玉山县| 德阳市| 班戈县| 苏尼特左旗| 柳江县| 阿荣旗| 泰宁县| 司法| 富平县| 沙田区| 灵川县| 临沂市| 临漳县| 察隅县| 会理县| 洛宁县| 兴隆县| 大厂| 安龙县| 波密县| 成武县| 灯塔市| 温泉县| 盐津县| 鄄城县| 高台县| 社旗县| 新巴尔虎右旗| 慈溪市| 井陉县| 綦江县| 宝山区| 鲁甸县|