精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
云知聲:通往AGI的路不只有一條

ChatGPT提供了通往AGI的新范式,但它背后的算法和模型并不是新的發明創造,就像愛因斯坦在1905年從理論上證明了E=MC2,而各國造原子彈的路徑并不相同,中國的“596計劃”就不需要完全把“曼哈頓計劃”follow一遍。

同樣如此的是,通往GPT大模型的路徑是通的,而到達對岸的方法并不只有一條。


文|趙艷秋 徐鑫
編|周路平

云知聲董事長梁家恩最近開始推動新一輪技術升級,并頻繁接待客戶和投資人。ChatGPT走紅之后,外界驚嘆ChatGPT的表現,但對于人工智能業界而言,這意味著技術范式的轉變,更意味著通向AGI的大門可能正在開啟。

入行25年的AI老兵和資深團隊創立公司11年后發現,自己正置身當下最火熱的跑道上,而這群AI老兵要投身新一輪變革浪潮的熱情依然澎湃。

梁家恩給這場大模型的角力劃定了時間表,“今年之內肯定要有一個行業內認可的千億級大模型成果出來”

從2012年開始做深度學習,到后來搭建AI全棧能力,再到大模型角力,這已是云知聲的第三次重大技術體系升級。而過去十一年對人工智能的理解和布局,在此刻都變成了現成的武器和財富。如果把這波熱潮里的參與者視作一個集合,梁家恩認為,他們有底氣成為走到下一輪的“分子”之一。而業界認為,這樣的團隊目前兩只手能數得過來

01

“這是令人興奮的技術”

這是讓我入行25年來感到最exciting的技術突破。”梁家恩告訴數智前線,ChatGPT推出之后,人工智能的范式正在轉變。實際上,此前10年,深度學習帶來了一波人工智能的增長,但并未改變AI的范式

云知聲創立的2012年,趕上了深度學習的嶄露頭角,在那一年9月的ImageNet視覺識別挑戰賽上,AlexNet異軍突起,碾壓了所有對手。它的創造者之一Hinton教授, 2006年在Science發起“深度學習”革命后,在重大技術評測上首次獲得突破性進展,展示了深度學習的威力。云知聲團隊雖然在那一年6月剛成立,也迅速入局深度學習,成為國內最早將該技術應用到產業服務的團隊之一。


深度學習雖然比傳統的統計學習展現出了更大威力,但并未跳出舊的AI范式——預先定義任務目標,采集該任務的大量數據并進行人工標注,通過模型訓練達到最優效果,切換不同任務目標時,往往需要重新采集數據和訓練,無法實現不同任務間的高效遷移——被稱為“窄AI”或“弱AI”,本質上是某種“高級自動化”。一個例子是,針對銀行開發的模型,不能用于保險公司的類似任務,甚至同一家銀行的業務流程變了,模型也要重新訓練。這導致很多躊躇滿志的人工智能企業變成了項目型公司,制約了人工智能的潛力。

業界稱之為AI1.0時代。智源研究院總工林詠華稱,由于這樣的局限性,過去幾年人工智能又開始走向一個低谷。

2017年,谷歌提出了Transformer模型。“我們當時判斷這個模型具備一統江山的能力,因為對序列建模問題而言,從數據驅動的數學優化意義上它太完美了。”梁家恩回憶。谷歌、OpenAI等開始嘗試它的各種實現(包括GPT、BERT、T5等),通過大規模無監督預訓練基礎模型,實現多種任務的快速遷移,都取得了相當優異的成果,將語言理解問題真正納入深度學習框架之中。

真正推動AI進入2.0時代的,還是2022年11月,ChatGPT的推出。它作為一個人工智能語言大模型,擁有自然語言理解、上下文學習、常識推理和高質量應答等特點,效果驚艷四座。

ChatGPT將人工智能研究的核心帶回到語言本身,而語言其實是人類智能的一個核心載體。”梁家恩分析說,“語言理解也被譽為人工智能皇冠上的明珠,語言跟知識和智能本身是緊密結合的。”ChatGPT開放公測后,清華大學劉嘉教授感嘆,ChatGPT不僅有功能性,同時還是人格化,它終于讓人們看到了“通用人工智能的一線曙光”。

“這是一個非常大的突破,我們認為這是一個從專用AI轉向通用AI(AGI)的突破口。”梁家恩稱。這也直接帶動了云知聲的第三次技術升級。這將是一次大的跳變。“一些人認為ChatGPT只是一個聊天的人工智能,但對于我們團隊而言,把它放在了向通用AI演進這樣的級別來看待的,雖然通用AI還有很長的路要走。”

梁家恩稱,云知聲要在人工智能決賽圈有所作為,就必須跑通從專用AI向通用AI的通路。而此前,他們對技術的緊密跟蹤、儲備和守住的盤面,讓其有信心抓住這一波浪潮。

在2012年入局深度學習之后,云知聲曾在2016年開展了第二次技術升級。那一年阿爾法狗擊敗人類圍棋冠軍李世石時,云知聲早將深度學習在物聯市場應用起來了。“我們的關注點是深度學習要有一個強大的算力支撐。實際上,我們關注到阿爾法狗的研發團隊Deepmind,正是借助谷歌超強的并發計算能力,同時調度上千個GPU來完成的,這代表了未來深度增強學習的大規模計算趨勢。”

于是,在阿爾法狗擊敗李世石的當月,梁家恩就趕到了硅谷,與硅谷專家探討如何面向深度學習構建大規模超算平臺。最終,他們花了將近一年時間,將Atlas大規模機器學習超算平臺構建了起來,并逐步布局知識圖譜和多模態等全棧AI技術,從一家語音識別公司向更深層延伸,開始從“聲(感知)”到“知(認知)”的技術體系升級

現在,云知聲將面臨第三次跳變。

02 

先質后量,打通大模型新范式

在ChatGPT推出后,云知聲已開始訓練模型,但數智前線獲悉,在云知聲看來,本輪技術升級并非只是簡單的 “大力出奇跡”,而是開啟了新的“數據動力學范式”,需要從數據規模、質量和模型調教下手,才能真正解決問題,“大力”只是“必要不充分條件”。按照公司的規劃,技術升級將分兩步推進:先在六七百億參數提升優質數據規模,再擴大到千億級參數提升大模型效果。

為什么要分兩步走?這與技術實現和商業落地相關。

按照業內的實踐,在優質數據規模足夠大情況下,模型越大效果越好,但訓練成本也越高。從六七百億參數起步,是因為從業內成果分析看,只有參數規模達到五六百億以上,模型才可能出現“智能涌現”。這是一種神奇的現象,如同一個小孩子,到了某個年齡突然“開竅”了,發生了從量變到質變的“跳躍”。“我們判斷六七百億參數的模型,是比較有把握出現涌現效果的,先以這個參數規模,提升優質數據規模和大模型效果,再做千億以上參數來提高大模型性能。Deepmind和Meta等最近都放出這種規模的模型,效果都還不錯。”梁家恩稱。

但今年不只是要做好大模型,還要考慮產業實際應用的成本和部署等因素。云知聲認為,大模型訓練成功后,以目前的算力成本,可能需要把大模型參數量通過蒸餾技術壓縮10倍才能滿足實時性和規模化應用要求,這要視具體應用場景而定。云知聲在做BERT模型時,就積累了豐富的經驗,通過模型蒸餾提速近百倍,而實際性能損失很小。“就像打擊索馬里海盜,不能每次都開著航母過去。”梁家恩稱,“我認為OpenAI最終可能也會走這個路徑,只不過它現在不那么著急,它現階段要先砸資源摸到大模型的潛力和邊界,不需要太關注成本。”


GPT是一個端到端打通的框架,同時結合了很多學習能力,比如小樣本學習,讓它有更強的適應能力。同時,OpenAI的CEO Sam Altman透露,他們使用的數據遠比外界想象的要多得多,大量工作也圍繞在數據方面,為此還引入了新的數學模型。

“我們首先把它的端到端打通,再針對性地去解決問題,有些可能是從算法角度去優化,有些可能要通過數據層面去優化,包括并入醫療數據后,哪些跟現有的知識不能很好的融合,都要針對性做研究。”

云知聲以前基于BERT模型,現在需要切換到以GPT為模式的框架。兩者本質上都基于Transformer模型,有不同的優缺點和特性。云知聲這次并不需要從底層開始干,而是進行模型架構的切換,“會比從頭做的變量要少很多,而且有行業應用場景、客戶和數據的積累”

按照計劃,云知聲將在今年第二季度開啟針對性優化,并與第一批客戶銜接,在實戰場景中解決問題。

在落地行業上,物聯和醫療是兩個優先的行業,此前他們在這兩個領域投入和積累最多。但兩個行業的側重點并不一樣。物聯行業本質上是提升交互能力,當大模型技術升級以后,人機對話就不會“聊死了”,不過,這些是通用場景,拓展應用場景“廣度”。

在醫療行業,問題的側重點則是精準度和可控性。這需要結合知識圖譜和行業問題進行強化學習。“很多大模型的可解釋性、可控性,要通過后端這個手段來解決掉,否則無法有效應用到嚴肅場景中”。

大模型也將給之前的應用帶來改變。云知聲2016年進入醫療行業,主要利用人工智能技術,解決病歷的語音錄入、缺陷檢查、醫保控費等問題。“如果有了比較好的生成式AI能力,我們可以根據已收集的數據,協助醫生生成高質量的病歷和診療方案。

在美國休斯頓的MD安德森癌癥中心,已有醫生向ChatGPT詢問病人現在的情況以及治療方案,得到的結果和中心診斷的結果幾乎一模一樣。梁家恩稱,大模型在醫療行業的終極目標,肯定是成為一個輔助診療工具,但還有相當長的路要走,精準度和可靠性是必須解決的問題。

03

從全棧能力到MaaS模式升級

新的浪潮來臨時,創業距今已有十一年的云知聲站到了一個新的風口。就像一場球賽進行到中場,一個站在球門附近的人,“突然”接到了球。

這是一支深度思考行業趨勢,密切關注行業前沿技術發展的團隊,同時也在行業里有了多年積累,已形成全棧能力給新一輪技術升級奠定了扎實的基礎,也為打造以大模型為基礎的MaaS(Model as a Service,模型即服務)平臺做好準備。

在最底層的算力層面,受AlphaGO的啟發,2016年開始云知聲團隊開始建立大規模超算平臺Atlas。Atlas在希臘神話里是泰坦族擎天神,用雙肩支撐蒼天。當時,他們看到能同時調度上千塊GPU去完成一個任務的能力,會是一家人工智能公司的重要壁壘。當他們部署超算平臺時,硅谷的專家甚至驚訝,一家成立四年的創業公司考慮這個問題還太早。

但今天來看,底層算力平臺對于上層支撐的價值已經凸顯。

在算力平臺之上是數據中心模型優化(DCML)層。云知聲在2016年開始進入醫療行業后,發現根據不同應用場景數據,需要對模型進行高效的針對性優化,本質上是如何根據應用數據對模型進行快速調優,GPT模型的強化學習也是在這層完成的。這一層的構建目標就在于此,其作用是能夠提高產品的標準化程度,通過模型而非代碼來解決應用場景差異,大幅提升人效比

再之上是模型層。這也是目前正在改變的地方。在此前的AI范式下,無論是人機交互,還是各種行業應用,實際上要先做好各單元模型,再把各種單元模型整合起來實現業務目標,現在則要轉變為以GPT為核心的大模型來做。而過去各種部件級模型,像語音降噪、語音識別、語音合成等標準模塊仍會持續優化,但也會借鑒大模型的思路,比如加大無監督預訓練數據規模,實現多語種聯合建模、輕量級定制和個性化等,可以顯著降低成本,同時提升效果和效率。

除了這些能力,這些年在智慧物聯和智能醫療等行業場景積累的行業know-how和數據,也是云知聲在全棧能力中的一個關鍵。以醫療行業為例,像教材、臨床指南、病歷知識等一系列行業數據,都需要時間的沉淀才能獲得,這也是未來訓練行業大模型不可或缺的原料。

而有了數據之后,能否解決行業的真實問題,還需要對行業本質問題的理解和認知。“行業大模型并不是一個萬能黑盒子,有了它就能馬上打敗所有的醫生。”梁家恩稱。這就像從高校畢業的醫學博士,要解決臨床問題,需要很多實戰經驗一樣,醫療大模型出來也要跨越這一步。ChatGPT也是在GPT3.5之上,完成SFT和RLHF優化才能真正接近實用,而醫療行業應用,對準確度和可靠性的要求要高很多。

本輪 GPT技術升級,不是簡單的算法升級或模型做大,而是AGI新范式的重構:從標準AI零部件根據業務需求組裝優化,到以大模型為基礎的MaaS模式的轉變,即業務邏輯由多語言多模態智能交互(MM-CAI)大模型來對接,實現真正自然語言為主的人機交互模式,通過大模型的情景學習(ICL:In Context Learning)能力來快速對接任務,極大提升業務遷移效率,涉及專業領域問題,則通過調用行業大模型或API來精準可靠解決,做好交互自然度和行業專業度的有效結合。

04

行業問題導向,從專用到通用

在過去十年里,AI浪潮起起伏伏,不少人工智能企業頭頂光環,生存卻舉步維艱,甚至還有玩家悄無聲息倒在了這波AI熱潮的前夜。技術落地和產品化是他們遭遇的共性問題。

一位資深人士稱,不同于機器能輕松超過人類的單點可計算類問題,人工智能企業的產品落地面對的是真實和綜合的場景。過去十年里,云知聲在工程化和產品落地層面也做了不少嘗試,經驗可以沉淀為“廣度”和“深度”兩個層面

在物聯網場景里,關鍵在于連接的“廣度”。任何一個玩家都需要讓自己的產品在盡可能多的場景,盡可能多的用戶以及盡可能多設備上,以足夠低的成本跑起來。

深度學習技術開始介入行業時,行業里普遍認為,要靠GPU才能跑起來,但云知聲將它優化到能在CPU甚至手機芯片上跑起來。

2016年時,他們甚至把模型做進了主頻只有200MHz、計算內存只有200k的WiFi芯片中。“要把模型壓縮100倍,裝進芯片端,還要能運轉起來。”梁家恩向數智前線說。這個產品在格力等家電企業落地應用,也令大企業中搞深度學習的資深人士感到不可思議。

在產品落地中,他們又發現沒有特別好的物聯網芯片,于是在2016年組建團隊做了面向物聯網的智能交互芯片。“等行業里的人意識到要做AI芯片時,我們的芯片在已經點亮了。”梁家恩說。到今天為止,芯片和模組已出貨超過2000萬片。


而在醫療的場景里,人工智能技術要落地打通,則不能停留在外圍應用中,要真正解決行業應用的“深度”問題。“語音輸入能夠提升效率,但不能提升業務質量”,團隊意識到了感知的局限。從感知向認知升級,他們的做法是走向行業深處,建設行業知識圖譜,才能進入核心場景,真正有效解決行業關鍵問題。這也是近年來人工智能業界強調的落地重要路徑,去年百度李彥宏就在公司內部提出深入核心場景的要求。

球已經到了腳下,接下來要做的事情變得確定。數智前線獲悉,云知聲一季度就擴充了30%算力,去做大模型的轉軌,年底算力預計將翻幾倍,“升級下一代以GPT為核心的架構”。在以大模型實現智慧物聯(廣度)和智慧醫療(深度)兩個行業技術升級后,MaaS模式也將完成驗證,再結合各行業應用需求,逐步擴充行業大模型,最終將MaaS平臺做到萬億級以上參數,實現從專用走向通用。

之所以選擇從專用到通用的發展路徑,云知聲主要出于三個方面考量:1)無論AI還是AGI,有效、可靠解決實際問題是第一位的,靠創造價值而非概念立足;2)依托物聯和醫療行業有多年的深耕積累,而非在通用領域直接對抗巨頭,更能發揮自身優勢;3)“MM-CAI+行業大模型”的MaaS模式,具有更好的可控性、擴展性和靈活性,隨著行業大模型的積累,能構建更可靠的通用智能。

這是一場巨變的開始,但梁家恩喜歡借用蓋茨的觀點,“我們經常高估了今后一兩年內將發生的變革,但又常常低估了今后10年內將要發生的變化”。雖然ChatGPT引發了熱潮,但仍面臨不小的挑戰。保持謹慎的樂觀,十年后回望,這或許是人工智能走入更大規模、更多場景,走向AGI的起點。

以下為數智前線與梁家恩的對話節選:

Q:中國企業能否實現類ChatGPT?

A:首先像ChatGPT,其實里面沒有任何一個算法是新的,甚至很多都不是OpenAI發明的。過去10年積累的機器學習方法,已經足夠它做出這個事,但主要是這些方法要如何有效的組合,以及如何去選擇數據來調整模型,OpenAI下了很大的決心,也投入了很多資源,才走通了這個技術范式,這是它對AI行業最重要的貢獻。

我經常把這個比喻為“曼哈頓計劃”。愛因斯坦在1905年就從理論上證明了E=MC2,“曼哈頓計劃”是第一個去探索和實踐出來的。但每個國家造原子彈的路徑并不相同,像中國的“596工程”就不需要完全去把“曼哈頓計劃”follow一遍。這個路徑是通的,我們在根本的原理上去研究這個問題,再看怎么做。

Q:現在互聯網巨頭也在推出大模型,并進入行業,你們與他們如何競爭?

A:在巨頭積累深厚的通用行業,我們是很難單靠技術顛覆的,OpenAI也要跟微軟的Bing和Office結合,才能在商業上叫板搜索巨頭。在我們所聚焦的行業里,我們不懼怕任何巨頭的團隊。因為這是我們的全部,但對巨頭來說,先守住自己主業是當務之急,主業之外的應用創新,本身積累也有限,而且東方不亮西方亮,哪個行業做不起來其實沒所謂。

而且醫療絕對是一個坑挺大的行業,巨頭的創新團隊能不能在被裁掉之前搞定,有很多變數。實際上,我們在醫療行業的很多頭部客戶,也是跟巨頭競爭中獲得的。所以,從絕對的資源角度,我們比不上大廠,但在我們真正深耕多年的這些行業,比資源投入、決心和實戰經驗,我們絕對不怕任何大廠的團隊。

Q:互聯網巨頭有一個提法,大模型領域不要重復造輪子。您怎么看這個觀點?行業里為什么大家還會堅持自己來做一遍基礎大模型?

A:這是巨頭的期待,但造輪子的比喻在這里并不恰當。輪子是一個標準化產品,而在大模型要復雜得多,同樣方法在不同行業解決的問題和用到的數據是很不一樣的,我們相信“行業大模型”,相比包羅萬象的“萬能超大模型”是要更精準、高效和經濟的。

我們提到的“通用”的概念更多是方法論意義上的。它不再像過去的AI方法論,要預先定義很多確定性目標,然后再分別針對目標優化對應模型。現在的通用模型指的是,方法論上可以支持非特定任務的大規模無監督學習,然后基于大模型可以通過快速學習來完成各類任務的能力。這種能力怎么來的呢?因為我們有一個大規模的預訓練基礎模型,已經有非常豐富的關于語言、知識的基礎信息在里面,是一個很好的基礎模型

有了這個基礎,針對行業性問題,找到行業性數據和真正的任務去跟它做一個應用調優和反饋強化,它的可靠性解決會更好。

通用,是說“無監督預訓練+行業應用調優+反饋強化學習”技術框架是通用的。專用,是通用大模型框架優先在特定行業應用,訓練行業專用的大模型,解決各種專業問題,讓它的可用性和可靠性達到實際應用的要求。這兩個概念不應該被對立起來。

Q:前幾天ChatGPT已經接受插件,對行業的知識可以直接調用了。這對你們現在做的事情是不是一種威脅?

A:這是目前解決ChatGPT可靠性最直接的方法,現在這個行業調用,其實還是傳統API能力通過自然語言的整合。我們認為比較理想的手段,可能是前面有一個什么都能聊的多模態對話式模型,它能進行豐富的自然語言交互,涉及專業度很高的問題,轉到后面的行業大模型來精準高效解決

為什么后面的行業問題也需要用大模型來重新刷一遍?就在于現在用的API都是寫死的,我定義幾個功能,你就只能用這幾種能力。未來可能要用大模型把更多專業能力解鎖出來,這樣更靈活,也更完善。現在ChatGPT出來后,直接調用是一個比較取巧也有效的方案,但這可能不是最終狀態。

我們過去很多需求實際上是受限于技術能力被鎖死的,像人機交互,最早是專業的工程師用打孔機才能搞定的,后面變成鍵盤、鼠標,再變成觸屏,未來可能就徹底變成自然語言交互了。演進趨勢是很明確的,它至少已經很準確的理解你的意圖,可能回應還有一些胡說八道的東西,但我覺得用自然語言跟機器做交互,未來會成為一個標配。現在你還要有“提示詞”的技巧,未來這個要求也會降低下來。


   ?
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
對ChatGPT的二十點看法
人工智能的80年進化編年史:從想象到現實
ChatGTP全景圖 | 背景 技術篇
透過ChatGPT的進化足跡,OpenAI傳達了哪些信號?
對話前OpenAI科學家:愛、滅亡和人工智能
斯坦福爐邊對話20頁精華文字整理——一窺硅谷AI大模型前沿趨勢,探索中美AI大模型未來之路
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 微山县| 诸暨市| 朝阳县| 泰顺县| 镇宁| 肇源县| 新营市| 永胜县| 镇江市| 泸水县| 湖南省| 盐城市| 巴塘县| 长兴县| 修武县| 耿马| 伊吾县| 镇赉县| 监利县| 平舆县| 堆龙德庆县| 东阿县| 陆川县| 易门县| 白河县| 体育| 嘉定区| 青岛市| 玉山县| 湘乡市| 茶陵县| 黎川县| 景德镇市| 寻乌县| 岳普湖县| 左权县| 白山市| 高淳县| 双江| 理塘县| 孝感市|