精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
對ChatGPT的二十點(diǎn)看法
userphoto

2023.02.16 北京

關(guān)注

TJUNLP

【導(dǎo)讀】二十點(diǎn)看法分為五大部分:總體看法、ChatGPT技術(shù)發(fā)展、國內(nèi)同類技術(shù)、ChatGPT背后大模型技術(shù)的爭議、未來趨勢。

一、總體看法

1. 從人工智能發(fā)展角度看,這是認(rèn)知智能發(fā)展的一個重要里程碑,其意義要高于7年前的AlphaGo。

AlphaGo是在人類智慧高強(qiáng)度體現(xiàn)的領(lǐng)域(圍棋),機(jī)器戰(zhàn)勝了人類,基于數(shù)據(jù)和算法,它刷新了普通大眾對人工智能技術(shù)的看法,但是其本身并不能廣泛應(yīng)用,普通大眾也難以與其直接接觸。

ChatGPT則完全不同,它是在人類三歲小孩就逐步形成的語言智能方面有了重大突破。

過去,在人工智能領(lǐng)域,在人比較難做的事情上,比如數(shù)學(xué)定理證明、下象棋,機(jī)器表現(xiàn)很好;但是在人容易做到的事情上,比如說話,常識推理,機(jī)器表現(xiàn)反而很差,這些人類基本的智能對機(jī)器來說很難,是人工智能最難啃的硬骨頭。

這次的ChatGPT是在這方面有了一定的突破,因?yàn)槭钦f話,不是下圍棋,所以普通大眾都可以成為ChatGPT的用戶,也就是說ChatGPT天生具有廣泛的用戶基礎(chǔ),再加上其令人驚艷的表現(xiàn),這些使得其發(fā)布后用戶量迅速增長,火出圈

2. ChatGPT不僅僅是聊天,如果把它限制為聊天,那就顯著降低了它的價值和意義。

OpenAI根據(jù)自己同類產(chǎn)品API的調(diào)用分析,除了純聊天之外,用戶還把它用于文本生成、開放域問答、頭腦風(fēng)暴、改寫、摘要、分類等。

ChatGPT是對話式AI邁向真正實(shí)現(xiàn)的第一步,從互聯(lián)網(wǎng)層面看,它可以作為信息入口,與搜索引擎相結(jié)合;從文案辦公方面看,它可以與辦公軟件相結(jié)合,增強(qiáng)人的辦公效率;從人機(jī)交互角度看,它體現(xiàn)的是一種基于語言的自然交互方式,可以與元宇宙、數(shù)字人結(jié)合。

除此之外,它還可以應(yīng)用于機(jī)器人,充當(dāng)機(jī)器人大腦。如果從人類信息發(fā)展的歷史尺度上看,它是在人與機(jī)器之間的信息接口上有了很大突破。

3. ChatGPT是近幾年技術(shù)快速發(fā)展和不斷更新迭代、多種技術(shù)疊加在一起形成質(zhì)變的產(chǎn)物,是自然語言處理領(lǐng)域近年來研究的結(jié)晶。

其底層的技術(shù),包括Transformer、自監(jiān)督學(xué)習(xí)、微調(diào)、人類反饋強(qiáng)化學(xué)習(xí)、AI對齊等,在自然語言處理和人工智能領(lǐng)域都有廣泛的研究和應(yīng)用。

但是ChatGPT將這些技術(shù)巧妙地結(jié)合在一起,有效規(guī)避了大模型的未對齊行為,利用了大模型規(guī)模帶來的智能突現(xiàn)能力,增強(qiáng)了大模型的指令學(xué)習(xí)能力和用戶意圖捕獲能力,解鎖了大模型的泛化能力,這些能力疊加在一起形成了ChatGPT的質(zhì)變效果。

4. ChatGPT探索了一種使機(jī)器獲得語言智能的有效技術(shù)路線,但這個方向仍然需要在科學(xué)和技術(shù)上進(jìn)一步探索。

技術(shù)上,其他的技術(shù)路線是否可以達(dá)到同樣效果?

近幾年,大模型研究技術(shù)架構(gòu)上出現(xiàn)了同質(zhì)化趨勢,Transformer獨(dú)步天下,GPT路線占據(jù)絕對統(tǒng)治地位,這對未來技術(shù)創(chuàng)新并不是好事;

科學(xué)上,ChatGPT一類技術(shù)體現(xiàn)了技術(shù)先行科學(xué)滯后的典型特點(diǎn),為什么大模型有突現(xiàn)能力?對齊之后的泛化能力是如何形成的?語境學(xué)習(xí)的機(jī)制是什么?

這些問題目前都沒有明確的答案,科學(xué)回答這些問題,顯然可以進(jìn)一步推動技術(shù)發(fā)展。

5. ChatGPT技術(shù)雖然取得了重要進(jìn)展,但仍然面臨諸多挑戰(zhàn)。

第一,雖然采用了人類反饋強(qiáng)化學(xué)習(xí)(RLHF)AI對齊技術(shù),但是生成的內(nèi)容仍然存在未對齊行為,如不符合常識,存在偏見、歧視等內(nèi)容,信息真實(shí)性有時存疑(即“一本正經(jīng)地胡說八道”),未來在AI對齊技術(shù)上需要進(jìn)一步研究和突破;

第二,以ChatGPT為代表的大模型技術(shù)通常被具有豐富算力和數(shù)據(jù)資源的企業(yè)壟斷,且不開源,不利于大模型技術(shù)研究和突破;

第三,目前大模型的算力消耗非常龐大,要實(shí)現(xiàn)大規(guī)模真實(shí)場景應(yīng)用,模型輕量化技術(shù)需要進(jìn)一步探索;

第四,要提升模型的可解釋性,要研制相關(guān)技術(shù)使得ChatGPT為代表的大模型技術(shù)可以自我追溯信息源頭,增強(qiáng)可信性;

第五,ChatGPT背后還存在很多科學(xué)問題未有明確答案,如大模型突現(xiàn)能力是如何形成的?語境學(xué)習(xí)機(jī)制是什么?AI對齊為什么使大模型具有指令泛化能力?這些科學(xué)問題的探索將會推動未來技術(shù)更好地發(fā)展。

二、ChatGPT技術(shù)發(fā)展

6. GPT-3之前的大模型技術(shù)路線和架構(gòu)是多種多樣的,以BERT為代表的Encoder大模型、以GPT為代表的Decoder大模型、以T5為代表的Encoder-Decoder大模型等,但是從GPT-3之后,大模型技術(shù)路線趨于單一化。

包括Google的PaLM、LaMDA,Meta AI的Galactica、OPT,Nvidia/Microsoft的Megatron-Turing,AI21 Labs的Jurassic-1,DeepMind的Gopher、Chinchilla,Hugging Face的BLOOM,國內(nèi)華為的Pangu-a,浪潮的Yuan-1.0等千億級參數(shù)規(guī)模的大模型,基本上都是采用GPT-3的Decoder架構(gòu),可能是因?yàn)橛?xùn)練成本太高,采用其他未驗(yàn)證的架構(gòu),試錯成本高,跟隨GPT-3成功路線進(jìn)行微創(chuàng)新是最好的選擇。

7. GPT-3 2020年3月發(fā)布后,國內(nèi)外研究機(jī)構(gòu)相繼快速跟進(jìn),上述提到的大模型基本上都是在2021-2022期間研發(fā)出來,也就是說從技術(shù)路線上總體滯后GPT-3 1-2年時間。

8. GPT-3文本生成結(jié)果比之前的模型有大幅度提升,但同時也存在很多問題,如各種偏見、歧視、潛在的濫用等。

鑒于這些問題,大模型研究開始逐步重視AI對齊研究,即使得大模型輸出結(jié)果與人的意圖、價值觀等對齊。

一些瞄準(zhǔn)通用人工智能的企業(yè),如OpenAI、DeepMind紛紛成立專門的AI Alignment研究團(tuán)隊(duì),招兵買馬,將AI Alignment視為通向AGI之路必須要解決的問題。

來自這兩個團(tuán)隊(duì)研究人員,甚至成立了一家非盈利研究機(jī)構(gòu):ARC(對齊研究中心)。

9. 基于大模型的對話agents紛紛在2021-2022期間開始研制,包括Google的 LaMDA、DeepMind的Sparrow、Anthropic的Claude等,這些dialogue agents無一例外都進(jìn)行了AI對齊。

10. RLHF并不是唯一的AI對齊技術(shù),面向language agents的對齊有很多方法、很多策略,需要更多探索。

11.模型編輯、稀疏模型、半?yún)?shù)檢索模型,這些技術(shù),在大模型發(fā)展中同樣值得深入研究。大模型編碼的知識不應(yīng)該是一成不變的,將知識全部編碼到模型鏈接和神經(jīng)元中,可能也并不是最優(yōu)選擇。

12. 除了AI對齊和大模型賦能ChatGPT之外,OpenAI在長文檔摘要、自然語言描述轉(zhuǎn)為代碼等方面也做了很多工作,這些工作同樣增強(qiáng)了ChatGPT相應(yīng)能力。

三、國內(nèi)同類技術(shù)

13. 2020年OpenAI發(fā)布1750億參數(shù)的GPT-3之后,國內(nèi)企業(yè)和科研機(jī)構(gòu),同Google、微軟、DeepMind、Meta AI等一樣,于2021-2022年間,研制了類似于GPT-3架構(gòu)的千億級大模型。

因此,在底層技術(shù)上我們不存在任何問題。

14. 但是要實(shí)現(xiàn)中國版的ChatGPT,需要在多個方面加強(qiáng)研究,壓實(shí)工作。

首先,在數(shù)據(jù)上,我們要使用與GPT-3相當(dāng)?shù)臄?shù)據(jù)量和計算量訓(xùn)練模型,目前中文缺乏像英文那樣的多個開源大規(guī)模數(shù)據(jù)集,各家企業(yè)使用的中文數(shù)據(jù)也很少開源,很多時候數(shù)據(jù)也未像OpenAI那樣進(jìn)行精細(xì)處理以提升質(zhì)量;

其次,國內(nèi)在AI對齊研究上需要加強(qiáng),尤其是在已經(jīng)預(yù)訓(xùn)練的大模型上,要進(jìn)行對齊,要繼續(xù)優(yōu)化和精調(diào)大模型;

再次,要充分調(diào)動以大模型為代表的新型AI技術(shù)的研發(fā)活力,鼓勵已經(jīng)研制的大模型向大眾公開,接受廣大用戶檢測,同時也要積極培育專攻某一類核心技術(shù)(如大模型AI對齊技術(shù))的初創(chuàng)企業(yè),不求短期市場回報。

四、ChatGPT背后大模型技術(shù)的爭議

15. 大模型的優(yōu)缺點(diǎn)在業(yè)內(nèi)討論非常多,也非常激烈,大模型存在倫理問題、環(huán)保問題、資源壟斷不開源問題等等,這些問題學(xué)術(shù)界和產(chǎn)業(yè)界都在進(jìn)行研究,尋找技術(shù)、策略、機(jī)制等方面的解決方案。

16. 個人認(rèn)為,業(yè)內(nèi)對大模型爭議最激烈的地方在于大模型是否是通向AGI之路、是否具備類人理解力、是否具有情緒/意識,這些問題已經(jīng)不單純是在自然語言處理領(lǐng)域、人工智能領(lǐng)域討論了,一些爭論已經(jīng)在哲學(xué)層面進(jìn)行了,包括借助思想實(shí)驗(yàn)等。

除此之外,這些問題涉及的AGI、意識等,對它們的定義,本身也沒有共識,存在爭議。

17.就大模型是否能像人一樣“理解”用戶輸入的句子以及自身生成的文本這個問題而言,從技術(shù)層面看,大模型本質(zhì)上是根據(jù)單詞共現(xiàn)概率基于已生成的單詞序列預(yù)測下一個單詞,共現(xiàn)概率或依存關(guān)系是大模型從海量文本數(shù)據(jù)中建模學(xué)習(xí)而來。

由于大模型的數(shù)據(jù)都是符號,模型是無法像人一樣將意義、概念奠基到符號之外的物理世界,符號系統(tǒng)在語意上是不充分的。

符號系統(tǒng)本身并不能真正理解符號的意義,所有的意義都是被外部觀察者或設(shè)計者所賦予的,即使將視覺模態(tài)加入到大模型中,大模型學(xué)到的也只是符號和視覺元素之間的統(tǒng)計關(guān)聯(lián)關(guān)系,仍然不能奠基到真實(shí)的物理世界。

也就是說,大模型無法做到類人理解。這里涉及到人工智能圖靈測試、中文屋思想實(shí)驗(yàn)、符號奠基問題等,感興趣者可以參考《神經(jīng)機(jī)器翻譯:基礎(chǔ)、原理、實(shí)踐與進(jìn)階》第19章短評“預(yù)訓(xùn)練技術(shù)爭議與符號奠基問題”。

18. 自然語言處理和人工智能領(lǐng)域的研究者在學(xué)術(shù)論文中或者介紹AI模型時,經(jīng)常使用擬人化的描述,如“理解”、“學(xué)習(xí)”等,主要是為了讓讀者或聽眾更容易理解模型或算法的原理,并不不代表機(jī)器、模型真的像人一樣思考、學(xué)習(xí)、理解。

五、未來趨勢

19. ChatGPT類技術(shù)其背后體現(xiàn)的,首先是預(yù)示著一種深層次的信息革命。

人類發(fā)明計算機(jī)和互聯(lián)網(wǎng)之后,獲取、存儲和使用信息的方式出現(xiàn)了翻天覆地的變化,但最近幾十年基本上沒有大的變動,主要以搜索引擎為主,呈現(xiàn)的信息通常需要用戶進(jìn)行二次處理或再加工才能滿足要求。

ChatGPT呈現(xiàn)的信息則通常可以直接滿足用戶的需求,或通過交互方式逐步達(dá)到用戶的要求,雖然目前還存在信息可靠性問題,但相信未來這些問題會不斷得到改善。

其次是人和機(jī)器關(guān)系會出現(xiàn)重大轉(zhuǎn)變。

以ChatGPT為代表的一類技術(shù)在精準(zhǔn)捕獲用戶的真實(shí)意圖方面邁出了一大步,一旦機(jī)器可以“理解”人類意圖并完成相應(yīng)任務(wù),人和機(jī)器的交互就不再需要翻譯成機(jī)器語言,而是直接使用人類語言作為交互載體。

再次是機(jī)器生成內(nèi)容的能力大大增強(qiáng)。

一些文字內(nèi)容類工作,機(jī)器可以輔助人類,人的工作效率會得到極大提升,一些“枯燥乏味”的文字工作則可交給機(jī)器完成,人專注于更高層次的內(nèi)容、思想編輯工作,或通過人機(jī)交互方式協(xié)同生成更好的內(nèi)容。

20. 基于以上趨勢,未來人類獲取信息的方式、與機(jī)器交互的方式都會出現(xiàn)變化。

與人類意圖、價值觀、倫理準(zhǔn)則高度對齊的信息智能體會幫助我們高效獲取信息、生成信息和發(fā)布信息。

以ChatGPT為代表的大模型及其后續(xù)更新技術(shù)會逐步充當(dāng)各種機(jī)器、設(shè)備、機(jī)器人的“大腦”,人機(jī)之間的交互會更加以人為中心,而不是以機(jī)器為中心。

相應(yīng)的技術(shù)會對多個行業(yè)、領(lǐng)域產(chǎn)生影響,如教育(規(guī)范使用ChatGPT等類型技術(shù),避免學(xué)生使用它們做作業(yè),發(fā)揮新技術(shù)對教育的積極輔助作用,而不是成為作弊利器)、醫(yī)療(將大模型技術(shù)應(yīng)用于醫(yī)療問答、藥物研發(fā)、DNA/蛋白質(zhì)建模等)等,傳統(tǒng)的計算機(jī)軟件,如搜索引擎、辦公軟件等,也會受到影響和沖擊。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
對話前OpenAI科學(xué)家:愛、滅亡和人工智能
ChatGPT走紅背后:苦熬五年,三次AI路線迭代|行業(yè)觀察
GPT沖擊醫(yī)療,醫(yī)生怎樣才能不被淘汰?
ChatGPT相關(guān)黑話,再不知道就太晚了!
換一種思路,國內(nèi)人工智能就可以跑贏美國
ChatGTP全景圖 | 背景 技術(shù)篇
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 河北区| 邹平县| 广东省| 栾城县| 云龙县| 玉山县| 徐水县| 江阴市| 乌拉特中旗| 高阳县| 祥云县| 绩溪县| 三明市| 海淀区| 托克逊县| 乌拉特前旗| 韶山市| 铜鼓县| 阳曲县| 凤庆县| 太仓市| 视频| 蒲江县| 巍山| 驻马店市| 仁化县| 廊坊市| 淮北市| 普洱| 临夏县| 青州市| 茂名市| 黄石市| 巨野县| 句容市| 霍邱县| 兰溪市| 金山区| 巨鹿县| 鹿邑县| 鹤壁市|