就在前些時間,ChatGPT迎來了重磅升級,支持圖片和語音輸入。那么在這次更新中,我們可以看到哪些進步?終極AGI,又距離我們多遙遠呢?
趕在國慶長假前ChatGPT迎來了重磅升級,用戶可以通過語音或圖片的方式和ChatGPT進行交流;OpenAI CEO奧特曼在校友分享會上,輕描淡寫的一句話給大多數GPT創業項目畫上了“句號”;強化學習之父薩頓聯手傳奇程序員卡馬克All in AGI了,終極AGI離我們還有多遠呢?
用戶通過語音的方式和ChatGPT進行多輪對話,官網給出的栗子是讓ChatGPT講一個睡前故事,并且支持切換不同語音包。目前聽起來還是蠻自然的,至少“機器音”并不明顯。
ChatGPT可以理解用戶發的圖片內容了,官網給出的栗子是用戶拍了一張自行車的照片,希望GPT給出調低座位高度的方案。
當然,也可以把自己冰箱里僅剩的食材發給GPT,讓GPT給你輸出菜譜或用餐計劃;或者發一張圖表讓ChatGPT進行數據分析。
那么,現在的ChatGPT 能聽語音、會看圖了,這對我們來說意味著什么呢?看看OpenAI CEO 奧特曼是怎么說的
OpenAI CEO 奧特曼最近在校友會上發表了一些看法,更是直接“提醒”了不少創業公司:別花太多精力在UI界面上(也就是咱們常說的套殼)。當然,除此之外,奧特曼還給出了不少干貨,簡單整理如下:
就是特意取了個ChatGPT這樣的名字,讓它看起來就很像機器,避免人類對它產生感情。
目前有不少企業正在“解決”GPT模型的小缺陷,尤其是只在UI界面上做優化的,這是肯定行不通的。因為OpenAI已經著手解決了大部分問題,而且不要嘗試和OpenAI拼迭代速度。善意提醒:獨立的企業必須能提供真正的、獨特的價值。
奧特曼透露,GPT5/6會具備多模態的輸出能力,比目前的GPT有更高的可靠性和個性化定制能力。
但是一說到大模型,大多數人第一反應就是貴。那GPT5/6的成本和收費會不會非常恐怖呢?奧特曼表示,摩爾定律在大模型領域依然生效,目前大模型的訓練成本越來越低,因此未來調用GPT接口的價格也會更加便宜。
雖然GPT已經給AI領域按下了“加速鍵”,但是還在還沒找到一個產品能讓我感覺和真人在聊天。
真正的AGI是能夠“自行推理”,而不是依賴大模型預訓練的,它像真實人類那樣根據學到的知識,寫論文、做實驗的AI才能是稱得上是AGI。
近期,強化學習之父薩頓也加入了Keen Technologies,聯手傳奇程序員卡馬克All in AGI。他們兩人在阿爾伯塔大學機器智能研究所(Amii)特別活動表示,2030年可以實現AGI的目標。而且,他們相信最終的AGI源代碼將會是一個人就能編寫的量級,可能只有區區幾萬行。
所以,AI的終極形態會是什么樣的呢,讓我們一起拭目以待吧!
以上資料參考來源如下,侵刪:
https://openai.com/blog/chatgpt-can-now-see-hear-and-speak
https://www.linkedin.com/posts/ibamasood_chatgpt-can-now-hear-see-and-speak-nervous-activity-7112087060068368384-0OXb/
https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/
本文由 @運營老中醫 原創發布于人人都是產品經理
題圖來自 Unsplash,基于 CC0 協議