聊聊近期大模型界的一些轟動性進展。還記得年初,我在那次熱鬧的風馬牛大會上做的預測嗎?我列出了關于大模型未來的十大趨勢,結果還沒等到年末,我們就親眼見證了其中幾個預言成真。不論是Gemini,還是英偉達的 Chat With RTX,抑或是OpenAI最近放出的Sora,每一次發布都讓人眼前一亮,感覺未來已來。
朋友們都好奇,我對Sora有什么看法。簡單說,我堅信人工智能的終極形態——AGI(通用人工智能)的到來指日可待,而且就在這幾年之內。
首先得說,技術競爭的核心永遠是人才的聚集和深耕??纯碨ora,它的表現遠超其他同類產品,這并不令人意外。OpenAI這樣擁有核心技術和強大團隊的公司,其實力自然不容小覷。有觀點認為,有了AI技術后,小公司只需做些零星生意即可。但最新的進展再次證明,這種看法實在是太天真了。
其次,盡管AI技術發展迅猛,但并不意味著它會立即顛覆所有行業。相反,它更有可能激發人們的創造力。拿Sora來說,雖然有人擔心它會沖擊傳統影視制作,但我看法不同。一個優秀的視頻作品,不僅僅是畫面的堆砌,還需要有創意的主題、精心編排的劇本和對白。Sora的確可能會改變廣告、電影預告片和短視頻等領域的游戲規則,但它更可能成為這些領域創作的有力工具。
再來看國內的大模型發展。雖然表面上看似已接近GPT-3.5的水平,但實際上與GPT-4.0相比,仍有一段不小的距離。我相信OpenAI手中還有更多牌未亮出,無論是GPT-5還是其他更先進的技術。他們懂得如何控制節奏,保持領先。
大語言模型最厲害的地方,在于它們不僅僅是簡單的信息填充機器,而是能深入理解這個世界的知識。Sora的技術突破不僅僅在于它能生成視頻,而是它能夠模擬自然界和物理規律,真正理解和再現世界。這種技術的進步,使得Sora不僅僅是在二維平面上操作圖像,而是能夠在三維世界中創造出符合物理定律的真實場景,這是大模型技術的一大飛躍。
擁有強大大模型作為基礎,結合深刻的人類語言理解與對世界模型的洞察,我們正站在創造跨領域超級工具的門檻上。想象一下,在生物醫學、蛋白質工程、基因研究,乃至物理、化學、數學等學科領域,大模型如何能夠大放異彩,帶來前所未有的進步和發現。
Sora的案例,特別是其對物理世界模擬的能力,預示著對機器人學和自動駕駛等領域的深遠影響。傳統自動駕駛技術的側重點在于感知技術,而忽略了更為關鍵的認知層面——那種基于對世界深刻理解的判斷能力。正是這種對世界的理解,讓未來的自動駕駛不僅僅是機械地反應環境,而是能夠像人類駕駛員一樣,做出復雜的判斷和決策。
此外,Sora的成功不僅僅體現在其視頻制作能力上,更重要的是它標志著大模型開始真正理解并模擬真實世界,開啟了人工智能新的成果和突破的大門。
第五個觀點更是令人振奮:為了訓練如Sora這樣的模型,OpenAI必須讓它觀看大量的視頻資料。結合Diffusion技術,這一過程將使得AI對這個世界的理解更加深刻和全面。一旦AI開始“觀看”世界,從所有電影到YouTube、TikTok上的視頻內容,它對世界的理解將遠超過純文字學習。因為一幅圖片的信息量就已經超過千言萬語,視頻的信息量更是遠遠超出圖片。這樣的技術進步意味著,通用人工智能(AGI)的實現,可能不再是十年或二十年的話題,而是在未來一兩年內就可能成為現實。
我們正處于技術革新的黃金時代,AI的每一次進步都在推動我們更接近于一個前所未有的未來。Sora的案例僅僅是開始,未來還有更多的奇跡等待我們去探索和實現。
我是一位75歲以上的老人!本站主要是些學習體驗與分享(其中會引用一些作品的原話并結合我的一生體會與經驗加工整理而成!在此一并感謝!如有不妥之處敬請與我聯系,我會妥善處理,謝謝!)我寫的主要是中老年人各方面應注意的事兒!退休后我希望通過這個平臺廣交朋友,互助交流,共筑美好生活!!