《太空歌劇院》,圖/Jason Allen同月,游戲公司 CEO 兼游戲設計師 Jason Allen 通過 Midjourney 生成的《太空歌劇院》,在美國科羅拉多州博覽會舉辦的藝術展中一舉奪得數字藝術組大獎。但這次獲獎也引起了廣泛的爭論,有人認為這對其他自己創作的人不公平,「這就跟為什么我們不讓機器人參加奧運會的原因完全一樣。」參加評審的藝術家杜蘭(Cal Duran)甚至表示,他在評分的時候根本沒意識到這幅畫由 AI 生成。相比之下,百度更加務實,一開始就確定了自己「輔助」定位。8 月,百度基于自身的文心大模型也推出了AI 繪畫平臺「文心一格」,更明確定位為面向有設計需求和創意的人群,基于文心大模型智能生成多樣化AI創意圖片,輔助創作者的創意設計。在技術之外,AI 生成圖像還在探索如何解決版權等一系列問題。
用嘴做視頻?還要再等等
作為 AI 大廠,Meta 和谷歌實際上沒有缺席任何一個重要的 AI 技術,在 AI 視頻生成上更是獨領風騷。Meta 在 9 月率先推出了 Make-A-Video,言簡意賅地表達了它的作用:做視頻。更具體地說,Make-A-Video 可以通過文本、圖片或者視頻來生成一個全新的視頻內容,尤其是文本直接生成視頻,直接讓視頻創作的門檻大大降低,比如輸入「機器人在時代廣場跳舞」:
圖/Meta僅僅一周后,Google 也發布了自己的 AI 視頻擴散模型 Imagen Video。與 Make-A-Video 相比,Imagen Video 最直接的感受就是清晰度更高——畫面分辨率可以達到 1280×768,幀率也能到 24 fps 了。不過,兩者實際上都還存在畫面不正常抖動、主體畸形、動作不夠流暢等問題,而且與之前推出文本生成圖像程序一樣,谷歌和 Meta 都沒有選擇對外開放,這也是為什么相比 AI 畫畫的流行,AI 生成視頻領域更多還是處在看熱鬧的階段——就像 2021 年的 AI 生成圖像。字節也看好 AI 視頻模型的未來,在抖音內就支持了「圖文成片」功能,輸入一段文字,軟件智能匹配圖片素材、添加字幕、旁白和音樂,自動生成視頻。從一些創作者的反饋來看,目前「圖文成片」的實現還很初級,智能匹配和生成視頻兩個環節都很難真正在視頻生產環節中使用。當下 AI 生成視頻在技術上顯然還不夠成熟,但最近幾年 AI 進化速度在肉眼可見地加快,很難想象今年 AI 視頻模型又會發生什么樣的質變。不管 AI 視頻模型是否能在今年再度質變,就如百度移動生態負責人何俊杰在 9 月的 2022 百度萬象大會上所說,「未來十年,AIGC 將顛覆現有內容生產模式,可以實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容?!?/strong>
可以預期,AIGC 將是 UGC 用戶生成內容出現之后,又一個內容生產的大變革,最直接的應用就是大大降低視頻制作的成本和門檻,這也意味著為視頻內容在供給側的大爆發提供了技術基礎。那場萬象大會上,百度就推出了基于文心 AI 大模型的「創作者 AI 助理團」,由 AI 文案、AI 畫師和 AI 視頻制作人組成。理想狀態下,借助「創作者 AI 助理團」,一個人就可以是一支視頻團隊。但顯然,現實是 AI 視頻生成還需要一些時間。
過去十年,可以說互聯網和智能手機徹底改變了內容的分發和消費環節,但在內容生產領域本質上沒有過多的變化。而在過去一年,AIGC 已經帶來了太多的變化,Stable Diffusion、Imagen Video 和 ChatGPT 分別對應了最主要的內容形式——圖像、視頻和文本。當然,AIGC 還在面對很多挑戰,包括版權、生成質量不穩定、創作主體爭論等,甚至 AI 生成視頻還沒有經過大眾使用驗證。但現如今 AIGC 開始「飛入尋常百姓家」,已經具備了成為一項大眾化技術的基礎,未來很可能極大地提高內容的生產效率和豐富度。從《太空歌劇院》獲得藝術大獎到今天,AI 的爭論依然沒有停止,但就如 Jason Allen 為自己的事件所做的總結:AI 作畫程序已經誕生,人們能做的只有承認并接受這件事。題圖來自 StabilityAI