9月23日,一位閃著數點金色光芒的巨型數字人從錢塘江踏浪而來,一步步跑到第十九屆亞運會開幕式主會場,在它點燃主火炬塔的同時也點燃了全球觀眾的熱情。
今年是AI狂奔的一年,也是數字人重新煥發新生命力的一年。伴隨著AI技術的成熟應用,虛擬數“智”人將加速奔向大眾生活。
數字人需要更普惠
業內人士指出,亞運會上的數字人在技術上其實不難實現,但這個創意卻很新鮮,更重要的是對“數字人”這個概念做了重要的推廣,數字人的熱度再次升溫。
數字人不是新鮮詞。2021年,元宇宙還是風口,被認為是元宇宙不可或缺一環的數字人也成為資本追捧的寵兒。翻開數據表,2021-2022年,數字人賽道出現57起融資,總金額達44.61億元。熱錢砸過來,數字人借勢起跑。
然而,這項技術和產品要實現從小眾到大眾、從嘗鮮者到主流群體的廣泛應用,還存在不少障礙和痛點。其中,最難就是權衡“技術性”和“經濟性”。
在技術人的眼里,一切努力的指向便是讓數字人更像人。
亞運會之前,改編于國產“動漫之光”《異人之下》的同名電視劇也在優酷上映。劇中,數字人厘里一襲黑色旗袍,五官精致,在劇中飾演“二壯”,這是數字演員首次與真人同臺競技,更驚喜的是,其演技竟然讓觀眾難辨真假。
對此,有網友評論稱:“以后都沒有演員了,全用AI可省錢了。”
可見,從技術上來看,數字人已經能夠達到超寫實狀態了。
數字人公司良勝數字CEO張大勝回憶指出,最初,市面上爆紅的數字人大多是Q版(卡通)形象,而從超寫實虛擬數字人誕生之日起就繞開了“2D”“卡通”等特點,通過精細設計、技術合成,盡可能貼合真人形象。
但是,3D超寫實數字人由于缺少大規模的商用場景,僅憑借小部分B端需求實在難填數字人的燒錢無底洞,于是,數字人開始陷入“寒冬”。
例如,曾經在抖音吸粉無數,拿下超過200個品牌合作的“柳夜熙”,便在高昂的成本和較長的制作周期限制下,熱度大降。據悉,為了打造“柳夜熙”,其背后的公司僅制作投入就燒了百萬元,制作一條短視頻又花了幾十萬,“柳夜熙”在抖音快兩年,一共只發了48條短視頻。
小冰公司首席運營官徐元春曾指出,一個3D數字人運營一年可能要花掉五六百萬。更要命的是,成本很難砍下來。
“目前虛擬數字人生產、運營成本較高,市場接受度尚低,整個產業發展仍處于起步階段。”賽迪顧問人工智能產業研究中心高級分析師于凱迪在接受《中國電子報》記者采訪時指出,數字人如果要落地到各行各業,就必須兼顧更廣大用戶的個性化定制需求,且更方便、更普惠。
大模型挽救數字人
直到生成式AI崛起,數字人的命運發生變化。
“過去,數字人受技術限制長得都差不多,而大模型拓寬了用戶自定義的自由度。”方凱作為亞運會數字火炬手研發團隊負責人,在接受采訪時介紹說。
原來,亞運會上的這位巨型數字人是由來自130多個國家和地區的超過1億名在線“數字火炬手”共同匯聚而成。在巨型數字人完成點火儀式結束后,這些“數字火炬手”還可獲得一張數字點火專屬證書,鐫刻著每位“數字火炬手”獨一無二的數字人形象。
為了讓“數字火炬手”的數字人達到“千人千面”的效果,方凱團隊在研發前期折騰許久,最終把目光投向了生成式AI。
“3D數字人的工作流比2D要復雜非常多,起初內部評估工期,大家都很崩潰。”方凱表示。幸運的是,生成式AI極大提升了效率,拯救了焦頭爛額的技術團隊。
研發人員一共開發了58個“捏臉控制器”,生成式AI技術可以根據人臉識別,畫出數字火炬手的面孔,并生成虛擬形象,且用戶可以根據需求自由調整臉型、頭發、鼻子、嘴巴、眉毛等。據方凱透露,AI最多提供2萬億種形象搭配。此外,“數字人”研發團隊還研發了AI動作捕捉,只需輸入少量的真人動作,AI便可驅動數字人自主學習更多動作。
如果好看的外形是數字人的“名片”,那么AI將成為數字人的“內核”。AI賦能數字人,未來能實現文本生成、音頻生成、圖像生成、視頻生成、3D模型生成等功能,延伸到多模態交互功能,進而實現跨維度升級。
在數字人制作方面,AI的接入讓其生產成本進一步降低。
今年4月,騰訊發布了AI智能創作助手“騰訊智影”,創作者通過上傳少量圖片、視頻和音頻素材,就能得到自己的數字人分身和定制音色,進而快速生成自己的數字人播報視頻;此前,百度智能云曦靈通過百度自研的語音、視覺等技術,上傳一段真人視頻,不到30分鐘即可一比一復刻主播……
百度副總裁袁佛玉直言:“隨著百度AI算法的突破,能讓虛擬數字人制作成本十倍、百倍地下降,還能讓虛擬數字人生產周期,從動輒幾個月,縮短到小時級別。虛擬數字人的制作成本,將從百萬級降低到萬元級別。”
“大模型不僅直接降低了3D數字人的制作難度,更為數字人注入了靈魂。”新壹科技CEO雷濤指出,過去3D建模依賴傳統CG技術,動作捕捉需要采集真人大量數據,現在在新壹科技自研的依托于視頻大模型的數字人工具平臺上,算法可以高效生成3D模型,處理面部細節更加逼真。
為了提高數字人的真實度,前段時間英偉達更新了其Omniverse的AI能力,并宣稱將進一步引入對生成式AI的支持,用戶可以僅憑文本信息自動生成高質量的材料。Adobe Substance 3D藝術和開發團隊使用Omniverse USD Composer合作創作了一個虛擬數字人形象。該虛擬角色不僅視效逼真,并且皮膚呈現了真實的光線效果,而生成式AI,則提升了面部表情以及唇形同步的質量。
“大模型對數字人的影響是翻天覆地的。”張大勝表示,公司選擇與科大訊飛合作,在星火大模型的基礎上,研發小模型,作為3D數字人的“大腦”。“接入大模型能力,數字人將獲得'人設’。”他說。
大模型對2D數字人的提效更加夸張。
AI的生成能力天然適配2D數字人。近幾個月,市面上出現了許多2D數字人定制工具,邏輯基本一致:只要你輸入文案素材,就能生成數字人形象。“我們的2D數字人售價一萬元左右,24小時就給你做好了。”雷濤說。
據記者了解,甚至有的2D數字人最低只需幾百塊便能快速生成。
今年4月,商湯科技發布了“商湯日日新大模型”,演示了2D數字人視頻生成平臺“如影SenseAvatar”,據稱僅需一段5分鐘的真人視頻素材,就可以生成聲音及動作自然、口型準確、多語種精通的數字人分身。
多位從業者在接受采訪時,對數字人的未來表示樂觀。在他們眼里,技術迭代很快,這會讓數字人加速走向大眾。
作者丨谷月
來源:中國電子報