百度正加速布局AI數(shù)字人業(yè)務(wù)。
2022年1月14日,在“數(shù)字人”主題的百度科技沙龍上,百度智能云AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖圍繞當(dāng)前數(shù)字人產(chǎn)業(yè)的發(fā)展格局、技術(shù)難點(diǎn)和底層驅(qū)動(dòng)力進(jìn)行了分享。“我們近兩年的奮斗目標(biāo)是,通過百度智能云曦靈平臺的開放,讓每個(gè)人實(shí)現(xiàn)數(shù)字人自由。”李士巖提到。
據(jù)了解,在當(dāng)前虛擬數(shù)字人產(chǎn)業(yè)格局中,提供建模、渲染、動(dòng)態(tài)捕捉等服務(wù)于數(shù)字人制作的基礎(chǔ)設(shè)施服務(wù)商已形成穩(wěn)固格局,大多由海外巨頭把持。但在工具、應(yīng)用層,中國企業(yè)已開始嶄露頭角。
數(shù)字人已經(jīng)經(jīng)歷了“紙片人”的1.0階段、以"Vtuber"主播為代表的2.0時(shí)代,現(xiàn)在已進(jìn)化至3.0階段,具備模型高精、人工智能驅(qū)動(dòng)的特點(diǎn),并且面向更多受眾。據(jù)李士巖介紹,第三代數(shù)字人的建模和內(nèi)容生產(chǎn)均有AI參與,這使得數(shù)字人的制作效率更高,也更智能,能面向更多應(yīng)用場景,可由視頻、直播、chatbot等載體承載,更具備千人千面的互動(dòng)能力。
當(dāng)前數(shù)字人產(chǎn)業(yè)結(jié)構(gòu)|圖源百度官方
數(shù)字人3.0時(shí)代下,市場空間也正在擴(kuò)大。
根據(jù)次元光譜不完全統(tǒng)計(jì),2021年國內(nèi)虛擬偶像/數(shù)字人領(lǐng)域里至少發(fā)生19筆融資,2021年產(chǎn)業(yè)上下游也紛紛從自己擅長的角度切入市場。
“每一次數(shù)字人發(fā)展本質(zhì)上都是技術(shù)推動(dòng)的,用戶從平面的圖文影音獲取信息與交互,向?qū)崟r(shí)3D交互反饋的需求轉(zhuǎn)變,將成為數(shù)字人長期發(fā)展的根本動(dòng)能,未來也將創(chuàng)造大量需求。”李士巖提到,數(shù)字人規(guī)模化落地還面臨三大難點(diǎn):產(chǎn)業(yè)鏈割裂、服務(wù)場景與演藝場景沒有有效打通、滿足高頻需求成本高。
李士巖表示,數(shù)字人產(chǎn)業(yè)有三大核心推動(dòng)力,第一級火箭是用戶需求與技術(shù)升級、第二級是政策支持與資本涌入、第三級是計(jì)算平臺的迭代。當(dāng)下數(shù)字人產(chǎn)業(yè)鏈各個(gè)節(jié)點(diǎn)相對割裂,不能高效協(xié)同,導(dǎo)致數(shù)字人在制作和調(diào)優(yōu)上存在較高壁壘,目前行業(yè)中大多數(shù)公司只是數(shù)字人制作與運(yùn)營全流程上的一環(huán)或其中幾環(huán)。
其次,服務(wù)場景與演藝場景沒有有效打通,表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務(wù)能力,而服務(wù)型數(shù)字人缺乏人設(shè),難以與用戶進(jìn)行情感交流。第三是滿足高機(jī)動(dòng)性、高頻需求的成本依舊很高,這一問題歸根結(jié)底還是數(shù)字人的生產(chǎn)效率問題。
百度也在嘗試攻克難關(guān)。
以數(shù)字人生成環(huán)節(jié)為例,在2021年12月百度AI開發(fā)者大會上發(fā)布的“百度智能云曦靈數(shù)字人平臺”中,用戶在平臺上傳一張照片,就能快速生成一個(gè)可被AI驅(qū)動(dòng)的2D數(shù)字人像,以前需要兩三個(gè)月時(shí)間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到小時(shí)級,同時(shí)還可以通過一句話語音描述或簡單捏臉等多種形式快速生產(chǎn)數(shù)字人。
在百度數(shù)字人平臺曦靈中,全場景、一站式、平臺化的特點(diǎn)能支持從最初數(shù)字人形象定制、人設(shè)管理再到業(yè)務(wù)編排、內(nèi)容創(chuàng)作,最后到多種驅(qū)動(dòng)模式下與用戶互動(dòng)的全部需求,在一個(gè)平臺上可實(shí)現(xiàn)數(shù)字人的全鏈路調(diào)優(yōu)。據(jù)了解,目前該產(chǎn)品已具備標(biāo)準(zhǔn)平臺的快速交付能力,幫助不同領(lǐng)域客戶快速實(shí)現(xiàn)敏捷型需求,降本增效。
從央視網(wǎng)虛擬主持人小C,到百度AI手語主播,再到虛擬明星代言人,人們關(guān)于AI的想象從未結(jié)束,更多娛樂型、服務(wù)型產(chǎn)品還在到來的路上.