上個星期,我一直飽受流感困擾,完全無法更新視頻號:既沒有心思撰寫文案,更沒有狀態(tài)出鏡。這卻給了我一個很好的機會,嘗試能否完全依靠目前高度發(fā)達的生成式AI工具,做一期像樣的短視頻。我的選題是:“雖然AI大模型推理成本大幅下降,但算力需求反而更高了,就像當年蒸汽機的發(fā)明,反而推動了全世界的煤炭需求。因此,今后算力作為一種戰(zhàn)略資源的地位會更重要?!比L大約1分鐘。
我躺在沙發(fā)上,把這段話輸入了DeepSeek R1。它用了28秒,生成了包括畫面描述、配音以及轉(zhuǎn)場效果在內(nèi)的全套文案:
【開場:蒸汽火車噴著白煙穿越金色麥田,鏡頭切換至芯片內(nèi)部流光溢彩的電子流動】
(背景音樂:科技感音效與蒸汽朋克風格音樂交織。)
【畫面:老式蒸汽機活塞特寫→現(xiàn)代服務(wù)器集群閃爍藍光】
“1820年,瓦特改良蒸汽機后,英國煤炭消耗量反而暴增300%——效率提升永遠會激發(fā)更大需求!”
【動畫:AI大腦吸收海量數(shù)據(jù)流,形成算力黑洞】
“今天,AI大模型單次推理成本下降80%,但全球算力需求正以每年翻倍的速度狂奔!GPT-4處理一本《戰(zhàn)爭與和平》,只需要你喝口咖啡的時間。”
【數(shù)據(jù)可視化:地球表面升起無數(shù)光纜,構(gòu)成神經(jīng)網(wǎng)絡(luò)覆蓋大陸】
(音效:數(shù)據(jù)處理聲逐漸密集)
“每個智能客服都在消耗一座小城市的算力,每輛自動駕駛汽車都是移動的超算中心,這,就是AI時代的'煤炭悖論’!”
【畫面:稀土礦脈與芯片工廠交替閃現(xiàn),最后定格在量子計算機冷卻裝置】
"當算法進化遇上物理極限,算力戰(zhàn)爭已悄然打響。從硅基芯片到光子計算,從液冷技術(shù)到星鏈基站,21世紀最硬的通貨正在重新定義——”
【結(jié)尾:火箭發(fā)射升空,尾焰化作二進制代碼照亮夜空】
"記住:蒸汽時代屬于煤炭,電氣時代屬于石油,而正在展開的智能時代,誰能掌握算力之源,誰就能點燃下一個文明紀元!”
(字幕彈出:算力即權(quán)力)
老實說,上述文案稍嫌煽情,但不是什么大問題,稍微調(diào)整一下即可。根據(jù)我提供的簡短選題,能夠做出這樣一份文案已屬不易。問題在于,目前DeepSeek尚不具備多模態(tài)(圖片/視頻/音頻)生成能力,所以視頻生成環(huán)節(jié)必須交給別的AI工具。那么到底交給誰呢?
我馬上想到了可靈AI。嚴格地說,快手于去年6月發(fā)布的可靈大模型,是第一個真正“震驚世界”的國產(chǎn)大模型,也是第一個在應(yīng)用水準上超過國外競爭對手的大模型——只需要看看當初它上線之后,國外AIGC圈子鋪天蓋地的評價就知道了。OpenAI的Sora雖然官宣時間更早,卻要等到六個月后才全面上線。在國產(chǎn)AI進軍世界先進水平的道路上,可靈是一個十分重要的里程碑,足以載入行業(yè)史冊。
由于可靈AI目前只能一次生成最多10秒的素材,所以我把上述文案拆分成六份,依次進行生成。不是所有片段都完全達到了我的預期,但其中至少有兩個讓我比較滿意:“蒸汽機車駛過麥田”,以及“稀土礦脈與芯片工廠的交替閃現(xiàn)”。要知道,我不是一個專業(yè)的AI創(chuàng)作者;倘若我更熟練一點,生成的視頻質(zhì)量肯定會更高,不過現(xiàn)在的成果已經(jīng)夠用了。
如果沒有AI的力量,我就只能從互聯(lián)網(wǎng)通用素材庫當中尋找相關(guān)片段,不但很難找到合意的,而且難以規(guī)避版權(quán)風險。更重要的是,通用素材不具備獨特性,如果另一位視頻創(chuàng)作者有相同選題、選擇了相同素材,我們的視頻看起來就沒什么區(qū)別了。
(“蒸汽機車駛過麥田”視頻截圖)
當然,作為短視頻創(chuàng)作者,我清楚一切目前的一切AI視頻應(yīng)用都存在局限性,可靈AI也不例外:它一次生成的視頻長度有限,無法一次性生成復雜的中長視頻;生成速度有待提高,尤其是高畫質(zhì)視頻的生成耗費時間較長。但是這并不妨礙它成為一種有益的工具,幫助視頻創(chuàng)作者大幅提升效率。而且,隨著時間推移,尤其是算力瓶頸的逐漸緩解,上面提到的問題都是可以得到解決的。
想象一下,技術(shù)進一步成熟后,我們可以用DeepSeek將視頻創(chuàng)意轉(zhuǎn)化為文案和分鏡頭腳本,再用可靈AI將前者轉(zhuǎn)化為完整視頻,最后通過微調(diào)將其塑造為自己所需要的樣子。到那個時候,可靈AI這樣的視頻生成應(yīng)用內(nèi)部或許將接入DeepSeek或者與之類似的強大文本模型,從而一站式地完成“從創(chuàng)意到成品”的任務(wù)。別誤會,這不會取消創(chuàng)作者的自主性,反而會讓創(chuàng)意更加值錢——絕大部分重復勞動被替代之后,剩下的是那些真正的閃光點!當一位創(chuàng)作者不用把大部分時間花在尋找素材、制作轉(zhuǎn)場特效上,他就可以集中精力去構(gòu)思真正獨特而且感人的視頻了。
毫無疑問,DeepSeek和可靈都是AI生產(chǎn)力工具。從生產(chǎn)力角度講,DeepSeek代表的是“左腦”:邏輯推理和結(jié)構(gòu)化生成能力;可靈AI代表的則是“右腦”:多模態(tài)理解與生成能力。左腦和右腦連接起來才是一個完整的大腦,即人類的“第二大腦”。由“第二大腦”承擔大部分執(zhí)行環(huán)節(jié)、幫助人類的“第一大腦”進行決策,將是AI時代人類工作的常態(tài)。關(guān)于DeepSeek所代表的“左腦”的市場潛力,市面上已經(jīng)有很多分析了,毋庸贅述。而關(guān)于“右腦”的市場分析,卻還明顯不夠。
在此,我想問一個稍微小一些的問題:以可靈AI為代表的AI視頻生成工具,其長期市場空間有多大呢?答案首先取決于國內(nèi)短視頻市場的規(guī)模。根據(jù)國家廣電智庫的統(tǒng)計,截止2024年,國內(nèi)短視頻用戶約為10.5億;各家咨詢機構(gòu)對短視頻市場收入規(guī)模的估算,則在3000-5000億人民幣不等(很可能還低估了)。假設(shè)數(shù)年之后,市面上10-20%的短視頻時長由AI生成,或者至少由AI輔助生成,那就意味著每年數(shù)千億小時的用戶時長,對應(yīng)500億乃至上千億的時長收入規(guī)模。AI生成工具能從這塊蛋糕中分走多少?現(xiàn)在難以精確估計,但數(shù)額總歸不會太小。
除了短視頻,中長視頻也將被AI深刻改變。還記得嗎?Sora發(fā)布之后,許多電影從業(yè)者認為“電影行業(yè)將被AI深刻改變”,必須先理解改變趨勢才能進行下一步的計劃。快手副總裁蓋坤曾指出,可靈這樣的視頻大模型在本質(zhì)上是“世界模擬器”,是對世界表征的復雜應(yīng)用模型的建模。這就意味著,在游戲、VR……等與“真實世界”相關(guān)的復雜生成賽道上,這樣的技術(shù)都將是不可或缺的,AI工具從中獲得的收入可能不低于短視頻領(lǐng)域。我們不需要立即計算出一個結(jié)論,只需要知道市場的天花板很高就夠了。
8個多月前,當可靈大模型第一次發(fā)布時,我的幾位互聯(lián)網(wǎng)行業(yè)的朋友不約而同地感嘆:“快手的基礎(chǔ)研發(fā)實力得到了證明。在視頻生成賽道上,它組織起了一個具備戰(zhàn)斗力的團隊,以自己擅長的方式取得了成果?!比ツ?2月,谷歌發(fā)布veo2視頻大模型時,同時公布了MovieGenBench基準數(shù)據(jù)集,這是一個人類評估者對視頻生成質(zhì)量的對比評估——表現(xiàn)最好的是可靈1.5,它也被谷歌定義為veo2最大的競爭對手;而Sora反而是主流視頻生成模型里表現(xiàn)最差的。這充分說明,在技術(shù)架構(gòu)和數(shù)據(jù)層面,可靈就是世界先進水平。附帶說一句,當時谷歌測試使用的是可靈1.5大模型,而現(xiàn)在的可靈早已進化到了1.6。
(一條熱門推特:“中國AI產(chǎn)業(yè)決不只有DeepSeek……可靈是最好的視頻生成模型”)
然而,在過去大半年的時間里,資本市場和媒體在討論可靈AI的時候,往往也只是把它視為一個孤立的工具類應(yīng)用,而不是快手生態(tài)的一個重要組成部分。在我看來,可靈對快手的重要性遠遠超出了單純的工具層面。首先,對于快手這樣的短視頻+直播平臺來說,強大的AIGC工具的意義怎么估計都不過分,能夠大幅充實內(nèi)容生態(tài)、提高內(nèi)容多樣性。
其次,可靈AI再次證實了快手的科技屬性:它不僅是一家消費互聯(lián)網(wǎng)公司,還是一家具備科技創(chuàng)新能力的公司。生成式AI是一個基礎(chǔ)研發(fā)主導的賽道,產(chǎn)品、運營都是錦上添花,唯有基座大模型能力是不可或缺的——這就是DeepSeek后來居上、超過諸多互聯(lián)網(wǎng)大廠自研大模型的原因,也是可靈AI超過許多資源更豐富的競爭對手的原因??伸`AI是一個縮影,體現(xiàn)了快手既重視基礎(chǔ)研發(fā),也能夠做好基礎(chǔ)研發(fā);在生成式AI方面如此,在其他方面可能也是如此。
可靈AI應(yīng)該值多少錢?我們不妨以國際上的同類工具作為參考:視頻生成領(lǐng)域最大的獨角獸Runway的最新一輪估值為40億美元,而圖像生成領(lǐng)域(也是整個AI創(chuàng)意生成賽道)最著名的MidJourney的估值則為105億美元。此時此刻,快手的市值僅為約300億美元,去掉凈現(xiàn)金更是僅有280億美元。顯然,包括可靈在內(nèi)的AIGC生態(tài),尚未充分被納入快手的估值。而且,即便已經(jīng)從年初的低點上漲約50%,快手目前的動態(tài)P/E仍然只有15倍,P/E/G也仍然低于1倍。不論在互聯(lián)網(wǎng)中概股當中,還是在全球消費科技類公司當中,這個估值都顯著低于平均水平。
今年年初以來,中國資產(chǎn)的價值重估邏輯無非是兩條:宏觀經(jīng)濟尤其是內(nèi)需的拐點,以及科技創(chuàng)新的蓬勃發(fā)展——快手的核心業(yè)務(wù)以及AIGC布局,恰好對應(yīng)著這兩點。雖然任何人都無法預測資本市場的短期波動,但是從長期邏輯看,這樣的快手迎來一波結(jié)構(gòu)性的價值重估是完全合理的。