從相關受益細分行業來看,包括但不限于視頻美化、廣告營銷、短劇、游戲、辦公軟件等。具體到投資標的,建議關注美圖公司(視覺大模型+大DAU圖像應用)、中文在線(短劇出海+IP)、閱文集團(IP)、金山軟件、三人行等;上游增加需求來看,推薦關注英偉達等算法、算力方面標的。
能夠真正處理和應用好多模態AI能力,才能真正打通物理世界和數字世界的障壁,用最基礎的感知世界能力直接生成操作,實現與物理世界最自然的交互。因此,基于多模態的應用場景仍需不斷探索,AI視頻生成僅僅是多模態技術路徑中的一個小方向,多模態領域的ChatGPT時刻還未到來。關注海康威視、大華股份、螢石網絡、中科創達、虹軟科技、科大訊飛、萬興科技等公司。
哪些A股公司有布局?
據不完全統計,已有十多家A股上市公司之前已經布局多模態大模型或對AI視頻相關研發。
海康威視公司從幾年前就開始研發視覺大模型,現在已經到了多模態大模型的研發階段,包括視覺、語音、文本等多模態信號的融合訓練及處理。
大華股份于2023年10月發布“星漢大模型”,該模型融合點云、語音、圖像等輸入,構建了多模態融合的行業視覺大模型。公司多模態融合的行業視覺大模型(大華星漢大模型),是基于公司過去豐富的行業和細分場景的業務經驗,面向以視覺為核心的智慧物聯領域,通過融合圖像、點云、文本、語音等多模態數據所搭建的,大幅提升了視覺解析能力,該模型為解析式大模型,與市面上的ChatGPT等生成式大模型有明顯差異。
萬興科技此前發布音視頻多媒體大模型萬興“天幕”。萬興“天幕”是一個以音視頻生成式AI技術為基礎的多媒體創作垂類大模型,由視頻大模型、音頻大模型、圖片大模型、語言大模型組成,聚焦數字創意垂類創作場景。天幕大模型主要基于公司在數字創意領域二十年的產品開發與運營經驗而打造的音視頻多媒體大模型,具備多媒體、垂直解決方案、算力數據及應用本土化等特色,以更智能、更沉浸的功能效果和產品體驗賦能全球內容創作者的創意表達。
博匯科技公司通過運用人工智能、大數據等技術,對采集到的數據進行分析、特征學習和樣本訓練,構建智慧監管模型,提升了對文本、圖片、音頻、視頻等多模態數據的處理分析能力,進一步強化核心技術優勢,提高產品競爭力。
易點天下公司旗下AIGC創作平臺KreadoAI可以幫助企業實現從腳本撰寫、語音克隆、個性化數字人選擇到輸出口播視頻的內容生產AI化全鏈路閉環。
數碼視訊公司多年來積極自主研發積累AI技術,龍其是在視頻內容生產領域,持續不斷探素AIGC生成式技術,并配合智能審核技術、多模態智能搜索等實現全媒體行業的媒資管理,構建全新視音頻服務。
漢王科技公司在文本、圖像、視頻、生物特征、語音等多欖態識別、文本理解和利用等技術上耕耘多年,并形成智能終端產品和行業解決方案。目前正在研發的AI模型尚屬于新生技術,在文本生成、生成內容的控制與審核等方面的技術細節尚在進一步完善。
當虹科技公司擁有自研的AIGC工具集,發布了以靜態照片生成三維體積視頻的方案,并且通過點云模型轉換及壓縮算法實現高達800倍的視覺無損壓縮,實現不同模態之間相互切換。公司AIGC視頻內容智能生成系統融合了大模型技術,能助力用戶在新聞傳播、視頻內容創作等多項領域中創作出優質視頻內容。
東方國信在AI多模態方面,公司在文本、語音、圖像、視頻等非結構化數據類型的AI分析上,均有應用產品和落地案例。視覺類有基于Stable Diffusion的圖像生成能力,其他視覺類大模型應用還在探索技術路徑和應用場景。
神思電子公司經過多年人工智能領域積累,已突破了遠距離全天候復雜場景激光熱成像聯動入侵檢測技術,掌握了基于深度學習的非結構化數據處理、視頻分析、語音對話、知識管理以及云平臺技術。公司正在對于文生圖、圖生文、視頻生文、文生視頻等多模態數據互相跳轉的收斂性質進行研究,支撐培訓、檢索、推薦、目標追蹤等多個場景的生成式大模型應用。
因賽集團公司InsightGPT具備文生文、視頻智能剪輯、圖生視頻等功能,目前正在開發文生視頻功能。在現有圖生視頻等技術框架下,InsightGPT目前可生成20秒以上的視頻。在目前文生視頻的邏輯流程中,InsighGPT先結合圖像、視頻大模型,融合摳圖等多種算法,再結合音頻模型,整體渲染后最終合成完整視頻。
拓爾思公司在Transformer架構方面積極跟蹤業內最新技術,未來將根據技術研發和業務需求的實際情況,適時采用類似架構。
國脈文化公司在文生視頻方面,已內部開發基于大模型的AIGC數字內容生成平臺,平臺利用多模態技術,使用自有的版權內容,生成文字、音頻、圖片、視頻等影視素材,進行內容的創作生產,正在內部試用中。
佳都科技公司TransCorc-M多模態大模型能夠理解立本、圖像、視頻等多種模態的信息,并且按照用戶需求將其進行描述、提示或轉化為指令代碼,是個非常“聰明”的交通信息小助手。