近些年人工智能企業(yè)在中國受到了資本、媒體、社會以及政府的高度關注。前一段時間在香港提交IPO招股說明書的曠視科技也不例外,拿出了沖擊中國AI科技第一股的架勢,可謂話題感滿滿;2019上海世界人工智能大會也剛剛落幕,商湯科技、極鏈科技、第四范式、思必馳等人工智能企業(yè)集中展示了一年來的創(chuàng)新成果;斯坦福AI實驗室基于計算機視覺技術打造智能醫(yī)院,幫助醫(yī)院降低感染率并改善病人的健康。
一組數(shù)據(jù)顯示,2018年中國13項目人工智能技術中計算機視覺應用占比為29%,排名第一。AI投資方面2017年投資頻次達到歷史峰值425筆,2018年的投資金額達到歷史峰值1045億元。回顧三年內(nèi)人工智能行業(yè)的研發(fā)成果,不可否認,計算機視覺是人工智能在中國落地應用最順利的技術了。相比進程坎坷無人駕駛技術,計算機視覺技術已經(jīng)大規(guī)模的實現(xiàn)了商業(yè)化落地。
不少人工智能從業(yè)者和技術研發(fā)者認為:頭部AI企業(yè)已經(jīng)面臨技術瓶頸。不管技術研發(fā)到何種地步,計算機視覺的場景化應用已經(jīng)帶來了巨大的社會價值和商業(yè)價值,比如AI+安防的”疑犯追蹤“、AI+零售的”無人售貨“、AI+物流的”面單識別“、AI+醫(yī)療的“影像診斷”等。在AI賦能安防、醫(yī)療、金融領域浪潮過后,“視聯(lián)網(wǎng)”或?qū)⒊蔀橄乱粋€藍海。
5G+AI驅(qū)動“視聯(lián)網(wǎng)”實現(xiàn)
“下載一部高清電影,只需要十幾秒”這是業(yè)界對5G速度的描述,在5G+AI支持下,視頻將成為連接人與下一代智能設備、人與互聯(lián)網(wǎng)的重要媒介,進而形成以視頻作為主要信息傳遞介質(zhì)和功能載體的互聯(lián)網(wǎng)形態(tài)——視聯(lián)網(wǎng)。AI技術在視聯(lián)網(wǎng)中的核心是對視頻的識別,即通過算力、算法、大數(shù)據(jù)的優(yōu)化,代替人工篩查。一方面對于網(wǎng)絡視頻安全,AI技術可以實現(xiàn),對視頻的高頻場景進行敏感信息的檢索,包括畫面、圖片、語言、等多維度的信息篩查。另一方面,綜合視頻平臺每年耗費大量資金購買視頻播放版權,但是除了熱播內(nèi)容外還有大量視頻的變現(xiàn)能力亟待提高,AI技術將優(yōu)化用戶體驗以及挖掘視頻的商業(yè)價值。
視頻數(shù)據(jù)標注
除了提高算法精度以外,提高數(shù)據(jù)標注的效率也是當前眾多計算機視覺公司的重要課題之一。Google、Microsoft等互聯(lián)公司相繼推出了自動標注系統(tǒng)AutoML和Cognitive Services。遷移學習、主動學習等算法的應用也是重要研究方向。
視聯(lián)網(wǎng)下的“視頻數(shù)據(jù)標注”,可以理解為對視頻的精細化分類,不同于用戶所看到“驚悚”、“喜劇”、“科幻”分類,“內(nèi)容標注”主要針對全網(wǎng)視頻進行多種維度的標注。極鏈科技VideoAI技術將視頻劃分出人、物、空間、事件四大維度,其中人、物可細分為姓名、表情、吃、汽車、品牌、手機等多個標簽,而在空間、場景中還包括、聚餐、約會、談判、旅行、加班等。
內(nèi)容的精細化標注分類,可直接助力于視聯(lián)網(wǎng)VideoOS應用市場,讓視頻應用直接為用戶提供搜索、購物、知識、社區(qū)、游戲等多種功能服務。簡言而之,當你在看韓劇時非常想吃韓式拉面,通過視頻應用可以發(fā)現(xiàn)周邊口碑最好的韓式美食,以及視頻電商直接購買相關的速食食品。
服務入口
場景經(jīng)濟,是當今互聯(lián)網(wǎng)行業(yè)的必修課程。淘寶是購物服務的入口,滴滴是出行服務的入口,支付寶是金融服務的入口,視聯(lián)網(wǎng)就是視頻場景下的各種服務的入口。視聯(lián)網(wǎng)模式要做的就是在用戶觀看視頻的場景下,基于用戶需求的平臺化服務入口。
軟硬件日趨成熟
AR/VR、3D建模等技術正在逐步實現(xiàn)商用化,而AR/VR類似技術應用初期的商業(yè)化路徑,多數(shù)是通過游戲和娛樂形式來實現(xiàn)的。MIT研究團隊發(fā)布了相關研究報告,目前視頻技術已經(jīng)可以輕易做到在維持原有視頻含義的情況下,自動生成新的影片,實現(xiàn)換臉或視頻合成等功能。
以智能眼鏡為例,當人們帶上智能眼鏡后,本質(zhì)上是將攝像頭捕捉到的視頻信息以虛擬層的形式與人看到的真實世界進行重合,進而可以在兩者間展開豐富的互動,但這種互動的要求必然是零轉(zhuǎn)換、低延時的。隨著軟硬件的開發(fā)和協(xié)同能力的提高,相關智能設備或?qū)⒊蔀橐暵?lián)網(wǎng)成熟階段用戶觀看視頻的物理介質(zhì),同時會有更多視聯(lián)網(wǎng)應用出現(xiàn)。
視聯(lián)網(wǎng)發(fā)展的核心是視頻識別能力的不斷積累,視聯(lián)網(wǎng)的參與主體們都在努力修煉自身算法,以期盡早占據(jù)技術高地,形成獨一無二的產(chǎn)品優(yōu)勢。
應用場景和數(shù)據(jù)的增多會有助于進一步優(yōu)化視頻識別算法,從而為應用場景帶來更好的服務效果,促進商務的更快拓展。因此,對于以技術為核心的眾多初創(chuàng)企業(yè)而言,迅速拓展商務能力不僅能帶來高速增長的業(yè)績,更是企業(yè)生存和競爭必要選擇。
從市場規(guī)模看,當前已有的廣告和電商的互動形式將支持視聯(lián)網(wǎng)迅速踏上百億級的臺階,三年的估算是一個相對保守的測算。我們發(fā)現(xiàn)兩個趨勢,一是視頻場景廣告正在替代傳統(tǒng)前貼片廣告,而場景廣告現(xiàn)有規(guī)模已經(jīng)接近500億之多;二是視頻生產(chǎn)的門檻降低,隨之而來視頻量迅速增多,視頻內(nèi)容占全網(wǎng)數(shù)據(jù)存儲量的83%。對于視聯(lián)網(wǎng)企業(yè)而言,加強資源整合,形成行業(yè)+技術的綜合壁壘將是關鍵。