近日一段AI換臉視頻火爆網絡,一個網名叫換臉哥的Geek,將朱茵在94版射雕中的黃蓉換成了楊冪。
后來甚至有的主播利用類似技術,在直播平臺上利用實時換臉技術,直接把自己換成某些一線明星來吸引眼球。
后來換臉哥直接下架了相關視頻,并發聲明稱希望大家專注于技術本身。這起事件看起來只是一個娛樂版的頭條,但是深入思考一下也會發現,視頻換臉技術其實也給金融業普遍使用的如:客戶交易視頻資料留檔、人臉交易授權等風控手段帶來了一定風險。
◆ ◆ ◆
一、AI換臉技術的前世今生
其實對于PS中各種美顏、瘦臉和磨皮的技術,我想大家都不十分陌生了,甚至有的女生是專門根據美顏功能的高低而去選擇相應手機的,不過這類圖像處理技術的應用范圍始終還是被圈定在靜態圖片的處理上。直到17年底一個網名叫”deepfakes”的人出現,在Reddit上發布了一段成人視頻,而視頻的主角卻從根本從未參加過拍攝,一時之間受害的女星還很多,不過她們卻發現deepfakes做法好像沒有什么對應的法律能夠約束,只能轉向Reddit投訴,后來Reddit近于壓力干脆直接封殺了deepfaks的賬號。不過這次封殺卻讓deepfaks直接開源了其換臉項目的代碼。
接下來的18年中AI換臉技術在科研學術研究領域和開源社區兩個方向上都獲得了不小的發展,在SIGGRAPH(暨國際計算機圖形學會)的18年年會上一個由斯坦福大學、慕尼黑技術大學、巴斯大學等科研究機構聯系研發的”Deep Video portrait”系統橫空出世,該技術不但能讓被替換的人臉完全模板原視頻中人物的表情,甚至在放大對比時,兩個視頻在發絲和睫毛的表現上都能做到極度的精確,后來描述該技術的論文被發表在了《ACM圖形交易上》,不過所幸的是研發”Deep Video portrait”技術的幾家機構并沒有公開其項目的源代碼。
而在開源社區中AI換臉技術也是得到了相當多的關注,筆者初步在github上看了一下,由deepfaks衍生(如faceswap, deepfacelab)而來的開源項目數量不下十幾個,其中以faceswap、Openfaceswap等開源項目為代碼的換臉技術在github上的更新與討論十分熱烈,可以說完全看不到趨冷的跡象,極快的推動了開源換臉技術的迭代速度。而以FaceApp為代表的項目雖然沒有開源,但是它們都提供了支持一鍵式操作的應用程序,極大的降低了換臉技術的使用門檻。
依據筆者在周末的親身測試結果,如果有一定編程知識和基礎的程序員大概只需要半天就能在開源社區的幫助下建立好相應的開發環境,代碼調試中的問題也都能得到很快的解決;而如果完全沒有編程基礎的人士,只需要一塊NVIDA的中高端顯卡也能能夠使用faceApp的應用程序來進行換臉操作,只是如果遇到問題需要另外付費咨詢。
◆ ◆ ◆
二、AI怎么能把人臉換的毫不違和?
我們將原視頻中的人物面部信息簡稱為faceA,將要被替換人物的面部信息簡稱為faceB.
1、人臉偵測和識別。首先要讓機器通過含有faceA的視頻定位并識別到其中的人臉特征值,通過深度學習將faceA還原到正面、平行均勻光照、標準亮度的場景下。接下來對含faceB的視頻進行相同操作,將aceB也還原到正面、平行均勻光照、標準亮度的場景下。
2、確定變換矩陣:接下來我們對原視頻的人臉信息進行定位與偵測,并進行特征提取(以下簡稱featureA),然后用featureA與faceA對比,找出faceA轉換到featureA的所需扭曲、光照等變換的矩陣(以下簡稱transferA)。
3、人臉替換:對faceB進行基于transferA的變換,也就是把faceB還原到原視頻的拍攝角度及光源場景下,形成新的人臉信息featureB,使用featureB對featureA進行替換。
4、對于視頻中的每一禎信息重復以上操作直至結束。
所以了解清楚了AI的換臉原理,我們也能看出目前實時換臉的技術,還只能用在人正面面向鏡頭且不劇烈運動的場景,因為如果transferA非常復雜,對其進行計算的時間要求較高,基本無法達到實時換臉的效果。
不過實時換臉的這種局限也不能令我們放心,由于Depfakes算法本身就考慮了換臉時的光線、角度等方面,使其生成的假視頻難以被反偵測;而且隨著各類開源項目的興起,換臉技術的應用對于大眾來說其技術門檻也在不斷降低。
◆ ◆ ◆
三、奇點來臨,如何應對
在一年多之前視頻偽造還幾乎是個不可能完成的任務,不過隨著技術的發展,AI換臉甚至AI換一切的技術都必然出現。那么面臨這樣一個如此具有顛覆性技術的到來,我們到底如何應對?
讀到這里我相信很多讀者都有這樣的疑問,能否利用AI技術本身對于偽造的視頻進行鑒定呢?而這個問題在開源社區中已經有過比較充分的討論了。我們知道凡是機器學習都會有損失函數,是可以利用這個函數對兩個面部特征不同的視頻做做替換關鑒定,不過這種方法也有相當的局限,由于損失函數是換臉后的視頻相對于原視頻的概念,而不巧的是當你只有一個視頻情況下,還沒有任何穩定的方法能夠鑒定它是否被修改過。所以結論就是如果幾段視頻中有真有假,AI可以幫助你鑒定真假,而如果一段孤本的視頻,則沒有辦法去鑒定它是否為真。
所以我們必須要正視換臉技術所帶來的直接沖擊,那就是視頻影像材料做為證據的效力大幅減弱。筆者在之前《為什么黎曼猜想會和你的錢包有關系》的文章中曾經介紹過,目前金融業的信息安全體系主要有對稱和非對稱加密兩種,其中對稱加密是防盜的,沒我的鑰匙就打不開我的箱子;非對稱加密是防篡改的,改了我說的話就和我的簽名對不上了,這里不加贅述,感興趣的讀者可以翻閱一下之前的文章。而目前視頻可以被任意修改而無法被鑒定的根本原因,就在于目前還沒有一種視頻編碼規范,能夠滿足可追溯、防篡改的要求。
其實訪問照PDF文件的格式規范,簡單來講在每禎視頻后加入簽名信息,其實就能達到防篡改的目的,即便AI能夠轉錄換臉,但是由于拿不到原作者的簽名,很容易鑒別真偽。在這里我們也呼吁國家盡快建立基于國密算法的防篡改視頻標準,并盡力能夠使其成為國際標準,個人認為這也是我們國家的國密算法走向國際化的一個契機。
最后筆者還要指出,這種呼之欲出的視頻編碼規范,其實和區塊鏈的機制具有強關聯性的。我們知道區塊鏈揚名立腕的根本就是其防篡改、分布式和時間戳的屬性,那么我們不妨開個腦洞將監控、取證等證據效力要求較高的視頻簽名信息定時送上區塊鏈,利用區塊鏈的安全機制為視頻防篡改多加一層保險,以達到提升安全性的目的。也讓我們拭目以待,看看被AI打破的信任,能否被區塊鏈重建。
< end >
如果您對本文有好的想法,就留下您的寶貴建議吧!