近兩年來(lái),人工智能自動(dòng)生成內(nèi)容的水平顯著提高,深度偽造(Deepfake)技術(shù)即為一類(lèi)典型技術(shù),用于模仿、偽造人類(lèi)行為特征,生成圖片、視頻、音頻等。在娛樂(lè)應(yīng)用以外,深度偽造技術(shù)所潛藏的風(fēng)險(xiǎn)不容小覷。
近兩年來(lái),隨著以機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)的發(fā)展,人工智能自動(dòng)生成內(nèi)容的水平取得了顯著的提高,深度偽造(Deepfake)技術(shù)即為一類(lèi)典型技術(shù),用于模仿、偽造人類(lèi)行為特征,生成圖片、視頻、音頻等。其中,AI換臉為深度偽造技術(shù)的典型代表。
借助AI換臉技術(shù),可對(duì)照片和視頻中的人臉進(jìn)行替換,而保持原有視頻中人物的動(dòng)作、神態(tài)與表情。深度偽造技術(shù)的廣泛傳播,則得益于互聯(lián)網(wǎng)的便利。盡管視頻換臉技術(shù)早已為在影視制作中得以運(yùn)用,但深度偽造技術(shù)概念的興起源于美國(guó)Reddit論壇中2017年出現(xiàn)的一個(gè)名為“deepfakes”的賬號(hào)。2019年,ZAO軟件風(fēng)靡國(guó)內(nèi)社交媒體,用戶(hù)將個(gè)人照片錄入系統(tǒng)后,即可將自己的面部與影視劇中的明星替換,“出演”影視片段。開(kāi)源換臉框架和軟件的廣泛傳播,使得深度偽造的運(yùn)用門(mén)檻不斷降低,非專(zhuān)業(yè)用戶(hù)也可輕松憑借一張照片生成偽造視頻。在娛樂(lè)應(yīng)用以外,深度偽造技術(shù)所潛藏的風(fēng)險(xiǎn)不容小覷。
一、深度偽造技術(shù)的原理
深度偽造技術(shù)的興起主要?dú)w功于生成對(duì)抗網(wǎng)絡(luò)(GAN)的出現(xiàn)和發(fā)展。GAN 算法上同時(shí)搭載著兩個(gè)神經(jīng)網(wǎng)絡(luò):生成器與識(shí)別器。生成器可基于一個(gè)數(shù)據(jù)庫(kù)自動(dòng)生成模擬該數(shù)據(jù)庫(kù)中數(shù)據(jù)的樣本;而識(shí)別器則可評(píng)估生成器生成數(shù)據(jù)的真?zhèn)巍烧咴诨ハ嗖┺膶W(xué)習(xí)中產(chǎn)生大規(guī)模和高精確度的輸出。研究人員使用大量人臉圖像訓(xùn)練GAN網(wǎng)絡(luò),使其掌握人臉圖像中眼睛、鼻子、嘴巴及表情等特征。在新輸入圖像與視頻后,GAN框架會(huì)對(duì)會(huì)對(duì)人臉特征進(jìn)行捕獲,并完成面部圖像的替換與操縱。使用計(jì)算機(jī)對(duì)視頻中的多個(gè)單幀進(jìn)行批量處理即可生成深度偽造視頻。
當(dāng)前深度偽造技術(shù)的應(yīng)用方式主要有四種類(lèi)型:第一種是借助軟件更換面部,也是目前為止用得最多的,例如已被我國(guó)禁用的換臉軟件“ZAO”;第二種是操縱人臉動(dòng)作,重塑表情、口型和速度,讓其發(fā)表非其真實(shí)意圖的言論,如美國(guó)網(wǎng)民就利用深度偽造技術(shù)制作Facebook公司CEO扎克伯格的視頻,已在網(wǎng)絡(luò)上廣泛傳播;第三種是借助深度學(xué)習(xí)技術(shù),創(chuàng)建在現(xiàn)實(shí)生活中并不存在的面部圖像,如在職場(chǎng)社交平臺(tái)領(lǐng)英(LinkedIn)中被稱(chēng)為“數(shù)字間諜”的凱蒂·瓊斯(Katie Jones),就是使用人工智能技術(shù)合成的虛擬形象,被用于收集政府官員信息;第四種是將面部表情與聲音結(jié)合,借助深度學(xué)習(xí),創(chuàng)建聲音模型,如2019年8月,犯罪分子創(chuàng)建德國(guó)某能源公司總裁的聲音模型,成功騙取該公司英國(guó)分部22萬(wàn)歐元。
早期,計(jì)算機(jī)需要借助同一面孔的多張不同角度照片才能完成人臉的替換,且替換準(zhǔn)確度有限、替換痕跡較為明顯。隨著技術(shù)的不斷進(jìn)步,深度偽造技術(shù)僅憑一張面孔照片即可進(jìn)行替換操作,并能自動(dòng)調(diào)節(jié)換臉后的對(duì)比度、亮度、顏色和替換邊緣的差異,而不讓人眼輕松發(fā)現(xiàn)。至此,深度偽造檢測(cè)技術(shù)進(jìn)入發(fā)展新階段。
二、深度偽造技術(shù)存在的風(fēng)險(xiǎn)
深度偽造技術(shù)一旦被濫用,其將對(duì)個(gè)人、社會(huì)和國(guó)家構(gòu)成極大風(fēng)險(xiǎn)。相關(guān)風(fēng)險(xiǎn)按層次梳理如下:
1.個(gè)體肖像權(quán)、名譽(yù)與隱私權(quán)損害
若有不法者利用深度偽造技術(shù)制作虛假色情視頻和虛假言論視頻,則有可能被用作誣陷、誹謗和“色情報(bào)復(fù)”的手段,將對(duì)個(gè)人肖像權(quán)、名譽(yù)權(quán)和隱私權(quán)造成嚴(yán)重危害。
2.企業(yè)信譽(yù)及經(jīng)濟(jì)的損失
深度偽造技術(shù)的不當(dāng)利用,同樣會(huì)對(duì)企業(yè)的經(jīng)營(yíng)活動(dòng)造成不可估量的負(fù)面影響。若不法者利用深度偽造技術(shù)制作企業(yè)負(fù)責(zé)人的公開(kāi)談話(huà)視頻,篡改表情及談話(huà)內(nèi)容,散播虛假信息,將使社會(huì)公眾發(fā)生錯(cuò)誤認(rèn)識(shí),直接影響公司的信譽(yù)及經(jīng)濟(jì)利益。2019年6月,有網(wǎng)民使用深度偽造技術(shù)制作Facebook公司CEO扎克伯格發(fā)表演講的視頻。該視頻在網(wǎng)絡(luò)上廣泛傳播,即證明這種擔(dān)憂(yōu)并非空穴來(lái)風(fēng)。
3.新聞媒體行業(yè)的社會(huì)信任衰退
深度偽造技術(shù)同樣可能被用于篡改新聞報(bào)道中的圖像和視頻。若社會(huì)公眾對(duì)記者和媒體持有不盡信任的態(tài)度,偽造視頻更會(huì)加劇公眾的不信任。深度偽造技術(shù)的存在證明眼見(jiàn)耳聞并不可靠,很可能會(huì)對(duì)新聞媒體的公信力造成沖擊。
4.國(guó)家安全、公共安全受到威脅
不同于文字和圖片,深度偽造技術(shù)制作的視頻可以讓虛假的信息以“高度可信”的方式呈現(xiàn)給社會(huì)公眾,從而操縱觀(guān)眾的情緒反應(yīng),引發(fā)社會(huì)廣泛的不信任。因而該技術(shù)很可能被敵對(duì)勢(shì)力利用,作為詆毀國(guó)家機(jī)構(gòu)、煽動(dòng)恐怖和暴力活動(dòng)、挑撥?chē)?guó)家內(nèi)部矛盾的工具。例如,美國(guó)政府官員就指出深度偽造技術(shù)對(duì)美國(guó)2020大選的潛在威脅——若放任偽造視頻擴(kuò)散,則會(huì)對(duì)美國(guó)總統(tǒng)選舉產(chǎn)生不良影響,挫傷選民的積極性。
從短期看,深度偽造還可能會(huì)對(duì)公共安全產(chǎn)生一定影響。不法者可能利用虛假視頻煽動(dòng)暴力沖突,造成惡性后果。此外,深度偽造技術(shù)還可能成為造謠者擺脫質(zhì)疑的工具。在深度偽造普遍運(yùn)用的環(huán)境下,人們將不再輕易相信自己親眼所見(jiàn),說(shuō)謊者正好可以利用民眾的這一心理散布謠言。對(duì)于不利于自己的信息,盡管其沒(méi)有經(jīng)過(guò)任何加工,任何人都可以宣稱(chēng)是偽造的,從而達(dá)到混淆公眾視聽(tīng)的目的,為社會(huì)治安的治理增添難度。
三、深度偽造技術(shù)治理
面對(duì)深度偽造技術(shù)存在的風(fēng)險(xiǎn),各國(guó)分別推出深度偽造檢測(cè)手段并出臺(tái)相關(guān)政策進(jìn)行防范、核查和治理。
美國(guó)國(guó)防部高級(jí)研究計(jì)劃局于2018年8月設(shè)立“媒體鑒證”項(xiàng)目,以尋求深度偽造識(shí)別工具,并最終推出一款準(zhǔn)確率高達(dá)99%的識(shí)別工具;2019年9月,為激發(fā)業(yè)界對(duì)于深度偽造檢測(cè)的創(chuàng)造,亞馬遜AWS云服務(wù)部門(mén)、Facebook、微軟、人工智能媒體誠(chéng)信指導(dǎo)委員會(huì)聯(lián)合發(fā)起深度偽造識(shí)別挑戰(zhàn)賽,懸賞1000萬(wàn)美元尋求最高效的深度偽造識(shí)別工具,以應(yīng)對(duì)深度偽造視頻可能對(duì)2020年美國(guó)大選所造成的影響,英國(guó)牛津大學(xué)、美國(guó)麻省理工學(xué)院、加州大學(xué)伯克利分校等高校亦參與其中。
對(duì)于偽造圖像的檢測(cè)主要以邊緣檢測(cè)為主。計(jì)算機(jī)對(duì)圖像進(jìn)行網(wǎng)格劃分與瑕疵識(shí)別后,可識(shí)別出不符合常規(guī)的邊緣特征,從而判斷出圖像是否經(jīng)過(guò)修改。
對(duì)偽造視頻的檢測(cè)方法可以分為兩類(lèi):一是基于幀間時(shí)間特性的方法(Temporal features across frames),利用視頻內(nèi)人眨眼頻率、嘴型等時(shí)間相關(guān)的特性進(jìn)行判斷,通常使用遞歸分類(lèi)方法;二是基于幀內(nèi)視覺(jué)效果的方法(Visual artifacts within frame),利用圖像邊緣的瑕疵以及五官位置、面部陰影等不自然的細(xì)節(jié)進(jìn)行判斷,通常提取特定特征后用深層或淺層的分類(lèi)器完成檢測(cè)。
此外,亦有研究人員提出使用可追溯、不可篡改的區(qū)塊鏈技術(shù)對(duì)深度偽造視頻進(jìn)行追溯。2019年3月,阿拉伯聯(lián)合酋長(zhǎng)國(guó)哈利法大學(xué)電氣與計(jì)算機(jī)工程系研究人員發(fā)表名為《使用區(qū)塊鏈和智能合約打擊深度偽造視頻》(Combating Deepfake Videos Using Blockchain and Smart Contracts)的論文,提出使用區(qū)塊鏈的解決方案和通用框架,以追蹤數(shù)字內(nèi)容的來(lái)源和歷史,即使數(shù)字內(nèi)容被多次復(fù)制也可對(duì)其進(jìn)行溯源。該論文提供的解決方案框架具有普適性,亦可應(yīng)用于任何其他形式的數(shù)字內(nèi)容。
具體成果方面:2017年8月,新加坡信息通信研究所網(wǎng)絡(luò)安全小組發(fā)表名為《自動(dòng)人臉交換及其檢測(cè)》(Automated face swapping and its detection)的論文,第一次提出AI換臉檢測(cè)框架,檢測(cè)準(zhǔn)確率達(dá)到92%。從此,業(yè)界對(duì)于人工智能換臉技術(shù)及檢測(cè)技術(shù)的研究進(jìn)入白熱化階段,企業(yè)、高校及個(gè)人開(kāi)發(fā)者紛紛投入對(duì)人工智能換臉檢測(cè)工具的開(kāi)發(fā)。
2019年6月,美國(guó)加州大學(xué)伯克利分校和南加州大學(xué)研究人員通過(guò)已有的非偽造視頻,收集視頻中個(gè)人的特征,構(gòu)建高度個(gè)人化的“軟生物識(shí)別指標(biāo)”體系。識(shí)別系統(tǒng)在掌握個(gè)人的微表情和行為習(xí)慣后,鑒偽準(zhǔn)確率可達(dá)到95%。美國(guó)Adobe公司也于2019年6月推出反向PS(Photoshop,全球使用最廣泛的修圖軟件,此處意為“編輯圖片”)工具。依托于AI算法,該工具可自動(dòng)識(shí)別出人像圖片中經(jīng)過(guò)圖像液化工具修改的部分,并將其還原成初始樣貌,準(zhǔn)確率高達(dá)99%。
為幫助研究人員開(kāi)發(fā)深度偽造自動(dòng)檢測(cè)工具,谷歌公司于2019年9月公開(kāi)發(fā)布深度偽造視頻識(shí)別數(shù)據(jù)集,其中包含3000多段視頻,由多位真人演員在28個(gè)不同場(chǎng)景下拍攝。全球研究人員都可使用該完全開(kāi)源的數(shù)據(jù)集對(duì)深度偽造檢測(cè)工具進(jìn)行訓(xùn)練。
隨著越來(lái)越多的深度偽造檢測(cè)框架與訓(xùn)練數(shù)據(jù)集在網(wǎng)絡(luò)上開(kāi)源,國(guó)內(nèi)對(duì)于深度偽造視頻識(shí)別的研究成果也逐漸顯現(xiàn)。
清華大學(xué)人工智能研究院旗下初創(chuàng)企業(yè)RealAI于2019年12月發(fā)布深度偽造換臉檢測(cè)工具,可在1秒鐘時(shí)間內(nèi)對(duì)超過(guò)10人同框的圖像與視頻進(jìn)行深度偽造識(shí)別,識(shí)別率可達(dá)到99%。2020年1月,北京大學(xué)與微軟亞洲研究院聯(lián)合推出深度偽造識(shí)別工具“Face X-Ray”,該工具不依賴(lài)于與特定圖像修改技術(shù)相關(guān)的深度偽造知識(shí),并且其算法可以在不生成假圖像的情況下進(jìn)行訓(xùn)練。研究結(jié)果表明,F(xiàn)ace X-Ray能有效地識(shí)別出未被發(fā)現(xiàn)的假圖像,并能可靠地預(yù)測(cè)圖像混合區(qū)域。
(二)深度偽造相關(guān)法規(guī)政策與措施
各國(guó)已經(jīng)意識(shí)到深度偽造技術(shù)可能帶來(lái)的潛在風(fēng)險(xiǎn),因此也開(kāi)始在政策和立法層面進(jìn)行積極應(yīng)對(duì)。中國(guó)、美國(guó)、德國(guó)等國(guó)均出臺(tái)相關(guān)法律法規(guī),對(duì)深度偽造技術(shù)進(jìn)行管控。相關(guān)的法律法規(guī)條款均對(duì)深度偽造內(nèi)容的性質(zhì)、責(zé)任主體、處罰標(biāo)準(zhǔn)等方面進(jìn)行規(guī)范,意在對(duì)個(gè)人權(quán)利和國(guó)家安全的保護(hù)。其中,美國(guó)由于大選臨近,相關(guān)立法更多注重于對(duì)2020年總統(tǒng)大選的保護(hù)。(各國(guó)涉深度偽造的立法情況可參照《技經(jīng)觀(guān)察 | 各國(guó)涉Deepfake等人工智能造假技術(shù)立法概況》一文。)
為規(guī)避深度偽造視頻可能帶來(lái)的不良影響,社交媒體平臺(tái)也紛紛出臺(tái)管控措施。推特公司表示,將為所有深度偽造視頻貼上明顯的標(biāo)簽,以提醒瀏覽者;Facebook公司則表示將在2020年美國(guó)大選前刪除模仿、諷刺內(nèi)容以外的深度偽造視頻,以限制錯(cuò)誤信息的傳播。
四、總結(jié)
一方面,深度偽造技術(shù)為文化和娛樂(lè)創(chuàng)造了更多可能,該技術(shù)有望能讓歷史人物變得活靈活現(xiàn),也能幫助創(chuàng)造更好的視頻效果,使得演員的出演安排更加靈活,以上是深度偽造技術(shù)對(duì)于娛樂(lè)、教育等領(lǐng)域的有益影響。而另一方面,若深度偽造技術(shù)被不當(dāng)利用,用于制作有害的虛假視頻,則會(huì)對(duì)國(guó)家政治安全造成嚴(yán)重影響、對(duì)個(gè)人和企業(yè)的合法權(quán)益形成威脅。
當(dāng)下,深度偽造技術(shù)與檢測(cè)技術(shù)正處于復(fù)雜且不分伯仲的博弈中,“貓和老鼠”的斗爭(zhēng)仍將持續(xù)。視頻發(fā)布平臺(tái)可能存在的審核疏漏以及輿論的阻力會(huì)給深度偽造視頻的監(jiān)管帶來(lái)不利影響,且由于互聯(lián)網(wǎng)使用成本低、網(wǎng)絡(luò)作案具備一定的隱蔽性,深度偽造技術(shù)治理將會(huì)是一個(gè)長(zhǎng)期的斗爭(zhēng)過(guò)程。如何規(guī)范深度偽造技術(shù)的使用,除了法律規(guī)范的嚴(yán)格限定,也需要科研人員持續(xù)開(kāi)發(fā)“打假”工具,并結(jié)合有針對(duì)性的人工審查,形成完善可靠的治理體系。
作者丨唐乾琛
研究所簡(jiǎn)介
國(guó)際技術(shù)經(jīng)濟(jì)研究所(IITE)成立于1985年11月,是隸屬于國(guó)務(wù)院發(fā)展研究中心的非營(yíng)利性研究機(jī)構(gòu),主要職能是研究我國(guó)經(jīng)濟(jì)、科技社會(huì)發(fā)展中的重大政策性、戰(zhàn)略性、前瞻性問(wèn)題,跟蹤和分析世界科技、經(jīng)濟(jì)發(fā)展態(tài)勢(shì),為中央和有關(guān)部委提供決策咨詢(xún)服務(wù)。“全球技術(shù)地圖”為國(guó)際技術(shù)經(jīng)濟(jì)研究所官方微信賬號(hào),致力于向公眾傳遞前沿技術(shù)資訊和科技創(chuàng)新洞見(jiàn)。
地址:北京市海淀區(qū)小南莊20號(hào)樓A座
電話(huà):010-82635522
微信:iite_er
聯(lián)系客服