帶你了解最新最好玩的高端科技!
來自專欄人工智能
我們生活在一個視頻占據大片江山的時代,但無論電視、電腦、還是你手中瘋狂刷新的短視頻APP,都離不開其中的靈魂——音頻。
現在,人工智能可以在一瞬間克隆人類的聲音。你只需要盡可能仔細地閱讀劇本,對著麥克風講話 30 分鐘左右。
在啟動和停止數十次以重新錄制你的聲音之后,將發送生成的音頻文件進行處理,并在幾小時后被告知您的聲音副本已準備就緒,正在等待中;
然后,你可以在聊天框中輸入任何你想要的東西,你的 AI 克隆聲音會告訴你,所產生的音頻逼真程度甚至可以欺騙到朋友和家人。
由于人工智能學習的進步,近年來語音合成的工作有了很大的改進。
以前,最真實的合成聲音是通過錄制人類配音演員的音頻,將他們的語音切割成組件聲音,然后像贖金票據中的字母一樣將它們拼接在一起形成新詞語來創建的(很多短視頻APP的配音就是這樣的金屬聲)。
現在,神經網絡可以對其目標語音的未分類數據進行訓練,以從頭開始生成某人說話的原始音頻,最終結果可以更快、更容易、更真實地啟動。
名人將成為AI語音合成的最大受益者
曾經飾演過蝙蝠俠的瓦爾·基爾默,在早年間不幸診斷出喉癌。作為喉癌治療的一部分,他接受了氣管切開術,導致自己的聲音受損,這也意味著他的演藝生涯就此結束。
值得慶幸的是他在完全失去發聲之前,錄制了一段音頻以作備用,這段音頻后來被公司利用AI技術完美克隆,使瓦爾·基爾默又重回到熒幕之上。
名人的聲音克隆應用可能在未來幾年最為突出,很多公司希望名人通過克隆和出租他們的聲音以最小的努力來增加他們的收入。
一家名為 Veritone 的公司在今年早些時候推出了這樣的服務,稱它可以讓有影響力的人、運動員和演員授權他們的 AI 聲音用于代言和無線電識別等事情,而無需進入工作室。
Veritone 執行副總裁 Sean King 表示:“這項技術能夠賦能許多不同行業,因為關于某人的聲音以及能夠使用它并能夠擴展它的最困難的部分是個人的時間”
例如,布魯斯·威利斯 (Bruce Willis) 已經授權將他的圖像用作俄羅斯手機廣告中的視覺深度偽造。這筆交易讓他足不出戶就能賺錢,而廣告公司則得到了一個無限可塑性的演員。
克隆聲音感覺就像與未來會面
但這項技術對普通大眾意味著什么?
其實潛在的應用是多種多樣的,不難想象一個視頻游戲,其中角色創建中包含有創建語音克隆的選項,因此聽起來像是玩家正在說出游戲中的所有對話。
或者可能有一款供父母使用的應用程序,允許他們復制自己的聲音,這樣即使他們不在身邊,他們也可以給孩子讀睡前故事。
諸如此類這樣的應用在不同的場景中得以實現,我們始終堅信——任何一種發明技術都有其存在的意義,尤其是出現在人工智能上。
當然了,AI語音合成技術也有潛在的危險。
這項技術難免以后會被一些別有用心的人來用于欺騙公司,將資金轉移到他們的賬戶中,而其他惡意用途肯定潛伏在人們看不到的陰暗角落。
想象一下,一個高中生偷偷錄制一個同學來創建他們的聲音克隆,然后偽造那個人說老師壞話的音頻來給他們帶來麻煩。
不過,有一件事是肯定的:在未來如果愿意,任何人都可以創建自己的 AI 語音克隆,這對于想念已故親人的年輕人是一種莫大的安慰。
結語
科技的進步和人類的智慧是分不開的,而人類又是一種情感復雜的生物;AI語音合成技術在現在看來沒有太多的應用場景,也不用太深層次的研究,但音頻的獨特性讓人們可以體驗到已故親人的存在,這就夠了。
這也是——始于科技,融于自然。