你是否會被人工智能哭泣的聲音所打動?| Mixlab 技術前沿
#音頻工程#、#AI語音技術#、#AI Deepfake#
語音識別技術是指機器自動將人的語音,轉成文字的技術,即ASR技術:Automatic Speech Recognition。語音合成是計算機將機器內部的文字信息轉變為,可聽懂且流利的語言輸出的技術:Text-To-Speech。Sonantic(英國)實際研發的產品是一個音頻編輯器,該編輯器內含有不同的語音模型,基于實際的配音演員聲音開發。該語音技術,能夠根據性別、個性、口音、音調和情緒狀態,快度、準確地塑造角色類型。Sonantic 的聯合創始人弗林說:“以前的技術并沒有捕捉到聲音的高低,我通過尋找聲音的高位和低谷改變了它,并試圖讓算法更多地關注音調起伏。我們延伸了這些自然的點、細微差別和變化。我們知道諷刺和真誠之間的區別,以及聲音中細微的線索。”“去年我們的人工智能哭泣時就被賦予了真實情感,真正的關鍵是關注語言上的細微差別,悲傷時聲音的顫抖,憤怒時的用力。我們嘗試了深入建模,添加了細節并將它們疊加起來,聲音就開始獲得能量聽起來非常現實。”在于幫助游戲公司縮短制作時間、減少生產成本,更重要的是,增強了在游戲中講好故事的能力。
訓練機器人去人聲的標準機器聲音,與聽起來極像人聲的機器人聲音。通過 API 和一個用戶界面工具,Sonantic 可以讓機器合成語音,像人類一樣發聲,完成從文本到語音,并且可以把聲音進行編輯、修飾和導演。如同 “摳臉” 電視劇一般,Sonantic 還可以模擬某位演員的聲音,用機器來幫助演員配音,還可以突出演員們極具個人特色的表演技巧,捕捉 “全譜的深層情感” ,從微妙到夸張的情感都可以從語音表現出來,而這通常只有資深演員才能做到。這能為演員們提供一項新的工作方式,將演員們的聲音變成一項和他們外在形象一樣的資產形式,以增加收入。團隊聯合創始人之一,庫雷希說,這么做的目的并不是要讓配音演員失業,相反它在創作早期就為創作者提供了一個可讀、可審查的腳本。這有助于從一開始就在游戲中加入高度現實的聲音,幫助制作人感受故事的弧線、填補節奏、理解真正需要改變的地方。這樣他們的迭代周期才能繼續快速發展。
業界人士看法:對于任何想要用 AI 重新塑造配音演員的聲音的制作人來說,這都是一個法律雷區。—— 賓夕法尼亞大學法學教授詹妮弗·羅斯曼 Jennifer Rothmanhttps://www.wired.co.uk/article/simpsons-deepfake-voice-actors-ai
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。