想象一下:
開(kāi)車(chē)出門(mén),聽(tīng)自己的聲音為自己導(dǎo)航。入睡前,聽(tīng)自己聲音合成的有聲書(shū)。甚至百年后,你的后代還可以聽(tīng)你的聲音說(shuō)話(huà)。
科技讓一切成為可能。
7月,科大訊飛上線(xiàn)全球首款個(gè)人音庫(kù)定制小程序“訊飛留聲”。通過(guò)小程序,用戶(hù)只需錄制10段文字,就可以獲得專(zhuān)屬音庫(kù)。目前,你可以聽(tīng)自己的聲音讀新聞、講段子。近日,量子程序與科大訊飛音頻娛樂(lè)事業(yè)部總經(jīng)理康融聊了聊“訊飛留聲”背后的故事。
上線(xiàn)一個(gè)月,
訪問(wèn)次數(shù)超51萬(wàn)次
“訊飛留聲”的錄制音庫(kù)分為三個(gè)步驟:
1. 打開(kāi)小程序,選擇“去復(fù)刻我的聲音”。同意用戶(hù)協(xié)議后,用戶(hù)需念規(guī)定文本,錄制10段語(yǔ)音。
2. 為復(fù)刻的聲音起名,綁定手機(jī)號(hào)或微信,上傳錄音。
3. 制作完成,獲得專(zhuān)屬?gòu)?fù)刻聲音。
目前,“訊飛留聲”為用戶(hù)提供了兩個(gè)功能,讀新聞和秀聲音。讀新聞里是一些本周要聞和趣事,秀聲音則是一些比較搞笑的文字。用戶(hù)可以根據(jù)喜好,選擇換一篇內(nèi)容,還可以調(diào)節(jié)秀聲音里內(nèi)容的語(yǔ)速。生成朗讀音頻后,用戶(hù)可以分享內(nèi)容給好友或生成圖片分享到朋友圈。康融告訴我們,用戶(hù)使用秀聲音更多一些,對(duì)分享帶新增很有效,每次分享至少可以帶5個(gè)新增用戶(hù)。
左圖為讀新聞,右圖為秀聲音
我們找了兩位同事試了下,從上傳到制作聲音大概花了五分鐘,生成朗讀音頻則不需要等待。雖然有同事戲稱(chēng)還是有種AI的感覺(jué),但生成的聲音、語(yǔ)氣和語(yǔ)調(diào)都與真人比較相似。
“訊飛留聲”7月上線(xiàn),一開(kāi)始是邀請(qǐng)制,用戶(hù)獲得邀請(qǐng)碼后,才可以體驗(yàn)產(chǎn)品。康融告訴我們,目前小程序訪問(wèn)次數(shù)超過(guò)51萬(wàn)次,新用戶(hù)增長(zhǎng)率達(dá)到568%。后期還會(huì)加大推廣投入,讓更多人感受科技的魅力。
目前“訊飛留聲”的用戶(hù)畫(huà)像和一開(kāi)始邀請(qǐng)?bào)w驗(yàn)的對(duì)象有關(guān),有很多科技行業(yè)從業(yè)者。用戶(hù)以18歲-24歲為主,男性居多,地域分布以一線(xiàn)城市為主。
小北:現(xiàn)在一個(gè)人最多可以建幾個(gè)音庫(kù)?
康融:目前沒(méi)有設(shè)上線(xiàn)。很多年輕人會(huì)錄多次,因?yàn)槊看武浺舻沫h(huán)境和情感表達(dá)不同,生成的音庫(kù)也會(huì)不一樣。還有的用戶(hù)會(huì)邀請(qǐng)女朋友一起完成,兩人各讀一部分,最后出來(lái)的效果也很好玩,像是在說(shuō)泰語(yǔ)。后期我們也會(huì)考慮對(duì)音庫(kù)數(shù)量做限制,并且做實(shí)名制管理,方便用戶(hù)保護(hù)自己的聲音。
小北:未來(lái)還會(huì)上線(xiàn)哪些功能?
康融:接下來(lái)會(huì)推出更多具有實(shí)用性場(chǎng)景的功能,比如親子伴讀。現(xiàn)在的父母生活節(jié)奏都很快,如果有親子伴讀的功能,他們就可以用自己的聲音去給孩子講故事。
此外,下一步還會(huì)考慮和公司內(nèi)部的有聲內(nèi)容產(chǎn)品打通,未來(lái)也可能會(huì)和硬件做結(jié)合,
小北:怎么避免居心叵測(cè)的人利用產(chǎn)品做壞事?
康融:在產(chǎn)品設(shè)計(jì)的時(shí)候,我們就考慮過(guò)這個(gè)問(wèn)題。在音庫(kù)制作環(huán)節(jié),我們選的文本和故事都是隨機(jī)的。錄制過(guò)程中,我們也會(huì)提醒用戶(hù)不要和陌生人分享音庫(kù)信息。音庫(kù)管理也要求用戶(hù)只能登錄特定的賬號(hào)使用。
此外,“訊飛留聲”目前也沒(méi)有上線(xiàn)朗讀自定義文本的功能,只能讀我們提供的固定文本。
小北:小程序怎么做冷啟動(dòng)?
康融:“訊飛留聲”做冷啟動(dòng)很順利,因?yàn)樾碌漠a(chǎn)品和技術(shù)自帶流量紅利。我們主要在AI相關(guān)的社區(qū)和幾十個(gè)社群發(fā)邀請(qǐng)碼,還邀請(qǐng)了一些科技領(lǐng)域的KOL體驗(yàn)產(chǎn)品。頭部媒體的主動(dòng)報(bào)道,也為我們吸引了很多關(guān)注。
小北:目前嘗試了哪些推廣方式?
康融:8月會(huì)開(kāi)始做一些推廣,包括和科大訊飛自有的App、訊飛輸入法做一些結(jié)合。目前也計(jì)劃了和我們自己的小程序做聯(lián)動(dòng),從功能跳轉(zhuǎn)和廣告兩個(gè)層面展開(kāi)。
作為流量入口,
小程序適合展示新技術(shù)
人工智能時(shí)代,科大訊飛、微軟和谷歌紛紛推出個(gè)性化音庫(kù)產(chǎn)品。微軟的CustomVoice需要用戶(hù)上傳500句語(yǔ)音和對(duì)應(yīng)文本。谷歌人工智能實(shí)驗(yàn)室成立的 Lyrebird則需要錄入30句英文聲音。
科大訊飛從1999年開(kāi)始鉆研語(yǔ)音合成技術(shù),連續(xù)13年蟬聯(lián)國(guó)際英文語(yǔ)音合成大賽Blizzard Challenge的冠軍。而最被人們熟知的語(yǔ)音合成技術(shù)案例,高德地圖的明星導(dǎo)航也是訊飛提供的技術(shù)支持。
2017年底,科大訊飛在技術(shù)上的再次突破,讓2小時(shí)的數(shù)據(jù)量變成了5分鐘。也就是說(shuō),只需要10段話(huà),5分鐘就可以讓機(jī)器完成學(xué)習(xí)。普通人就可以留下小朋友變聲前的聲音,留下父母的聲音,留下喜歡的人的聲音,像擁有了獨(dú)家的聲音博物館。
技術(shù)的革新讓科大訊飛產(chǎn)生了用小程序展示技術(shù)的念頭。康融告訴我們,通過(guò)小程序讓更多人接受了這種方式后,才會(huì)推出App。
小北:“訊飛留聲”考慮過(guò)商業(yè)化的問(wèn)題嗎?
康融:“訊飛留聲”的想象空間非常大。在萬(wàn)物互聯(lián)的時(shí)代,語(yǔ)音是一個(gè)非常重要的交互方式了。用戶(hù)可以在智能音響、車(chē)載導(dǎo)航、智能玩具等各種軟硬件中應(yīng)用自己的聲音。這樣的產(chǎn)品IP屬性會(huì)變得非常強(qiáng)。
因此,現(xiàn)在小程序前期還是希望更多的用戶(hù)能知道語(yǔ)音合成技術(shù)是什么,了解自己的聲音是有獨(dú)特的IP價(jià)值。之后,我們會(huì)逐步考慮做一些行業(yè)合作。現(xiàn)階段還是會(huì)把精力放在體驗(yàn)上,找一些好玩的應(yīng)用場(chǎng)景。
小北:上線(xiàn)一個(gè)月以來(lái),小程序有給你們帶來(lái)什么驚喜嗎?
康融:最大的驚喜還是小程序的增長(zhǎng)性。我們自認(rèn)為產(chǎn)品做得還不是很完善,但用戶(hù)參與的積極性很高,提供了很多有效反饋。比如,用戶(hù)希望把在異地的孩子、父母、愛(ài)人這樣的聲音留下來(lái);也有用戶(hù)希望用自己的聲音向喜歡的人去表白;還有公眾號(hào)的作者希望用自己的聲音去讀文章。這些建議都讓我們覺(jué)得很驚艷。
小北:這兩年科大訊飛上線(xiàn)了多款小程序,從to B到to C,科大訊飛對(duì)外宣傳更高調(diào)了?
康融:科大訊飛一開(kāi)始是to B的公司,但我們?cè)谟嶏w輸入法前就開(kāi)始嘗試做to C的應(yīng)用。最近這兩年會(huì)更加高調(diào)一些,一方面是風(fēng)口到了,大眾受社會(huì)和媒體影響,對(duì)語(yǔ)音技術(shù)、人工智能技術(shù)都很感興趣,知道這和生活息息相關(guān)。另一方面做C端產(chǎn)品確實(shí)需要向外發(fā)聲,我們自己的市場(chǎng)宣傳也更主動(dòng)了。小程序是一個(gè)非常好的流量入口,通過(guò)小程序展示技術(shù)是一個(gè)非常好的手段。
聯(lián)系客服