精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
讓語音助手更像人,要做出哪些努力?

標貝科技是一家2016年2月組建,6月開始正式運營的語音合成公司。憑借不到30人的小團隊和僅僅1人的市場兼銷售,他們在成立當年便與百度、滴滴等大企業展開合作,確立了自己在語音合成領域的位置。


語音合成對多數人而言并不是多么陌生的技術,大家都知道這一技術應用在哪些地方。百度地圖、滴滴出行等出行類app,喜馬拉雅小雅音箱、Rokid若琪等智能音箱,出門問問等語音助手都被我們熟知。他們的聲音背后,都有標貝的方案。


語音的背后是智能。標貝科技在產業中所處的位置,是人工智能的人機交互部分,這部分可進一步細分為語音識別、語義分析(2017年在國內驟然興起的NLP)及語音合成三個領域。誠然,作為一家創業公司,標貝科技需要面對不少先行者乃至巨頭;幸運的是,科大訊飛、捷通華聲等老前輩把更多精力集中于語音識別,近些年國內的創業同行們也普遍專攻NLP,語音合成則相對是市場認知較晚、從業專家較少的領域。


國內最早研究語音合成的團隊,一些在國家機關如中科院,一些集中在高等學府如北大、清華、中科大等,一些則在科大訊飛、捷通華聲等公司任職。最初的語音合成技術,應用于銀行叫號機、火車站廣播等跟互聯網沒啥關系的產品。嚴格來說,那個時代的語音合成并不是人工智能的細分領域;也因此,在需求變化后,當語音合成離不開人工智能,這個行業需要一定程度的「從頭再來」,這也就給了標貝科技等創業公司以機會。


雖然尚屬創業公司,但標貝科技的創始團隊及其核心技術人員普遍有著六、七年以上的從業經歷,他們來自科大訊飛、捷通華聲、百度等大企業,不僅是這一曾經的冷門行業中為數不多的高級人才,彼此之間的合作也早有年月。此次出來創業,以創始人劉博為首的標貝科技,打算帶著語音合成的專業知識和經驗,全面擁抱人工智能時代。


僅僅提到「語音合成」,不足以描述標貝科技的垂直程度,實際上他們更專注于語音合成背后的數據庫及其加工方式。簡而言之,機器說話可以理解為對人類說話的一種模仿,但人類說話并沒有一種固定的模式——拿高德地圖來說,林志玲語音包和默認語音包能一樣么?基于林志玲創建的語音數據庫,可能就比來自其他人的更受歡迎一些。


更細微的差別不止于此。一個成年人在興奮時什么語氣,沮喪時什么語氣,正午什么音調,子夜什么音調,工作時如何用詞,私密時如何用詞,可能都會有顯著區別。對于社會而言,10年前人們普遍的說話方式,及今天人們普遍的說話方式,差異也是一聽便知。


比如你現在走進屋子來錄音。你剛剛進來時的聲音,和你坐了一個小時后的聲音,其實是不一樣的。如果用這種有瑕疵的數據庫來做語音合成,就很難避免不自然、不像人的地方。


消除語音助手的「機器味」,或至少避免嚴重的違和感,產品背后的語音數據庫就一定要與產品調性匹配,并且與時俱進——同樣是神似真人的聲音,你大概不希望打理日常瑣事的語音助手,是2006年黃健翔解說足球比賽那個風味吧?


標貝所做的事情,就是通過構建更完善、更優質的數據庫,讓機器發聲更自然、更貼近真人,也更適合產品自身的需要。使用過小雅音箱或若琪(這兩款音箱的語音合成都來自標貝)的朋友大可自己判斷,和其他產品相比,哪些聲音聽起來更舒服。


標貝科技創始人劉博表示,從數據庫切入市場也有另一重考量,在于數據庫更有說服力。比起對技術的解讀,直接展示手中的資源更容易打動客戶。不過,如今的標貝也推出了比數據庫更直觀的產品——免費、公開的TTS評測系統,讓不了解自己「為什么做不好語音合成」的客戶明白問題出在哪兒。




發現問題后,有些問題可以通過技術層面的改善解決,有些則必須調整數據庫本身。這時,標貝積累的資源就能派上用場。基于更好的數據庫,很多努力都可以事半功倍;對于企業來說,既然沒必要重復造輪子,提前做好準備的標貝,就順勢成為了許多企業的首選。畢竟,時代已不同以往,想要在人工智能領域取得優勢,細節非常重要。


不管說的內容是什么,有人說話讓你聽著很舒服,有人則讓你很煩躁。聲音是一個與體驗密切相關的東西,合格的就是合格,不合格的就是不合格。不合格的聲音再怎么做些微改善,也達不到今天的要求。


而不合格的聲音帶來的,則是顧客對產品評價的全面下降。回憶一下,在與通常的語音客服交流時,聽著那種語速極慢的機器聲音逐個蹦字「XXX請按1,XXX請按2……」,你的第一需求是否是「馬上轉接人工」?類似語音客服的存在,不僅沒有很好地緩解人工客服的壓力,更是浪費了客戶的時間。不管對企業還是對社會,這種聽起來就像機器的聲音,都有改善的必要。


「人工智能興起之前,市場沒有對語音合成的需求。所以直到2015年、2016年,這個行業才有創業的機會。」劉博說,標貝能很快與各行各業、很多公司開始合作,也正因為語音合成的圈子太小,誰做了什么、做得怎么樣,圈里人都一清二楚。團隊實力強勁的標貝,很快便受到關注,業務起步迅速也是情理之中了。


正因為行業以前有點「隱形」,從業人員太少,現在的人工智能公司,無論做智能音箱、語音助手還是兒童玩具,都極難找到足夠人才組建自己的語音合成團隊。這時,由行業精英組成的,為數不多的幾家創業公司,會對市場起到舉足輕重的支持作用。標貝科技也因此被凱泰資本看好,于2017年10月拿到1000萬元規模的Pre-A輪融資。


值得一提的是,從成立初期一直到2018年,標貝提供的主要服務就是數據庫及部分算法,從一個相當垂直的角度切入市場,打造了良好口碑。但今年開始,考慮到越來越多的新公司、小團隊也加入了人工智能大軍,而他們需要的更可能是完整的語音合成方案,標貝也推出了自己的語音合成全套服務。


那么,哪些行業最可能成為標貝的客戶呢?劉博透露道,雖然目前能見到的還不多,但人工智能語音很快就會在泛文娛方向發力,尤其是游戲及兒童玩具等。劉博說,游戲中的NPC引入人工智能后,就能應對更多的情況,不再重復向玩家播放兩三句固定臺詞。


這不禁令我想起《上古卷軸5:天際》的一些智能NPCmod。mod雖然帶來了更豐富的內容,無非也只是從一個小框架跳到一個大框架里,用mod作者的努力代替了游戲團隊的更新。但智能化的NPC,則能跳出框架,進入一個真正自由的領域。屆時,游戲,尤其是近年火熱的開放世界游戲,顯然會給玩家帶來更豐富多變的體驗,也能極大延長游戲的壽命。


與此同時,若將更好的語音合成技術應用于機器人,則家用機器人就會更有陪伴感,更適合照顧小孩、老人。今年的中國,機器人娛樂很可能成為重要的一環,我們不妨批判一下它們的語音系統——誰是智能的,誰還停留在「銀行客服」水平。


本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
如果電腦說話的聲音真的和人類一模一樣
人工智能的嘴巴:微軟語音合成,用自己聲音做獨一無二的語音引擎
六年級 第11課 聆聽你的聲音
不要高估AI對人類語言的理解 我們需要承認深度學習的局限性
ObEN語音研究科學家公布最新語音合成研究成果
錄視頻聲音不好聽怎么辦,AI人工智能語音合成幫到你,免費用的
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 安泽县| 建平县| 泽库县| 江油市| 广西| 双桥区| 百色市| 勃利县| 罗平县| 钟祥市| 万安县| 邮箱| 东源县| 抚松县| 湘乡市| 东乌| 金华市| 三穗县| 莱州市| 岐山县| 浑源县| 项城市| 延长县| 肃宁县| 兴国县| 广元市| 上思县| 青海省| 正蓝旗| 东至县| 来凤县| 晋宁县| 荥经县| 永宁县| 肥乡县| 平远县| 桂林市| 阳泉市| 天水市| 泽州县| 虎林市|