很多人不知道的是,2007年成立的思必馳已經在人機對話領域專注了10年。9月7日,思必馳在北京發布DUI開放平臺,讓語音交互技術開發者隨心所欲定制對話交互功能,力求打造一個人工智能語音交互生態。
“思必馳不是一家語音識別公司,而是一家人機對話公司”
思必馳聯合創始人兼首席科學家俞凱指出,對話是人機交互的核心。對話不等于語音,對話是以人機交互為核心,包括各個模態,對語義的理解,聲音、圖像、感知層面直接的編碼,以完整系統作為優化目標的一種系統級合成,需要全面的技術創新能力。
目前思必馳在抗噪識別、語義理解等技術方面,已經具備了業界領先水平。在抗噪語音識別領域,思必馳的VDCNN算法模型在Aurora4上,取得了7.09%的詞錯誤率,相比于世界其他機構目前10%左右的最好結果,有大幅度的明顯優勢。PSD快速解碼使識別搜索速度提升了5到7倍,在不同的模型下,綜合的速度提升達到了20倍。在語義理解方面,思必馳采用雙向的神經網絡,加上聚焦機制,也取得了標準錯誤集當中最高的精度。
俞凱表示:“思必馳不是一家語音識別公司,而是一家人機對話公司。人機交互是一個完整的智能系統,僅靠單點的技術是無法解決體驗問題的,系統級別的技術才管用。”
思必馳聯合創始人兼首席科學家俞凱
DUI平臺開放注冊,支持快速定制對話系統
DUI(Dialogue User Interface),是一個對話為核心的一個全鏈路智能對話開放平臺,目前已開放注冊。
DUI開放平臺包括四大系統:“用戶體驗雷達”青囊系統,連接第三方海量資源的紫微系統,管理并分析大數據的天機系統和提供多終端接入的玲瓏系統。
據了解,DUI提供的,不僅是基于思必馳智能語音語言技術的對話功能,更包括開發者在定制對話系統時所需要的綜合服務,如GUI定制、版本管理、私有云部署等,讓開發者可以自由定制對話交互系統。
發布會現場,思必馳演示了基于DUI平臺的開發與應用效果。DUI平臺最快支持7分鐘創建一個語音對話技能。DUI平臺內置了國內最專業的語音語言技能商店,具備深度數據可視化、個性化自定義、零門檻操作等優點。通過覆蓋車載、家居、機器人、故事機、手機助手等多應用場景,DUI平臺將為物聯網、移動互聯網和互聯網的開發者提供單點技術服務和完整的人機交互方案。
賦能開發者的同時,DUI平臺對思必馳的技術進化也起到巨大推動作用。俞凱介紹,思必馳最優秀的技術將在DUI的底層技術規劃中,隨著技術逐漸生長,將很快地借由DUI平臺助力行業體驗。這些技術包括:自適應的技術,聲學模型的技術,語義的遷移技術,深度的強化學習等技術的研究與應用等等。
聚焦三大核心場景,打造以AI技術為核心的開放生態
思必馳CEO高始興在發布會上表示,思必馳要打造以AI技術為核心的開放生態。目前,思必馳也與阿里、聯想、富士康、大華股份、小米、騰訊等企業建立合作,賦能數千萬智能終端設備。發布會現場,來自聯想、富士康、大華股份等公司的代表紛紛亮相,介紹與思必馳合作的最新進展。
據了解,家居、車載、機器人玩具是思必馳目前聚焦的三大戰略領域。高始興介紹,目前思必馳在智能車載后裝市場的占有率穩居行業第一,在智能家居和玩具領域覆蓋了急速擴展。
除了技術賦能與深度合作,思必馳還于2016年正式成立了馳星創投,專注投資人工智能和智能交互產業早期項目,希望通過創投的形式打造更加豐富的AI生態鏈。馳星創投已經獲得了元禾資本、富士康、清華控股等LP的支持,現旗下擁有2億元天使基金和10億元成長基金。截止目前,思必馳已成功孵化并投資了車蘿卜、慧聲、先聲教育、AITEK、SIGMOID、愛醫聲、RT-Thread等企業,進一步拓展AI技術的應用領域。
聲音:
“伴隨著人工智能的高速發展,思必馳也在不斷調整產業的定位和迭代。2013年9月7日,思必馳發布了國內首款對話平臺“思必馳對話工場”,開放底層的ASR、TTS、NLU等SDK接口。今天通過DUI開放平臺,思必馳將為更多的企業和開發者定制個性化的服務,為智能生活帶來更多可能。”
——思必馳CEO 高始興