近年來,人工智能語音產品市場發展迅猛,智能產品也由固定插電式使用逐漸向低功耗、便攜式、小型化方向發展。國芯科技是全球領先的專注于數字電視、家庭多媒體及人工智能領域的芯片設計提供商,聲智科技作為全球領先的融合聲學和人工智能技術的操作系統與平臺服務提供商,雙方融合各自芯片+系統的核心優勢,推出了面向智能產品市場的低功耗、便攜化的解決方案——全新GX8008低功耗離在線混合模組。
該款低功耗離在線混合模組基于國芯GX8008 AI語音處理芯片打造,內置聲智科技多模態交互智能操作系統Azero,基于全球領先的聲與智能融合技術,為企業、個人和第三方組織開放,是一款針對于智能前端語音處理的專用模組。
其中,內置的多模態交互智能操作系統Azero基于聲智科技全球頂級全鏈條算法及高度開放的架構,默認集成了信息查詢、內容服務、IOT控制等200+項常用技能與服務,同時提供簡單好用的語音技能開發工具和Turnkey智能產品軟硬件方案,可以極大降低AI行業應用的開發難度和使用門檻,快速滿足不同用戶和行業群體的個性化需求。
用戶可以實現快速接入,2周即可完成原型驗證,3個月即可實現產品量產出貨。經過了千億次人機交互真實場景的規模驗證,可為家居、辦公、車載、會議、可穿戴等20+場景和設備提供高效的人機交互和智能決策能力。
產品——高性價比,超低功耗
聲智科技與國芯聯合推出的這款GX8008低功耗離在線混合模組,采用了國芯最新研發的AI芯片GX8008,專用于智能前端語音處理。該芯片創新地設計為多核異構結構,集成多個處理器,內置多路高性能ADC,支持4路麥克風陣列。芯片中集成的DSP語音處理器,用于處理前端語音信號,DSP+4MIC,精準捕捉來自各個方向的語音信號,進行語音降噪處理,執行本地語音識別等。
聲智科技與國芯聯合推出的這款GX8008低功耗離在線混合模組,搭載了Azero操作系統的噪聲抑制、回聲消除、自動增益、聲源定位等AI算法,支持遠場語音喚醒、遠場語音識別、遠場語音合成、自然語言處理、離線命令詞喚醒等能力,同時支持喚醒詞定制化。
其最大亮點之一在于低功耗,模組采用的GX8008芯片可達到運行功耗100mW,待機功耗25mW以內。更重要的是,該模組匹配Azero操作系統的低功耗降噪喚醒算法,可在有效保障流暢智能語音交互能力的同時,降低功耗和產品成本。低功耗算法和芯片的強強聯合,意味著模組可以更好適配帶電池設備,應用范圍可以拓展到各種小型便攜設備如藍牙音箱、故事機、便攜按摩儀等,進一步豐富IoT的品類和落地場景。例如,市面上已有的智能臺燈、智能故事機、智能玩具、智能音箱等產品,目前仍以單一的插電式使用方式為主,但通過WiFi SOC+GX8008模組的搭配,完全可以實現低成本的帶電池方案,打造便攜式產品,提供更加高效便利的用戶體驗。
(降噪+喚醒+AEC+BF+各種接口)
另外,當產品的使用由相對固定的室內環境延伸到移動環境中時,噪聲環境將變得更加復雜多樣。經過聲智科技Azero操作系統獨家優化的降噪喚醒算法處理后,便可有效保障復雜環境中5m范圍內高效語音喚醒和精準語音識別,滿足用戶無障礙的語音交互需求。
應用——適應不同場景的“量身定制”
這款低功耗離在線混合模組支持模塊的自由擴展,可接入藍牙、WiFi等模塊,并可通過USB等接口實現多種數據通訊方式,因此可覆蓋如智能家居、智能車載等多種場景,滿足不同領域的需求,擁有廣闊的市場空間。
【GX8008+藍牙】
通過GX8008模組搭配麥克風陣列,可完成語音拾取和語音精準化處理,之后通過藍牙輸送至各個終端完成交互,操作便捷快速。目前,我們已推出了遠場語音遙控器、車載拾音器、智能藍牙音箱等多個完整解決方案。
以遠場語音遙控器為例,產品可用于語音電視的交互控制,在家庭應用場景中可實現遠場語音激活、語音識別。用戶可通過語音自由遙控電視,隨時隨地、一呼即應;聚焦于車載場景的車載拾音器,則可廣泛應用于車載的各種品上擴展,如車載支架、車充、快充等。拾音器可對車內噪聲進行精準降噪,同時可通過本地短指令接聽或掛斷來電等。
(智能車載解決方案應用框圖)
【GX8008+WiFi】
GX8008低功耗離在線混合模組可以將GX8008處理完成的前端語音數據,通過WiFi模塊送至聲智SoundAI Azero智能操作系統的云端,完成語音識別和語義分析,形成完整的交互鏈路。方案可應用于智能音箱、兒童故事機、智能家居等場景。用戶可以通過定制本地短指令來豐富產品的個性化功能。
(智能家電離在線解決方案應用框圖)
【GX8008+USB】
當GX8008模組加上USB接口時,應用范圍可進一步拓展。模組將采集到的音頻通過前端語音降噪模塊和算法處理,最大程度削弱無關的環境噪音,獲得完整清晰的高質量音頻。模組使用USB接口即插即拔,進而可以快速便捷地獲取到算法降噪處理后的語音數據,以便下一步的數據處理。該方案可以運用到會議記錄儀等錄音產品和語音電視等家電產品上。
(語音電視解決方案應用框圖)
關于聲智科技
聲智科技成立于2016年5月,是融合聲學和人工智能技術的平臺服務商,主要提供SoundAI Azero智能操作系統和服務,以及深度結合應用場景的人工智能技術和產品解決方案,致力于實現“讓機器更智能”的使命,達成“用科技改善生活”的愿景。聲智科技是中關村前沿技術企業、中關村高新技術企業和國家高新技術企業,累計申請知識產權1000多項,參與5項國家標準制定,服務華為、小米、百度、騰訊、阿里、中國移動、中國聯通、中央人民廣播電臺、聯想、創維、寶潔、萬科、奇虎360、金蝶、浪潮、國美等150多家知名客戶和2000多萬臺智能設備,經過千億次人機交互真實場景的規模驗證,可為家居、辦公、車載、會議、可穿戴等20+場景和設備提供高效的人機交互和智能決策能力。
聲智科技擁有聲學、語音、語義和圖像等基礎技術,以及分布式系統架構、云計算和邊緣計算等應用技術,具體包括聲學陣列、聲學結構、聲學處理(聲源定位、回聲抵消、噪聲消除、混響抑制、波束形成、多人分離、語音增強等)、主動降噪、雙工通話、聲學探測、聲學監控、語音喚醒、聲紋識別、語音識別、語音合成、語言理解、情緒識別、人臉識別、文本識別、語音搜索、智能推薦、知識圖譜、數據挖掘、虛擬數字人、實時音視頻通信、多傳感融合、多模態交互與深度學習框架等自主核心技術。