300 + 明星創業公司,3000 + 行業人士齊聚全球人工智能與機器人峰會 GAIR 2017,一同見證 AI 浪潮之巔!目前僅剩少量余票,有需要的朋友抓緊了。
不可否認,在技術落地、市場洞悉力上,亞馬遜很多時候都遠甩其他對手。
智能音箱的緣起
拿現在熱的發燙的智能音箱來說,早在 2014 年,針對智能家居細分市場,亞馬遜就發布了智能音箱硬件產品 Echo。
連貝索斯都沒想到的是,經歷 Fire Phone 慘敗后的亞馬遜的這款智能音箱卻成了市場新寵。據不完全統計,截至目前,Echo 的銷量已達一千萬臺,更不可思議的是,亞馬遜的股價也由此創下歷史新高。
從這開始,智能音箱之火徹底被點燃了。它成功地引發了 2017 年智能硬件市場上的最大風暴,在很短時間內便引發其他巨頭相繼入局。
很快,戰火也燒到了到大洋彼岸的中國,精明的中國商人當然不會放掉這次機會。據雷鋒網不完全統計,國內目前已經有近百家大小小的公司開始打起智能音箱的主意,進擊內容大消費市場。
智能音箱為啥火了
都知道智能化將會帶來新一輪的行業洗牌。但誰都想不到,幾十年后,音箱行業也會被一群互聯網公司所取代。但雷鋒網好奇的是,偌大的智能硬件市場,為何是智能音箱獨得寵愛。
從產品角度來說,主要基于幾點。一、價格相對便宜,和電視等大物件相比,用音箱做智能家居控制中心比較容易入局;二、需求較高,聽歌娛樂已經成為人們茶余飯后必須的休閑活動,而音箱的接受度及普及率相對較高;三、體積較小,占地空間小。
從市場角度分析,一切都源自交互入口。
喜馬拉雅副總裁李海波告訴雷鋒網,未來的 20 年內,“互聯網 +” 將變為 “AI+”。人工智能會深刻改變各個行業,首當其沖的是內容產業,而從這塊來說,以語音作為家庭交互切入口將成 “最佳捷徑”, 他解釋說,隨著整個 IOT 產業崛起,人們都在企盼一種與機器更自然的交互方式,而語音無疑是最佳入口,因為它最順應人性(看看世界上有那么多閱讀障礙者便知)。它與之前的觸屏帶來的移動互聯網一樣,屬于平臺級機會。現在智能音箱 AI 時代交互入口的概念被更多人所意識到后,沒有人愿意在智能手機之后的下一個平臺級機會前被拋下。
聲智科技聯合創始人李智勇認為智能音箱市場變得火爆的直接原因是海外四大科技公司同時入局(這在觸屏手機之后是僅有的一次),更深層原因是大科技公司意識到了人機交互變革背后所蘊含的龐大能量。這種力量是非常顛覆性的,想象下如果微信不來自騰訊,那騰訊今天很可能只是個百億市值的公司。這類通用型產品,大公司全線入局是必然的。
而此前在接受雷鋒網的采訪中,歐瑞博首席增長官李婧也認為,巨頭混戰智能音箱市場背后是看中了其 “語音交互” 功能。其邏輯在于,希望能以語音為突破口,把 “音箱” 作為中樞,通過智能音箱和語音技術,以此來搭建智能家居生態體系。
從國際市場上的智能音箱產品上看,語音交互在智能音箱領域早已被運用多時。與做一款單純的智能硬件音箱相比,獲得龐大的用戶數據和掌握軟件服務入口,以及建設屬于自己的核心生態,才是科技巨頭真正看重的。
為什么國內做不出一款爆品
如果說企業趨之若鶩地發布智能音箱都是看重了其重要的交互入口從而布局智能家居大生態。那么,多年來如此多的中國廠商入駐,為什么還是做不出一款爆品?
在歐瑞博首席增長官李靖看來有兩方面原因,一方面是因為用戶群體對于智能音箱這個產品不感冒;另一方面,國內的智能音箱市場,目前還沒有一款拿得出手的 AI 智能語音助理產品能夠搭載在智能音箱上實現軟硬結合與并具備相對較好的語音交互體驗。
聲智科技聯合創始人李智勇也給出了他的看法。他認為現在還沒出現爆品的最關鍵原因是因為產品還不好用。他認為語音交互這事必須整體上跨過某個臨界點,否則就不好用。第一關鍵是反映速度、交互精度、喚醒率、誤喚醒率必須過某個界限,這是硬門檻。然后是要匹配足夠搭的內容,讓用戶確實感覺到可用性。這兩者都整合好了,才是最終的體驗。
筆者認為,除了以上兩位專家所言,音箱 “革命” 的受阻因素包含有很多,出現不了類似于 Echo 爆品的因素也有很多。
一、技術積累不足,產品打磨不夠
智能音箱作為語音智能助手的家庭入口,遠遠超出了音箱定義的范疇,它涉及了語音交互的完整生態鏈。其中的軟件技術的落地并不是一蹴而就的,它需要相當長時間的累積。
正如基于 Alexa 的 Echo 所成功關鍵,其實更在于較早的語音技術生態的布局。這個階段很像 Android 上線后,從 1 萬個技能發展到 10 萬個技能的階段。Echo 正處在快速發展的階段,在語音識別、麥克風陣列、降噪、語義理解,均已經實現全站語音交互。目前,Alexa 已有 12000 項技能,并主要致力于做開發者生態。這是其他玩家現階段無法比擬的,或者需要很長一段時間才能追趕上。
事實上,Echo 的誕生也并非一帆風順,Echo 智能音箱是由亞馬遜數百技術人員歷時三年才打磨完成;蘋果 HomeKit 在推出之后就硬軟件適配上就花了兩年之久,相比之下,國內很多智能家居小廠商由于體量問題,往往接不到功能較為強大的軟硬件資源;也有某些廠商為了趕上這個風口,在幾個月時間內,通過跟一些第三方語音方案和硬件公司的合作,迅速把產品從圖紙設計轉為實物上市,雖然看起來能用,但整個交互以及體驗欠佳,缺乏對使用場景的了解和對用戶行為和心理習慣的研究。
另外是缺乏合作。就此,聲智科技創始人 CEO 陳孝良坦稱,拿語音交互來說,國外巨頭不斷收購相關公司壯大實力,而國內公司總是喜歡自家組建小團隊搞定一切,試問精力如此分散如何才能超過國外的巨頭?何況語音交互壓根也不是搞搞深度學習就能解決的,這本身就需要對聲學和智能都有深刻的理解和長期的積累才能做好。
二、音箱內容資源匱乏,缺乏用戶粘性
在大數據規模、用戶積累以及軟件生態整合方面做得不夠,用戶選擇一款產品,看中的不單單是智能硬件,更重要的是背后的服務和內容。而在上下游生態閉環這塊,很多公司稍顯能力不足,內容打通的還遠遠不夠。
中金公司研究部 2 月的報告以亞馬遜的智能音箱 Echo 為例,指出智能音箱已經從早期用戶的小眾圈子進入大眾市場,這不僅歸功于語音助手平臺 Alexa 的語音識別技術優勢,越來越多的第三方應用使其可為普通家庭帶來實用價值是更為根本的原因。
引述美國統計機構的數據稱,音樂流媒體和圖書、家庭自動化、新聞和播客等,成為 Echo 最經常使用的第三方應用。目前,亞馬遜向超過 12000 個應用開放了語音助手平臺,其中也包括游戲應用和亞馬遜的合作商戶,比如餐廳或比薩店。
而 HomePod 則充分利用了蘋果的內容資源。據雷鋒網了解,HomePod 將集成與智能家庭的交互中心。該設備將包括 Siri 集成功能,它能夠像 iPhone 一樣響應查詢,可以閱讀電子郵件、發送信息、閱讀推文,以及與 iOS 深度整合來提供提醒、通知等功能;并作為智能家居的中心,控制燈、插頭、門鎖、窗簾盒其他智能設備。另外還面部識別功能。音箱可以通過這些識別家庭成員,并進行語音交互。
讓人無解的是,濃濃的 iphone 風在 HomePod 上也得到了延續,對于第三方的權限被完全鎖定,蘋果 HomePod 目前只支持自家的 Apple Music 服務,而這的確會讓 Spotify 或 Pandora 的用戶感到失望。
上述觀點詳細地解釋了為何中國至今還沒有爆款產生。另外數字家圓 CEO 唐波也補充說,目前國內的智能音箱廠商實力是有的,但還是過于急功近利。基于 AI 的智能音箱產品的鏈條其實很長,任何一家創業公司不可能將其從頭做到尾,如今正值市場的培育期,相關廠商應該優勢互補,步步為營,讓自己的產品在國內獲得口碑。當消費者對智能音箱有了更正向的認識且抱有更大的期待時,也會是智能音箱真正要繁榮的時代,這是一個長期的拉鋸戰,不可能短期內解決戰斗。
除了后天短板,在還未能制造爆款的問題上,中國在有些方面也存在一些 “先天不足”。
一、自然語言處理(NLP)
智能音箱的落地過程中,NLP 技術發揮了很大的作用,但有一點必須弄清楚,東西方由于文化的巨大差異,其語言表達方面也存在巨大的差異。而這種差異也決定了類似 Echo 這類語音智能助手的普及速度。從實用文本分析技術而言,中文要分詞,英文不需要;從 NLP 研究角度而言,中英文在詞性標注、句法分析等任務上頗有差異,中文相對歧義更多。但由于這些機器語言都是以英文處理,因此,在相等前提下,機器處理中文要復雜的多。因此,中國廠商在應用這些技術時,必須得讓 NLP 更好的理解中文,而這無疑增加困難度,更何況語言是個性的、場景的和情緒的。而從這點來看,外國廠商就相對輕松的多。
二、用戶使用環境
總體來說,國外在薪資和獨套大房的比例上比中國高很多。在此條件下,花費相當少的費用便可以讓整個家庭都可以享受最新的科技,何樂不為?相對國內,除了智能手機、手提電腦等必備物品,其他類的智能硬件產品由于各種原因還不能觸碰到人們的購物欲望。所以就目前需求來說,中國市場還不是那么旺盛。
阿里巴巴能否帶來新活力
巧合的是,在中國遲遲制造不了爆款的局面下,多種證據表明阿里巴巴將于 7 月 5 日發布首款智能音箱,如果該音箱成功發布,毫不夸張的說,這將是最有可能對標亞馬遜 Echo 的產品。
看來,阿里巴巴這次是有備而來了。
有意思的是,在發布會前夕,阿里巴巴智能音箱提供技術支持的團隊也首次曝光了其自然語言處理成果。一篇自然語言處理(NLP)的相關論文《一種新的語義編碼模型及其在智能問答及分類中的應用》被國際數據挖掘頂會 KDD2017 收錄。在自然語言處理的兩個核心應用場景 ------ 文本分類和智能問答上,阿里巴巴這套即刻喚醒,即刻識別神經網絡模型的智能問答準確率相比微軟的 wikiqa 數據集和 IBM 的 insuranceqa 數據集提升了 2-4%,是目前業內最高水準。而上文也提到這項技術恰恰是語音交互最核心的技術。
阿里智能音箱也許并非應用于生活場景
雷鋒網分析,基于阿里巴巴的電商屬性,此次發布的智能音箱理當應該利用淘寶、天貓資源主打購物功能,但從整體市場來看,此塊還不成熟。從雷鋒網 (公眾號:雷鋒網) 此前采訪科大訊飛胡郁可得知,真需求一定是用來滿足用戶剛需行為的功能。雖然 Echo 現在賣的很好,但調查后發現,用戶真正用得比較多的工具不過是設個提醒、查個天氣等等。之前亞馬遜大力推的 Echo 語音購物功能并沒有做起來,當用戶用語音交互的形式去買東西時,會發現里面各個環節和場景挺麻煩,還不如直接在屏幕操作來的方便。
所以這也是很多企業一直在強調語音交互要和視覺呈現的原因,因為用戶在面對沒有視覺呈現的情況下,你獲得的信息不夠,這時候很難完成一些復雜的操作。所以有些功能和場景都是我們自己憑空想出來的,直到真正投入實際使用時卻發現用戶的思維與行為習慣并不是產品設計的那樣。
基于此,雷鋒網認為,針對亞馬遜的 “前車之鑒” 以及阿里此前在 NLP 方面的技術積累大多針對淘寶客服、螞蟻金服等工作導向的內容;再包括阿里在很多包括語音等細分技術領域與百度、科大訊飛等公司還有差距等因素,我們有理由猜測阿里巴巴此次發布的智能音箱更有可能或者更傾向于針對工作場景。
究竟是怎樣,明天見分曉。
結語
目前,以亞馬遜 echo 為代表的智能音箱產品讓我們有理由相信,基于 AI 的智能硬件產品也可能是市場的真實需求。對于國內市場,經過幾年沉淀,已經到了各路英雄放完大招見分曉的關鍵節點,在這番智能音箱的較量中,誰能夠實現自我進化的野望,拭目以待。
全球人工智能與機器人峰會
將于本周 7 月 7 日 - 7 月 9 日在深圳舉行,
目前僅剩少量余票,有需要的朋友抓緊了