本期談談
《虛擬私人助理》相關(guān)的內(nèi)容。
我們先大致看下人工智能10大細分行業(yè)的典型應用:
1、深度學習/機器學習:
預測數(shù)據(jù)模型與分析數(shù)據(jù)的軟件平臺;
垃圾郵件檢測;
金融詐騙檢測;
2、自然語言處理:
語音識別;
智能客服;
智能化軟件幫助系統(tǒng);
智能化知識管理系統(tǒng);
智能企業(yè)形象代表;
智能導游;
智能查詢系統(tǒng);
3、計算機視覺/圖像識別:
面部識別軟件;
基于內(nèi)容的圖片檢索;
智能交通;
醫(yī)療計算機視覺和醫(yī)學圖像處理;
軍事探測和導彈制導;
無人駕駛環(huán)境檢測;
4、手勢控制:
電腦手勢指令系統(tǒng);
游戲軟件手勢操控;
人眼運動跟蹤系統(tǒng);
汽車導航;
智能電器的手勢操作;
5、虛擬私人助手:
網(wǎng)絡客服助理;
個人助理app;
個人日程管理;
6、智能機器人:
家庭機器人;
銷售機器人;
7、推薦引擎和協(xié)助過濾算法:
音樂推薦app;
美食推薦網(wǎng)站;
8、情境感知計算:
可穿戴傳感器;
智能決策支持系統(tǒng);
智能家居;
精準農(nóng)業(yè);
9、語音翻譯:
視頻談話實時翻譯;
網(wǎng)絡研討會多語翻譯;
10、視頻內(nèi)容自動識別:
安防智能監(jiān)控;
視頻侵權(quán)檢測;
應用很廣,我們設計師大用可為啊~
其中關(guān)于計算機視覺/圖像識別方面,在上一期已經(jīng)做過梳理,可以點擊鏈接回顧下:
以下為正文:
大家都用過或者聽過蘋果的siri吧!這款產(chǎn)品的所用到的技術(shù)涉及自然語言處理、語音識別、語音合成等。它是一款語音助手產(chǎn)品,與語音對應的還有基于文本的聊天機器人相關(guān)產(chǎn)品,他們都屬于虛擬私人助理的具體應用產(chǎn)品。
虛擬私人助理帶來了人機交互方式的轉(zhuǎn)變,人機交互方式從GUI轉(zhuǎn)入了以自然交互為主的NUI。
計算機人機交互方式的演進:
簡單的CLI
Command-line interface:
命令行界面
用戶與計算機的互動主要以簡單連續(xù)的指令為主
復雜的GUI
Graphical User Interface:
圖形用戶界面
用戶與計算機的互動還增加了瀏覽、視頻、語音、游戲等方式
自然交互為主的NUI
Natural User Interface:
自然用戶界面
與計算機的交互發(fā)展到觸摸屏、語音交互、與穿戴式設備的交互、AR和VR的交互
這個時代的設計師,習慣于GUI的交互方式,面對的交互方式從復雜的GUI界面,到接近自然的NUI的轉(zhuǎn)變,難免會迷失方向,如果不跟上時代的步伐,很快設計師就要被淘汰啦~所以我們必須了解交互方式的變化,及其特點,才能更好的基于人工智能做我們的設計。
我梳理了對話式交互的一些要點,以供參考。
一、對話式交互的2個主要應用方向:
可以是基于文本的,或者是基于語音的。
基于語音的需要語音識別技術(shù)的支持,理想的情況是不存在具體的交互界面,僅靠聲音對話就可以達到交互的目的,受限于目前技術(shù),語音式的交互大多用于兒童玩具或者個人助理相關(guān)的場景。
典型應用是語音助手。
基于文本,比語音稍簡單點,因為在交互中,我們需要借助于具體的圖形界面,這樣的話,可以用具體的功能按鈕輔助,規(guī)避技術(shù)難題,可以做到在自由聊天與具體場景業(yè)務間的無縫過渡。
典型應用是聊天機器人。
二、對話式交互的特點:
信息需要根據(jù)上下文語境來呈現(xiàn),每一次對話將決定下一次對話的信息;
產(chǎn)品的信息架構(gòu)以決策樹為主;
設計師思考角度的轉(zhuǎn)變;
設計師需要從界面的流程設計轉(zhuǎn)向基于決策樹的策略設計,建立滿足用戶需求的完整決策樹和尋找最優(yōu)路徑,更多地思考上下文前后信息的展現(xiàn)邏輯。
三、對話式技術(shù)解決方案:
3.1 人工對話
主要代表為美國創(chuàng)業(yè)公司設計的個人助理應用Magic。當用戶提出要求如“幫我買一張機票”時,后臺通過人工運營為用戶提供解決方案,其實就是有個貼身客服為你解決問題。
優(yōu)點:本質(zhì)上是人與人之間的溝通,能避免很多問題;
缺點:當用戶量漲起來后,后臺的人工運營壓力較大。
目前Magic通過一半人工一半機器回答的形式轉(zhuǎn)型,減少后臺的壓力。
3.2 預埋對話
主要代表為蘋果Siri,微軟的Cortana,及百度的度秘。目前大部分對話式產(chǎn)品都采用該方案,通過識別語句中的關(guān)鍵詞給出預埋的解答。
優(yōu)點:降低答案的失誤和減少重復的工作;
缺點:是當設計師沒有意識到問題的其他最優(yōu)解決辦法或存在的bug,整個系統(tǒng)可能給不出最佳答案甚至無解;以及整個對話下來其實就是人與機器的獨白,沒有任何交流。
3.3 人工智能對話
主要代表還是蘋果的Siri、Google的Google Now、微軟的Cortana、Amazon的Echo以及百度的度秘。該方案主要通過處理大數(shù)據(jù)和機器學習的形式進行自我迭代優(yōu)化現(xiàn)有決策樹。
優(yōu)點:實現(xiàn)更完整的決策樹和產(chǎn)生更多最優(yōu)的解決方案,它能理解更多指令和記錄用戶的習慣;
缺點:但如何理解上下文,理解用戶情感仍是最重要的難題。
我覺得,
目前比較可靠的技術(shù)解決方案是:
三種方法融合,
然后交給設計師好好設計:
上下文前后信息的展現(xiàn)邏輯。
下面我們具體看看2大應用方向的案例及技術(shù)路徑。
四、語音助手
案例:
蘋果的siri,亞馬遜的Alexa,微軟的Cortana,Google Assistant語音助手,三星Bixby語音助手等。
功能:
控制智能家居,或者是個人智能助理。
語音識別是面臨的第一個技術(shù)環(huán)節(jié),作為設計師我們可以了解下相關(guān)的語音識別開放平臺,畢竟不是每家公司都有實力從0到1搭建一個好用的語音識別系統(tǒng)的。
訊飛http://www.xfyun.cn/
百度語音http://yuyin.baidu.com/asr
我調(diào)查下來,如果是一般的應用,用百度的比較簡單,專業(yè)級應用還是用訊飛吧。
語音識別在設計的應用場景:
a、photoshop、cad、sketch啥的都可以通過語音來控制來,解放設計師的雙手。這個基于語音聽寫,把語音轉(zhuǎn)化為文字,再轉(zhuǎn)化為具體的計算機指令,可以達到。
b、方案匯報不用自己講了,讓機器人幫你講解,不過目前來看,設計師得提供文字版的演說稿,基于訊飛的語音合成,挑選一個喜歡的方言、音調(diào)來講解。
五、聊天機器人
案例:
社交娛樂元素,小黃雞、微軟小冰等聊天機器人加入社交平臺,滿足了年輕用戶的追求新鮮的口味;
購物,推銷商品或服務,比如谷歌語音助手向用戶玩起了推銷,告知《美女與野獸》將于今日上映的廣告;
美國好萊塢名媛、真人秀明星金·卡戴珊就推出了同名聊天機器人;
企業(yè)官方客服,淘寶客服就是典型的應用;
新聞資訊,比如國外很火的對話式app:quartz;國內(nèi)類似的微信訂閱號:狗帶君;
個人日程管理、訂票、查詢天氣,微信服務號:助理來也。
目前對話大多以簡單命令和問題為主,如
“今天天氣怎樣?”
“清明節(jié)是什么時候”
“最近最便宜的餐廳在哪?”
“現(xiàn)任美國總統(tǒng)是誰”
“杭州在哪?”。
上圖為我最近在開發(fā)的app截圖
聊天機器人通過“天氣,餐館,最近,最便宜”等關(guān)鍵詞明確命令后,在數(shù)據(jù)庫和互聯(lián)網(wǎng)上進行搜索,將最優(yōu)答案反饋給用戶。
聊天機器人能簡單處理的問題:
是什么
什么時候
哪一個
是誰
什么地點
面對為什么,及如果(過程)的問題用戶體驗較差,聊天機器人很難處理。
目前大部分聊天機器人,可以做到簡單問題的回答、查詢天氣、查看新聞、查詢航班、給用戶講笑話、推薦菜譜、查找圖片等通用型問題。
比如下圖是微軟小冰等能力圖譜:
國內(nèi)開放平臺推薦
圖靈機器人http://www.tuling123.com/
用下來感覺效果還行。
tensorflow也是有相關(guān)的開源項目的,比如:
https://github.com/Conchylicultor/DeepQA
動手能力強的話,可以下載下來玩一把~
嗯,虛擬私人助理這篇就寫這么多內(nèi)容,拋磚引玉,讀者們可以思考下語音助手、聊天機器人、對話式的交互方式,是否還有其他有趣的玩法,或應用了。
人工智能相關(guān)文章: