本期談談

《虛擬私人助理》相關(guān)的內(nèi)容。

我們先大致看下人工智能10大細分行業(yè)的典型應用：

1、深度學習／機器學習：
預測數(shù)據(jù)模型與分析數(shù)據(jù)的軟件平臺；
垃圾郵件檢測；
金融詐騙檢測；
2、自然語言處理：
語音識別；
智能客服；
智能化軟件幫助系統(tǒng)；
智能化知識管理系統(tǒng)；
智能企業(yè)形象代表；
智能導游；
智能查詢系統(tǒng)；
3、計算機視覺／圖像識別：
面部識別軟件；
基于內(nèi)容的圖片檢索；
智能交通；
醫(yī)療計算機視覺和醫(yī)學圖像處理；
軍事探測和導彈制導；
無人駕駛環(huán)境檢測；
4、手勢控制：
電腦手勢指令系統(tǒng)；
游戲軟件手勢操控；
人眼運動跟蹤系統(tǒng)；
汽車導航；
智能電器的手勢操作；
5、虛擬私人助手：
網(wǎng)絡客服助理；
個人助理app；
個人日程管理；
6、智能機器人：
家庭機器人；
銷售機器人；
7、推薦引擎和協(xié)助過濾算法：
音樂推薦app；
美食推薦網(wǎng)站；
8、情境感知計算：
可穿戴傳感器；
智能決策支持系統(tǒng)；
智能家居；
精準農(nóng)業(yè)；
9、語音翻譯：
視頻談話實時翻譯；
網(wǎng)絡研討會多語翻譯；
10、視頻內(nèi)容自動識別：
安防智能監(jiān)控；
視頻侵權(quán)檢測；

應用很廣，我們設計師大用可為啊～

其中關(guān)于計算機視覺／圖像識別方面，在上一期已經(jīng)做過梳理，可以點擊鏈接回顧下：

寫給設計師的人工智能指南：圖像

以下為正文：

大家都用過或者聽過蘋果的siri吧！這款產(chǎn)品的所用到的技術(shù)涉及自然語言處理、語音識別、語音合成等。它是一款語音助手產(chǎn)品，與語音對應的還有基于文本的聊天機器人相關(guān)產(chǎn)品，他們都屬于虛擬私人助理的具體應用產(chǎn)品。

虛擬私人助理帶來了人機交互方式的轉(zhuǎn)變，人機交互方式從GUI轉(zhuǎn)入了以自然交互為主的NUI。

計算機人機交互方式的演進：

簡單的CLI
Command-line interface：
命令行界面
用戶與計算機的互動主要以簡單連續(xù)的指令為主
復雜的GUI
Graphical User Interface：
圖形用戶界面
用戶與計算機的互動還增加了瀏覽、視頻、語音、游戲等方式
自然交互為主的NUI
Natural User Interface：
自然用戶界面
與計算機的交互發(fā)展到觸摸屏、語音交互、與穿戴式設備的交互、AR和VR的交互

這個時代的設計師，習慣于GUI的交互方式，面對的交互方式從復雜的GUI界面，到接近自然的NUI的轉(zhuǎn)變，難免會迷失方向，如果不跟上時代的步伐，很快設計師就要被淘汰啦～所以我們必須了解交互方式的變化，及其特點，才能更好的基于人工智能做我們的設計。

我梳理了對話式交互的一些要點，以供參考。

一、對話式交互的2個主要應用方向：

可以是基于文本的，或者是基于語音的。

基于語音的需要語音識別技術(shù)的支持，理想的情況是不存在具體的交互界面，僅靠聲音對話就可以達到交互的目的，受限于目前技術(shù)，語音式的交互大多用于兒童玩具或者個人助理相關(guān)的場景。

典型應用是語音助手。

基于文本，比語音稍簡單點，因為在交互中，我們需要借助于具體的圖形界面，這樣的話，可以用具體的功能按鈕輔助，規(guī)避技術(shù)難題，可以做到在自由聊天與具體場景業(yè)務間的無縫過渡。

典型應用是聊天機器人。

二、對話式交互的特點：

信息需要根據(jù)上下文語境來呈現(xiàn)，每一次對話將決定下一次對話的信息；

產(chǎn)品的信息架構(gòu)以決策樹為主；

設計師思考角度的轉(zhuǎn)變；

設計師需要從界面的流程設計轉(zhuǎn)向基于決策樹的策略設計，建立滿足用戶需求的完整決策樹和尋找最優(yōu)路徑，更多地思考上下文前后信息的展現(xiàn)邏輯。

三、對話式技術(shù)解決方案：

3.1 人工對話

主要代表為美國創(chuàng)業(yè)公司設計的個人助理應用Magic。當用戶提出要求如“幫我買一張機票”時，后臺通過人工運營為用戶提供解決方案，其實就是有個貼身客服為你解決問題。

優(yōu)點：本質(zhì)上是人與人之間的溝通，能避免很多問題；

缺點：當用戶量漲起來后，后臺的人工運營壓力較大。

目前Magic通過一半人工一半機器回答的形式轉(zhuǎn)型，減少后臺的壓力。

3.2 預埋對話

主要代表為蘋果Siri，微軟的Cortana，及百度的度秘。目前大部分對話式產(chǎn)品都采用該方案，通過識別語句中的關(guān)鍵詞給出預埋的解答。

優(yōu)點：降低答案的失誤和減少重復的工作；

缺點：是當設計師沒有意識到問題的其他最優(yōu)解決辦法或存在的bug，整個系統(tǒng)可能給不出最佳答案甚至無解；以及整個對話下來其實就是人與機器的獨白，沒有任何交流。

3.3 人工智能對話

主要代表還是蘋果的Siri、Google的Google Now、微軟的Cortana、Amazon的Echo以及百度的度秘。該方案主要通過處理大數(shù)據(jù)和機器學習的形式進行自我迭代優(yōu)化現(xiàn)有決策樹。

優(yōu)點：實現(xiàn)更完整的決策樹和產(chǎn)生更多最優(yōu)的解決方案，它能理解更多指令和記錄用戶的習慣；

缺點：但如何理解上下文，理解用戶情感仍是最重要的難題。

我覺得，

目前比較可靠的技術(shù)解決方案是：

三種方法融合，

然后交給設計師好好設計：

上下文前后信息的展現(xiàn)邏輯。

下面我們具體看看2大應用方向的案例及技術(shù)路徑。

四、語音助手

案例：

蘋果的siri，亞馬遜的Alexa，微軟的Cortana，Google Assistant語音助手，三星Bixby語音助手等。

功能：

控制智能家居，或者是個人智能助理。

語音識別是面臨的第一個技術(shù)環(huán)節(jié)，作為設計師我們可以了解下相關(guān)的語音識別開放平臺，畢竟不是每家公司都有實力從0到1搭建一個好用的語音識別系統(tǒng)的。

訊飛http://www.xfyun.cn/

百度語音http://yuyin.baidu.com/asr

我調(diào)查下來，如果是一般的應用，用百度的比較簡單，專業(yè)級應用還是用訊飛吧。

語音識別在設計的應用場景：

a、photoshop、cad、sketch啥的都可以通過語音來控制來，解放設計師的雙手。這個基于語音聽寫，把語音轉(zhuǎn)化為文字，再轉(zhuǎn)化為具體的計算機指令，可以達到。

b、方案匯報不用自己講了，讓機器人幫你講解，不過目前來看，設計師得提供文字版的演說稿，基于訊飛的語音合成，挑選一個喜歡的方言、音調(diào)來講解。

五、聊天機器人

案例：

社交娛樂元素，小黃雞、微軟小冰等聊天機器人加入社交平臺，滿足了年輕用戶的追求新鮮的口味；

購物，推銷商品或服務，比如谷歌語音助手向用戶玩起了推銷，告知《美女與野獸》將于今日上映的廣告；

美國好萊塢名媛、真人秀明星金·卡戴珊就推出了同名聊天機器人；

企業(yè)官方客服，淘寶客服就是典型的應用；

新聞資訊,比如國外很火的對話式app：quartz；國內(nèi)類似的微信訂閱號：狗帶君；

個人日程管理、訂票、查詢天氣，微信服務號：助理來也。

目前對話大多以簡單命令和問題為主，如

“今天天氣怎樣？”

“清明節(jié)是什么時候”

“最近最便宜的餐廳在哪？”

“現(xiàn)任美國總統(tǒng)是誰”

“杭州在哪？”。

上圖為我最近在開發(fā)的app截圖

聊天機器人通過“天氣，餐館，最近，最便宜”等關(guān)鍵詞明確命令后，在數(shù)據(jù)庫和互聯(lián)網(wǎng)上進行搜索，將最優(yōu)答案反饋給用戶。

聊天機器人能簡單處理的問題：

是什么

什么時候

哪一個

是誰

什么地點

面對為什么，及如果（過程）的問題用戶體驗較差，聊天機器人很難處理。

目前大部分聊天機器人，可以做到簡單問題的回答、查詢天氣、查看新聞、查詢航班、給用戶講笑話、推薦菜譜、查找圖片等通用型問題。

比如下圖是微軟小冰等能力圖譜：

國內(nèi)開放平臺推薦

圖靈機器人http://www.tuling123.com/

用下來感覺效果還行。

tensorflow也是有相關(guān)的開源項目的，比如：

Deep Q&A

https://github.com/Conchylicultor/DeepQA

動手能力強的話，可以下載下來玩一把～

嗯，虛擬私人助理這篇就寫這么多內(nèi)容，拋磚引玉，讀者們可以思考下語音助手、聊天機器人、對話式的交互方式，是否還有其他有趣的玩法，或應用了。

人工智能相關(guān)文章：

寫給設計師的人工智能指南：圖像

Javascript也可以玩機器學習

《機器學習》入門的26個概念。筆記1

本站僅提供存儲服務，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

Deep Q&A