演講丨杜百川 來(lái)源丨眾視DVBCN
6月14日,第23屆上海電視節(jié)2017白玉蘭國(guó)際廣播影視技術(shù)論壇(IBTC2017)在上海卓美亞喜瑪拉雅酒店盛大開幕,會(huì)上,國(guó)家新聞出版廣電總局科技委副主任杜百川發(fā)表了題為《面向廣電智能化的廣電之路》的主題演講。
一、人工智能的定義與現(xiàn)狀
目前,針對(duì)人工智能的定義,一部分人將AI寬泛地定義為一個(gè)計(jì)算機(jī)系統(tǒng)表現(xiàn)出通常被認(rèn)為是需要智能的行為。另一部分人AI定義為一個(gè)不管是遭遇怎樣的實(shí)際環(huán)境,都能夠理性解決復(fù)雜問(wèn)題或采取相應(yīng)行動(dòng)以達(dá)到其目的系統(tǒng)。
而流行的Stuart Russell / Peter Norvig所著“ AI ” 提出了 AI 問(wèn)題和解的分類:
1.像人一樣思考的系統(tǒng)(如認(rèn)知架構(gòu)和神經(jīng)網(wǎng)絡(luò));
2.像人一樣行動(dòng)的系統(tǒng)(如用自然語(yǔ)言處理通過(guò)圖靈測(cè)試; 知識(shí)表達(dá), 自動(dòng)推理, 和學(xué)習(xí));
3.像人一樣理性思考的系統(tǒng)(如邏輯解算, 推理, 和最佳化);
4.理智行事的系統(tǒng)(如智能軟件代理和體現(xiàn)的機(jī)器人通過(guò)感知, 規(guī)劃, 推理, 學(xué)習(xí), 通信, 決策, 和行動(dòng)來(lái)達(dá)到目的)。
盡管 AI 的邊界不確定并隨時(shí)間而改變,但多年來(lái)AI研究和應(yīng)用的核心目標(biāo)還是自動(dòng)化和復(fù)制智能行為。
杜百川提出,在窄義上,AI已經(jīng)取得明顯進(jìn)步,主要的應(yīng)用領(lǐng)域包括,對(duì)弈策略游戲,語(yǔ)言翻譯,自駕駛汽車和圖像識(shí)別。它支撐了許多商務(wù),如旅行策劃,顧客推薦系統(tǒng)和廣告定位等,并且在醫(yī)療診斷,教育和科學(xué)研究方面有重要應(yīng)用,擁有明顯的社會(huì)和經(jīng)濟(jì)效益。
通用AI(General AI,有時(shí)也稱為人工通用智能AGI Artificial General Intelligence) 指一種想象的人工智能系統(tǒng),面對(duì)所有認(rèn)知任務(wù)時(shí)表現(xiàn)得至少優(yōu)于與人。目前在NAI到更難實(shí)現(xiàn)的GAI 之間還有很大距離,想把NAI擴(kuò)展到GAI,每前進(jìn)一小步就要幾十年的研究。NSTC技術(shù)委員會(huì)非常同意民間機(jī)構(gòu)專家團(tuán)體的意見(jiàn),GAI至少在幾十年內(nèi)還做不到。
人們長(zhǎng)期以來(lái)猜測(cè)計(jì)算機(jī)會(huì)比人更智能,有人預(yù)測(cè)一種足夠智能的AI可以完成更好更智能的系統(tǒng),反過(guò)來(lái)產(chǎn)生更強(qiáng)的智能,不斷循環(huán)將產(chǎn)生“智能爆炸”或“奇點(diǎn)(singularity)”,快速超越人類智能。這種人工超級(jí)智能(ASI:Artificial Super-Intelligent)機(jī)器將超出人類的理解和控制,如果計(jì)算機(jī)實(shí)現(xiàn)控制人類許多關(guān)鍵系統(tǒng)將是浩劫。但NSTC技術(shù)委員會(huì)評(píng)估,對(duì)超級(jí)智能的擔(dān)心對(duì)目前AI政策影響有限。
二、人工智能系統(tǒng)的主要功能
杜百川表示,人工智能系統(tǒng)有六大主要功能。一是從經(jīng)驗(yàn)學(xué)習(xí);二是使用學(xué)習(xí)去推理;三是圖像識(shí)別;四是解決復(fù)雜問(wèn)題;五是理解語(yǔ)言細(xì)微差別;六是產(chǎn)生觀點(diǎn)。
杜百川將AI分為3種。一是輔助智能。人和機(jī)器互相學(xué)習(xí)并重新定義相互間的寬容度和深度。在此框架下,人和機(jī)器共享決定權(quán)。二是增強(qiáng)智能。增強(qiáng)人的能力把某些事做得更好更快。仍然是人做一些關(guān)鍵決定,AI代表他們執(zhí)行任務(wù),決定權(quán)完全在人。三是自主智能。自適應(yīng)/連續(xù)系統(tǒng),在某些情況下接管決定權(quán),但如此做只是在決策人開始信任機(jī)器后或成為快速處理的責(zé)任。這種智能類型決定權(quán)在機(jī)器因此和輔助智能有根本的不同。
杜百川提出,AI泛指機(jī)器表現(xiàn)出的智能,操作層面講指計(jì)算機(jī)科學(xué)R&D實(shí)踐中包括的一種或多種分支學(xué)科領(lǐng)域: 計(jì)算機(jī)視覺(jué),自然語(yǔ)言處理 (NLP),機(jī)器人技術(shù) (包括人-機(jī)器人交互),搜索和規(guī)劃,多智能體系統(tǒng),社交媒體分析(包括眾籌)和知識(shí)表達(dá)和推理(KRR),機(jī)器學(xué)習(xí)(ML)是所有AI的基礎(chǔ)。通用AI是一個(gè)機(jī)器所具有的智能能夠成功完成人所能完成的智能任務(wù)。
也有分為弱智能、智能和意識(shí)智能,但對(duì)機(jī)器是否有自主意識(shí)爭(zhēng)議很大。他表示,AI的工作將從低價(jià)值向高價(jià)值轉(zhuǎn)移。
深藍(lán)(Deep Blue)是由IBM專門用以分析國(guó)際象棋的超級(jí)電腦。1997年5月曾擊敗國(guó)際象棋世界冠軍卡斯巴羅夫。2016年3月AlphaGo 4:1戰(zhàn)勝了李世石。2015年10月測(cè)試中,AlphaGo多次使用不同數(shù)目的CPU和GPU,以單機(jī)或分布式模式運(yùn)行。每一步兩秒思考時(shí)間。最終Elo等級(jí)分如下表。5月23至27日烏鎮(zhèn)圍棋峰會(huì)以3:0戰(zhàn)勝柯潔,被中國(guó)圍棋協(xié)會(huì)授予職業(yè)圍棋九段稱號(hào)。因此,杜百川表示,人工智能機(jī)器已經(jīng)攻陷了棋類。
2015年Yahoo!與美聯(lián)社都開始引入機(jī)器人來(lái)撰寫部分財(cái)經(jīng)報(bào)道和體育新聞,采用Automated Insights研發(fā)的軟件WordSmith,由機(jī)器人撰寫的文章可以套用即時(shí)數(shù)據(jù),一分鐘可以寫出2000篇的報(bào)道。2015年5月23日NPR網(wǎng)站派出資深駐白宮記者Scott Horsley挑戰(zhàn)WordSmith,雙方都一起等待Denny‘s餐飲公司最新財(cái)報(bào),財(cái)報(bào)送達(dá)時(shí)開始計(jì)時(shí)。比賽的結(jié)果,速度:WordSmith兩分鐘,Scott Horsley七分鐘;質(zhì)量:網(wǎng)友投票Scott Horsley 9000多票,WordSmith 900票。因此,AI對(duì)于廣播電視具有重大作用。
三、AI的實(shí)際應(yīng)用
1.AI在內(nèi)容生產(chǎn)的應(yīng)用-新聞機(jī)器人
新聞機(jī)器人分為三大類:
一是語(yǔ)言新聞機(jī)器人。已有對(duì)話式語(yǔ)音啟動(dòng)平臺(tái)如亞馬遜Alexa和谷歌助理,發(fā)布商及第三方已經(jīng)為Alexa開了發(fā)近5000個(gè) ‘動(dòng)作’, Google的語(yǔ)音平臺(tái)也奮起直追。
二是事實(shí)核查機(jī)器人。英國(guó)為基地的的Full Fact已經(jīng)尋求開發(fā)一種業(yè)務(wù)能夠?qū)?shí)時(shí)發(fā)布會(huì)進(jìn)行核查, 法文報(bào)紙Le Monde也已經(jīng)有一個(gè)搜索引擎,讀者可以核查政治家的言論。這個(gè)月微信小程序上線!
三是對(duì)話式商務(wù): 許多商務(wù)越來(lái)越發(fā)生在其他業(yè)務(wù)中或通過(guò)鎖屏通知。今年大多數(shù)消息平臺(tái)都會(huì)加上一鍵購(gòu)買選項(xiàng),將講故事,產(chǎn)品發(fā)現(xiàn),直接購(gòu)買和用戶服務(wù)混合是聊天機(jī)器人進(jìn)一步發(fā)展方向。
去年上線百度機(jī)器人Writing-bots可涵蓋社會(huì)、財(cái)經(jīng)、娛樂(lè)等15大類全機(jī)器寫作。
2.機(jī)器主持人和機(jī)器人選手
今年芒果娛樂(lè)與微軟決定在湖南衛(wèi)視的新綜藝欄目《超次元偶像》引入微軟機(jī)器人“小冰”作為何炅搭檔主持。她在現(xiàn)場(chǎng)演示的主持人技巧包括測(cè)試明星顏值、演唱歌曲《好想你》、運(yùn)營(yíng)大數(shù)據(jù)生成最帥人像、調(diào)侃何炅的“高大身材”等。
百度機(jī)器人“小度”在最強(qiáng)大腦展示的功能包括人臉和聲紋識(shí),包括跨年齡、跨代和遮擋人臉識(shí)別等。
搜狗機(jī)器人汪仔的主要功能是問(wèn)答,通過(guò)語(yǔ)音技術(shù)識(shí)別和理解提問(wèn),再通過(guò)智能的分析判斷,從搜狗搜索檢索到的信息中提煉出答案。
3.廣播業(yè)者內(nèi)容的“文藝復(fù)興”——生產(chǎn)和分發(fā)智能化
廣播業(yè)者中有一些原來(lái)就是制作內(nèi)容的,但有一些是目前剛剛開發(fā)內(nèi)容策略的。許多有線網(wǎng)絡(luò)已經(jīng)將其業(yè)務(wù)轉(zhuǎn)換到內(nèi)容生產(chǎn)和許可為重點(diǎn)。如OTT平臺(tái),不能保證能吸引足夠的觀眾來(lái)付清技術(shù)上的預(yù)付投入,但轉(zhuǎn)向內(nèi)容生產(chǎn),投入到跨不同標(biāo)準(zhǔn)內(nèi)容和面對(duì)不同平臺(tái)。
杜百川提出,內(nèi)容創(chuàng)作決策更加智能化。內(nèi)容復(fù)興成功的關(guān)鍵在生產(chǎn)對(duì)路的內(nèi)容產(chǎn)品,智能決策起到了關(guān)鍵作用。根據(jù)大數(shù)據(jù)統(tǒng)計(jì)選擇內(nèi)容和演員已經(jīng)是內(nèi)容創(chuàng)作必備武器。
4.用戶畫像精準(zhǔn)投放
利用大數(shù)據(jù)制作用戶畫像,即用戶標(biāo)簽,通常是特征標(biāo)識(shí),如年齡段標(biāo)簽。根據(jù)用戶喜好和內(nèi)容分類庫(kù)做匹配,做到精準(zhǔn)推薦和投放。如上海IPTV“千人千面”大數(shù)據(jù)智慧運(yùn)營(yíng)平臺(tái)是包括大數(shù)據(jù)標(biāo)簽庫(kù)、精準(zhǔn)投放平臺(tái)、EPG推薦、IPTV智慧運(yùn)營(yíng)平臺(tái)四為一體的大數(shù)據(jù)智慧運(yùn)營(yíng)系統(tǒng)。
四、AI的市場(chǎng)分析
杜百川提出了AI的關(guān)鍵市場(chǎng)趨勢(shì)。一是超越移動(dòng)性觸摸是起步;二是云原生態(tài)內(nèi)容和數(shù)據(jù)是核心;三是遍布智能用智能武裝;四是開放生態(tài)系統(tǒng)從解決方案到平臺(tái)。
未來(lái)智能無(wú)線融合網(wǎng)絡(luò)可以從三個(gè)層面理解:
第一,底層是可重組的物理資源層,可根據(jù)上層的需要任意分割組合成所需碼率、保護(hù)率、延時(shí)等參數(shù)的資源分配。
第二,中層是可重構(gòu)的虛擬網(wǎng)絡(luò)層,根據(jù)上層業(yè)務(wù)需要構(gòu)建所需網(wǎng)絡(luò),包括低功率、小碼率、延時(shí)不敏感的物聯(lián)網(wǎng)(IoT),大碼率、低延時(shí),不對(duì)稱的視頻網(wǎng)(NGB-W),相對(duì)低碼率、低延時(shí)對(duì)稱通信網(wǎng)(5G/車聯(lián)網(wǎng)),相對(duì)低碼率、級(jí)低延時(shí)車聯(lián)網(wǎng)和純數(shù)據(jù)網(wǎng)(Wi-Fi)。
第三,頂層為具有AI的認(rèn)知控制層,對(duì)下面各層感知,收集數(shù)據(jù),計(jì)算和自組織;通過(guò)人工智能與環(huán)境和用戶交互并主動(dòng)學(xué)習(xí),形成最適合各行各業(yè)環(huán)境和用戶的使用方式。
未來(lái)網(wǎng)絡(luò)不應(yīng)當(dāng)是下一代通信網(wǎng)或下一代廣播網(wǎng),而應(yīng)當(dāng)是泛在、感知、自治、多業(yè)務(wù)、云加邊緣計(jì)算的智能無(wú)線融合網(wǎng)。
五、AI是新的UI
杜百川認(rèn)為,AI是新的UI。他從3個(gè)方面進(jìn)行了闡釋:
一是AI的語(yǔ)音助理迅速崛起。目前訊飛開放了平臺(tái)AIUI,AIUI在語(yǔ)音聽(tīng)寫、實(shí)時(shí)互譯、智能家居的人機(jī)交互、車載語(yǔ)音交互系統(tǒng)、服務(wù)機(jī)器人、個(gè)性化教育、語(yǔ)音模仿等方面得到廣泛應(yīng)用。
二是語(yǔ)音模仿。蒙特利爾初創(chuàng)公司 Lyrebird(琴鳥,一種擅長(zhǎng)模仿周圍聲音的鳥)開發(fā)了一種語(yǔ)音合成技術(shù),用很少的數(shù)據(jù),訓(xùn)練一分鐘,就能復(fù)制任何人的聲音。
三是自動(dòng)人臉打碼。微軟2月發(fā)布人臉自動(dòng)打碼技術(shù),用戶只需在后臺(tái)用鼠標(biāo)選擇想要打碼的人物,相應(yīng)人物在視頻中的所有露臉區(qū)域都將被打上馬賽克。
六、如何應(yīng)對(duì)AI武裝的黑客?
杜百川介紹了AI和機(jī)器自動(dòng)黑客攻擊上升的趨勢(shì)。
設(shè)計(jì)可快速尋找漏洞和潛在網(wǎng)絡(luò)缺口的自動(dòng)化和自發(fā)的黑客攻擊機(jī)已經(jīng)出現(xiàn),AI網(wǎng)絡(luò)保護(hù)機(jī)能夠?qū)艉途W(wǎng)絡(luò)缺口進(jìn)行尋找、發(fā)現(xiàn)、破譯和補(bǔ)救,將大幅度超越人工安全操作(SecOps)團(tuán)隊(duì)的能力。
AI專用芯片引發(fā)新一輪競(jìng)爭(zhēng),包括谷歌的TPU,IBM的TrueNorth,中國(guó)的寒武紀(jì)采用自主的深度學(xué)習(xí)處理器指令集,F(xiàn)PGA 有好的性價(jià)比,而GPU 用戶覆蓋率最廣。
杜百川最后表示,如果不具備AI能力,那么廣播電視無(wú)論在技術(shù)上、內(nèi)容上、還是在商務(wù)上、安全上將不堪一擊!
聯(lián)系客服