開篇
即將過去的2016,可能是過去幾十年里邊,人工智能這個(gè)詞炒的最熱的一年。最近幾年在技術(shù)上的各種進(jìn)展,都沒有一場圍棋比賽讓普通人對人工智能的影響如此的深刻。
下圖為deep learning這個(gè)關(guān)鍵詞在Google中的搜索熱度趨勢,一年多時(shí)間的增長趨勢一定程度反映了公眾的關(guān)注度。
在技術(shù)圈之外,全球的的各種機(jī)構(gòu)紛紛開始關(guān)注技術(shù)本身的發(fā)展,技術(shù)對商業(yè)和社會(huì)領(lǐng)域產(chǎn)生的影響。例如白宮在今年6月發(fā)出了一個(gè)針對人工智能的“征求意見稿”,并且在匯集了大量反饋之后在10月發(fā)表了一份白皮書:Preparing for the Future of Artificial Intelligence 。
高盛(Goldman Sachs),作為金融行業(yè)的巨無霸,也在11月發(fā)表了題為“AI, Machine Learning and Data Fuel the Future of Productivity”的一期行業(yè)研究報(bào)告,這份報(bào)告近期開始在朋友圈里流傳。
我其實(shí)一直希望把我所理解的人工智能給大家介紹,但是一來文筆生疏,二來擔(dān)心功力視野不夠,這么一個(gè)龐大的話題怕是把握不住。
這次讀到高盛的報(bào)告,覺得是一個(gè)好的契機(jī),在督促自己閱讀和思考的同時(shí),把這些年的經(jīng)驗(yàn)和體會(huì)一并記錄下來,供大家參考。而且更加促使我做這件事情的原因是,我發(fā)現(xiàn)不少公眾號搶先翻譯了這份報(bào)告的目錄和小部分章節(jié)并發(fā)表出來,然后斷章取義的拋出了一些抓眼球的觀點(diǎn)。一份長達(dá)99頁的報(bào)告,其中的信息量是遠(yuǎn)遠(yuǎn)大于那些一分鐘快餐式的公眾號文章的。我們應(yīng)該以一種更嚴(yán)肅和認(rèn)真的態(tài)度,來理解和認(rèn)識(shí)這場正在進(jìn)行中的技術(shù)浪潮。
今天這一篇,作為開篇,我想先講一講這份報(bào)告的封面:
“科學(xué)技術(shù)是第一生產(chǎn)力”
我在朋友圈分享過這個(gè)封面,其中的摘要文字,是經(jīng)典、精煉和異常準(zhǔn)確的。核心就三句話:
1) 'we examine how advances in machine learning and deep learning have combined with more powerful computing and an ever-expanding pool of data to bring AI within reach for companies across industries.'
這里邊點(diǎn)出了讓AI變得不那么遙不可及的幾個(gè)要素,1)算法:machine learning & deep learning;2)計(jì)算能力;3)龐大且同時(shí)在增長的數(shù)據(jù)。
我曾經(jīng)也在不同場合特別強(qiáng)調(diào)了促進(jìn)AI進(jìn)步的就是這三大要素。而且我個(gè)人看法,一個(gè)AI的從業(yè)人員,必須要同時(shí)具備這三方面的能力,一個(gè)AI公司也是有同樣的標(biāo)準(zhǔn)。所以對于隨便一家什么公司都聲稱自己是AI公司,我始終持保留意見。大部分這樣的公司,僅僅是觸及了其中一個(gè)方面,頂多應(yīng)該自稱“AI相關(guān)公司”。
從投資者的視角來看,哪怕投資“AI相關(guān)公司”,其實(shí)是一個(gè)不錯(cuò)的選擇,但是要非常清楚的認(rèn)識(shí)到它在領(lǐng)域內(nèi)的定位和長短。比如過去幾年內(nèi)股價(jià)成倍增長的NVIDIA,是提供計(jì)算能力的公司。在算法上,他可以通過智力儲(chǔ)備來提升,但是不會(huì)成為突出的競爭力,數(shù)據(jù)方面亦然。
2) '...AI-as-a-service has the potential to open new markets and disrupt the playing field in cloud computing...'
最近我跟人開玩笑說,云計(jì)算喊了很多年,結(jié)果大數(shù)據(jù)火了;大數(shù)據(jù)喊了這幾年,結(jié)果AI火了。從需求總量上講:云計(jì)算>大數(shù)據(jù)>AI。從關(guān)鍵核心業(yè)務(wù)帶來價(jià)值的可能貢獻(xiàn)上講:AI>大數(shù)據(jù)>云計(jì)算。從解決問題的難度上講也是后后面這個(gè)順序。
云計(jì)算這個(gè)基礎(chǔ)架構(gòu)的用法在不斷的發(fā)生變化,例如AWS推出的大量GPU服務(wù)器,以及集成深度學(xué)習(xí)框架MxNet的流程,例如微軟開放的Machine Learning Studio,例如阿里在人工智能上的大力投入,哦,對了,Salesforce今年收購了一家提供在線機(jī)器學(xué)習(xí)API的公司。這些,都反映了巨頭們對未來用戶需求的預(yù)判。
3) '...ability to leverage AI will become a defining attribute of competitive advantage for companies in coming years and will usher in a resurgence in productivity'
剛才提到的客戶需求,其本質(zhì)是AI可能對用戶核心業(yè)務(wù)產(chǎn)生的貢獻(xiàn),我這句話講的很空。但是高盛用一個(gè)詞形象的表達(dá)了這一點(diǎn),這也是出現(xiàn)在標(biāo)題中的詞:productivity。
AI技術(shù)并不是魔術(shù),它只是一個(gè)工具或者一種技術(shù)手段,它可能幫助提升生產(chǎn)力/生產(chǎn)效率。在這個(gè)數(shù)字化和數(shù)據(jù)化的時(shí)代,各行各業(yè)的生產(chǎn)力都有可能被AI技術(shù)所提升。是否具備這樣的工具,可能類似于一列火車是燒煤還是用電,一名會(huì)計(jì)用算盤還是用計(jì)算器... 因此不論哪個(gè)行業(yè)都如此關(guān)心AI技術(shù)也就不難理解了。
究竟什么是人工智能
進(jìn)入高盛這份研報(bào)的正題之前,我們先看一條很有意思的twitter:
這條twitter非常到位的反應(yīng)了企業(yè)級用戶對于人工智能技術(shù)的期望、實(shí)際的應(yīng)用問題、技術(shù)能力三者之間的矛盾。甚至有多篇文章引用了這個(gè)說法,來印證人工智能的泡沫。
人工智能到底對企業(yè)有哪些作用,到底有沒有泡沫,并不是一個(gè)很容易回答的問題,我們需要先從人工智能是什么開始說起,高盛的報(bào)告中有兩處解釋:
1) AI is the science and engineering of making intelligent machines and computer programs capable of learning and problem solving in ways that normally require human intelligence.
2) Artificial intelligence describes a science of simulating intelligent behavior in computers. It entails enabling computers to exhibit human-like behavioral traits including knowledge, reasoning, common sense,learning, and decision making
我個(gè)人更喜歡第二種說法:人工智能是一種用計(jì)算機(jī)來模擬/模仿智能行為的技術(shù)。
參考Wikipedia的解釋,人工智能涵蓋的內(nèi)容非常的廣泛,包括邏輯推理、問題分析解答、知識(shí)和常識(shí)的構(gòu)建、語言能力、規(guī)劃控制、學(xué)習(xí)能力、感知社交、運(yùn)動(dòng)、創(chuàng)造力、認(rèn)知和情緒等等。
普通大眾心目中的人工智能是“強(qiáng)人工智能”,也就是近乎復(fù)現(xiàn)人的智慧,而事實(shí)上技術(shù)能夠達(dá)到的,暫時(shí)還是其中一小部分。
我特別喜歡用機(jī)器智能這個(gè)詞,來形容目前人工智能的水平。
插播一段回憶:N年前某研究院的實(shí)習(xí)生筆試題目,某師兄出題問對人工智能的看法,我當(dāng)時(shí)寫了,不用非要去逼近人的智能,要讓機(jī)器做機(jī)器擅長的事情...
我最近幾個(gè)月反復(fù)對外講的一頁P(yáng)PT忠實(shí)的繼承了當(dāng)年的思路:
機(jī)器最擅長的事情是什么呢?一是存儲(chǔ),二是計(jì)算。所以但凡要死記硬背的東西,機(jī)器可以比人強(qiáng)。
死記硬背不是不好,人的學(xué)習(xí)也是從死記硬背開始的,以我養(yǎng)了兩個(gè)孩子的經(jīng)驗(yàn),非常確信這件事情。可是光拼記憶力是不行的,成績好的小孩,除了必須要記性好,還要“聰明”。
從下面這幅圖,你看到的是什么,是一堆毫無關(guān)系的點(diǎn),還是一條直線?這里的點(diǎn),就是數(shù)據(jù),而直線,則是模型。一個(gè)模型可以簡化數(shù)據(jù)的存儲(chǔ)和計(jì)算。
給定數(shù)據(jù),推算出模型,并且把模型應(yīng)用到實(shí)際的問題中,bingo,線性回歸就是一個(gè)最簡單的“人工智能”應(yīng)用了(回應(yīng)篇頭的那條twitter)。
數(shù)據(jù)是客觀問題的量化表示,很明顯,上圖中這么簡單清晰的數(shù)據(jù)排列,是極少出現(xiàn)的,通常遇到的問題是這樣:
或者這樣:
遇到這些復(fù)雜情況的時(shí)候,就需要用到更為復(fù)雜的模型來刻畫數(shù)據(jù)、刻畫問題,而這已經(jīng)是機(jī)器學(xué)習(xí)技術(shù)的雛形了。
Machine learning is a branch of artificial intelligence and entails enabling computers to learn from data without
being explicitly programmed.
Deep learning is a type of machine learning which entails
training a hierarchy of “deep layers” of large neural
networks, with each layer solving different aspects of a
problem, allowing the system to solve more complex
problems.
之所以我極力推薦高盛這篇報(bào)道作為科普材料,是因?yàn)樗押芏喔拍罱忉尩暮芮宄幌袢缃裣喈?dāng)多的人把稍微相關(guān)的技術(shù)都忽悠成人工智能。比較準(zhǔn)確的說,機(jī)器學(xué)習(xí)是人工智能的一個(gè)子領(lǐng)域,而深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種實(shí)現(xiàn)方式。
看到這里,你會(huì)不會(huì)有一點(diǎn)失望,技術(shù)上可實(shí)現(xiàn)的人工智能并不如想象那般激動(dòng)人心?事實(shí)上,恰恰因?yàn)樽罱畮啄觊g工業(yè)界和學(xué)術(shù)界把更多的精力集中在數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域,做了大量務(wù)實(shí)甚至工程化的工作,才帶來了多個(gè)領(lǐng)域的應(yīng)用突破。而大家越來越相信,深度學(xué)習(xí)是讓機(jī)器最有可能接近甚至超過人的某些方面智能的路徑。
決勝人工智能的三大要素
人工智能的軍備競賽已經(jīng)如火如荼的展開了,各大巨頭到底在爭搶什么,先來者如何保持優(yōu)勢,后來者如何追趕?
高盛報(bào)告中強(qiáng)調(diào)了人工智能在近年得到飛速發(fā)展的幾個(gè)原因是:數(shù)據(jù)、計(jì)算力和算法。翻譯過來,如果要在人工智能領(lǐng)域獲取一席之地,需要具備如下的條件:
已經(jīng)擁有數(shù)據(jù)或者具備獲取數(shù)據(jù)的能力;
持有/使用計(jì)算資源;
善于設(shè)計(jì)和優(yōu)化算法的人才;
人才
21世紀(jì)最貴的是什么?是人才。
毫無疑問,人才的重要性是第一位的。
人工智能技術(shù)門檻不低,真正理解核掌握AI技術(shù)的人,無不是經(jīng)歷了長時(shí)間的學(xué)習(xí)和磨練。和計(jì)算機(jī)領(lǐng)域其他方向的博士專業(yè)類似,人才培養(yǎng)需要一個(gè)周期,并不是簡單的上兩門在線課程做一些習(xí)題就能出師。在突然變旺的需求下,人才變得異常緊缺。這個(gè)方向上無論是剛畢業(yè)的博士,或是有資歷的專家,獲得的薪酬都遠(yuǎn)遠(yuǎn)大于他們的同學(xué)或者同事。
最近聽到一些信息和八卦之后,我產(chǎn)生了這樣的自相矛盾的疑慮:
這些大公司給AI資深專家的薪酬水平與AI創(chuàng)業(yè)公司首輪融資額度相當(dāng)了,那么AI的泡沫到底是存在還是不存在呢?
關(guān)于人才荒,高盛的報(bào)告中這樣講道:
AI talent is in high enough demand that “acquihires” are still a common means to acquire necessary talent.
報(bào)告中整理了近年來的人工智能相關(guān)收購,其中不少的收購都是為了人才。
數(shù)據(jù)
數(shù)據(jù),在AI時(shí)代為什么這么重要,是因?yàn)榇罅康臄?shù)據(jù)才能防止過模型的過學(xué)習(xí)(此處術(shù)語比較專業(yè)),才能獲得好的效果。
Data is the key input for AI. Deep learning effectiveness in particular is linked to larger datasets, as larger data sets prevent models from becoming over-fitted.
其實(shí)數(shù)據(jù)一直都非常重要,但是過去能被研究者利用的數(shù)據(jù)實(shí)在太少了。
在近十年傳感器技術(shù)普及加上互聯(lián)網(wǎng)盛行的環(huán)境下,數(shù)據(jù)的產(chǎn)生和流通的速度都大大加快了。以人臉檢測為例:
Tomas Poggio在1995年發(fā)表的文章Finding Human Faces with a Gaussian Distribution based Face Model,用到了4150張人臉數(shù)據(jù),Paul Viola 在2001年的經(jīng)典論文Rapid Object Detection using a Boosted Cascade of Simple Features 也僅僅用到4916張人臉。
而Facebook在2014年發(fā)表的DeepFace用到了幾百萬量級的人臉做訓(xùn)練,Google在2015年發(fā)表的FaceNet,據(jù)稱用到了上億的人臉樣本。
充足的數(shù)據(jù)配合了大容量(capacity,之后找機(jī)會(huì)詳解)的模型的模型,在語音識(shí)別、圖像識(shí)別、文本理解、翻譯等各個(gè)領(lǐng)域都產(chǎn)生了突破性的進(jìn)展。
而近年來也涌現(xiàn)了各類專業(yè)的數(shù)據(jù)抓取公司,數(shù)據(jù)交易公司,這就是淘金潮里邊,賣水的一批人了。
關(guān)于數(shù)據(jù),還有一個(gè)有意思的話題,仿佛機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù),而人的學(xué)習(xí)似乎只用少量的數(shù)據(jù)?我會(huì)在晚些時(shí)候準(zhǔn)備一篇文章,探討這個(gè)問題。
計(jì)算資源
關(guān)于計(jì)算資源這個(gè)話題,貼一個(gè)NVIDIA的股價(jià)走勢圖吧。雖說最近有機(jī)構(gòu)分析認(rèn)為股價(jià)有20%的泡沫,但是相比漲幅而言,算不了什么。BTW,NV最新的顯卡TITAN X依舊在限購中。
所有提供云服務(wù)的公司,Google,Amazon,Microsoft,甚至阿里巴巴,在努力的通過提供軟件框架、產(chǎn)品來讓自己的計(jì)算資源變的AI friendly。
另外一些廠商,例如比特大陸、深鑒科技,以及地平線,在做深度學(xué)習(xí)相關(guān)的芯片。這些廠商的努力重點(diǎn)在于降低計(jì)算的成本。
無論是產(chǎn)生更高性價(jià)比的計(jì)算資源,還是更好的利用現(xiàn)有的資源,都是非常有價(jià)值的事情。
作者簡介:
陳嘉,現(xiàn)為聯(lián)想創(chuàng)投集團(tuán)香港大數(shù)據(jù)研發(fā)中心負(fù)責(zé)人。具有十多年機(jī)器學(xué)習(xí)、模式識(shí)別的研究和工程經(jīng)驗(yàn)。
本科畢業(yè)于清華大學(xué)自動(dòng)化系,在香港科技大學(xué)計(jì)算機(jī)系獲得博士學(xué)位。
曾聯(lián)合創(chuàng)立一家模式識(shí)別技術(shù)公司,后在百度移動(dòng)廣告部門擔(dān)任資深算法工程師,在華為諾亞方舟實(shí)驗(yàn)室擔(dān)任研究員。
發(fā)表多篇學(xué)術(shù)論文,持有多項(xiàng)美國專利。