精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
致開發者:2018年AI技術趨勢展望

來源|公眾號“AI 前線”,(ID:ai-front)

譯者|核子可樂

編輯|Emily


概要:在 2018 年,開發者如何將一系列 AI 技術成果應用于當前的工作當中呢?


近日,一篇預測 2018 年 AI 技術趨勢的文章,文中討論了如何將 2017 年業界已經醞釀出一些成熟產物在在 2018 年實現大規模應用。在 2018 年,開發者如何將一系列 AI 技術成果應用于當前的工作當中呢?

今天的文章包括一份目前已經在實踐中應用的 AI 算法與技術成果清單,如時序分析(深度學習正迅速取代信號處理領域中的一些傳統技術)等。一方面,這些成果可以說相當酷炫,但本文暫時不會對強化學習的實際應用進行展望,因為在我看來,實際上其還很難在某些工業應用環境中產生實際效果。當然,不能否認的是,強化學習確實是個前景廣闊,且正處于快速發展中的研究領域。這里我就不再繼續討論圖像識別與簡單的計算機視覺議題了,畢竟這幾年此類文章已經多如牛毛:)


 GAN 與偽造


盡管生成性對抗網絡已經擁有數年發展歷史,但我對其仍抱有懷疑態度。幾年過去,雖然如今的技術不再只能生成可憐的 64 x 64 圖像,但這仍不足以打消我的顧慮。在閱讀相關數學文章后,我對 GAN 并不能真正理解其分布狀況的懷疑進一步加深。不過這一切在今年有所改變——首先是 CycleGAN 等有趣的體系以及 Wasserstein GAN 等數學改進讓我得以在實踐當中加以嘗試。雖然其實際效果仍無法令人完全滿意,但現在我已經確定,其生成能力絕對不容質疑。


首先,我強烈推薦英偉達公司發表的關于生成逼真全高清圖像的研究論文(共結果要遠好于一年之前恐怕的 64 x 64 面部圖像):《AI 可以生成偽造的名人臉部圖像,效果好得讓人意外......》


https://www.theverge.com/2017/10/30/16569402/ai-generate-fake-faces-celebs-nvidia-gan


不過更讓我激動的(甚至喚起了我的‘少年夢想’),則是利用 AI 生成偽造的色情影片:


《AI 生成的色情片》


https://motherboard.vice.com/en_us/article/gydydm/gal-gadot-fake-ai-porn


另外,游戲行業也在大規模采用這些新型技術,例如利用 GAN 生成景觀、英雄甚至整個世界。在我看來,我們必須提高自己的分辨能力——從偽造的色情影片到欺詐性網絡人物。


全部神經網絡皆遵循同一獨特格式


現代開發領域(不僅僅是在人工智能行業)的一大難題在于,我們往往面對數十種作用基本相同的框架方案。目前,每家投身于機器學習領域的大型企業都擁有自己的框架:谷歌、Facebook、Amazon、微軟、英特爾、甚至包括索尼與優步都是如此,這還不算其它眾多開源解決方案。在單一人工智能應用程序當中,我們往往需要使用多種不同框架——例如利用 Caffe2 實現計算機視覺,PyTorch 實現自然語言處理,TensorFlow/Keras 則專攻推薦系統。將這一切加以合并需要耗費大量時間,意味著數據科學家與軟件開發人員需要費心費力,而無法專注于處理真正重要的任務。理想的解決方案應當是一種獨特的神經網絡格式,且可輕松與各類框架進行對接,包括允許開發人員輕松部署、確保科學家能夠輕松使用。在這方面,ONNX 應運而生:


《ONNX:開源神經網絡改變了格式》


http://onnx.ai/getting-started


可互換 AI 模型的新開源生態


事實上,ONNX 只是非循環計算圖的一種簡單格式,但卻在實踐層面為我們帶來真正部署復雜 AI 解決方案的機會。我個人非常看好該項目——人們能夠在 PyTorch 等框架當中開發神經網絡并部署工具,而不再需要從頭到尾始終被局限在 TensorFlow 生態系統之內。


 Zoo 快速普及


三年之前,人工智能領域最令人興奮的成果當數 Caffe Zoo。當時我負責處理大量計算機視覺工作,因此需要嘗試所有模型,并觀察其工作原理以及實際效果。在此之后,我會利用這些模型進行遷移學習或者作為特征提取器。最近我開始使用兩種不同的開源模型,并將引入規模更大的計算機視覺處理管道。究其本質,這意味著我們已經不再需要自行訓練網絡。舉例來說,ImageNet 能夠很好地實現對象或者地點識別,因此我們可以直接將這些基礎性成果下載并接入到自己的系統當中。除了 Caffe Zoo 之外,其它框架也提供類似的 Zoo 方案。但真正讓我驚奇的是,現在大家甚至能夠將各類模型添加至計算機視覺、自然語言處理甚至是 iPhone 內的加速度計信號處理機制當中。


最全的核心機器學習模型列表(iOS 11 以上)


https://github.com/likedan/Awesome-CoreML-Models


在我看來,這類 Zoo 方案只會越來越多 ; 再加上 ONNX 這類生態系統的出現,這些方案將變得更加集中(并憑借機器學習區塊鏈類應用實現本體分散)。


 AutoML 替換管道


設計一套神經網絡架構無疑是一項痛苦的任務——有時候,大家可以通過疊加卷積層獲得相當出色的結果,但在大多數情況下,我們需要利用直覺與超參數搜索等方法認真設計寬度、深度與超參數——例如隨機搜索或貝葉斯優化。而且對于除計算機視覺以外的其它工作,我們不光需要對 ImageNet 上訓練完成的 DenseNet 進行微調,同時也要面對 3D 數據分類或者多變量時序應用等其它難題。


目前已經存在多種能夠利用其它神經網絡從零開始生成新的神經網絡架構的嘗試,但其中我最為看好的,當數谷歌研究團隊拿出的最新成果:


AutoML 用于大規模圖像分類與對象檢測


https://research.googleblog.com/2017/11/automl-for-large-scale-image.html


他們利用其生成計算機視覺模型,且不僅速度較人類科學家更快,效果也更好!我相信很快就會出現大量與之相關的論文與開源成果。在我看來,未來將有更多博文或初創企業不再強調“我們開發出一套 AI 方案……”,而是轉向“我們的 AI 方案能夠學習其它 AI 方案,并借此創造出新的 AI 方案”。至少我肯定會在自己的項目中加以嘗試,請告訴不只我一個人有這樣的沖動。


 智能堆棧規范化


關于這個概念,我的認知主要來自俄羅斯系統分析師、教練兼 AI 愛好者 Anatoly Levenchuk 的博客。通過以下圖片,大家可以看到所謂“AI 堆棧”的示例:



其中不僅包含機器學習算法與您最喜愛的框架,同時也存在著諸多更為深入的層級,且各個層級都擁有自己的發展與研究趨向。


我認為人工智能開發行業已經非常成熟,其中存在著大量多元化的專家。事實上,團隊中僅有一名數據科學家是遠遠不夠的——大家需要不同的人才來進行硬件優化、神經網絡研究、AI 編譯器開發、解決方案優化以及生產實現。而在他們之上,還應設置不同的團隊領導者、軟件架構師(分別為各個問題進行堆棧設計)以及管理員。之所以在這里提及這個概念,是希望各位 AI 技術專家能夠在職業規劃當中予以關注——例如對于希望成為人工智能軟件架構師或者技術領導者的朋友,您將能夠借此確定自己需要學習哪些知識。


 語音類應用


人工智能能夠以高于 95% 的精確度解決的問題其實非常有限:我們可以將圖像歸類為 100 種類別、可以判斷文本內容屬于正面還是負面,此外還有少數更為復雜的可行任務。展望新的一年,我認為最具突破的應用方向在于語音識別與生成。事實上,一年之前 DeepMind 發布的 WaveNet 已經擁有相當出色的表現,但現在感謝百度 DeepVoice 3 以及谷歌 Tacotron2 的助力,上述結論已經基本成為板上釘釘的事實:Tacotron 2: 立足文本生成逼真的人類語音


數十年以來,技術人員們一直在努力研究如何立足文本生成自然的人類語音(即文本到語音,簡稱 TTS 技術)……


https://research.googleblog.com/2017/12/tacotron-2-generating-human-like-speech.html


這項技術將很快擁有自己的開源版本(或者被其他一些技術天才所重現),意味著未來每個人都能夠以極高的精度實現語音識別與生成。那么接下來的前景如何?毫無疑問,除了更出色的個人虛擬助手、自動閱讀器以及對話轉錄工具之外,音頻偽造也將成為現實。


 機器人智能水平略有提高


我們目前所擁有的機器人存在著一大共通性問題——其中 99% 根本不屬于人工智能,而只是硬編碼型方案。考慮到這樣的情況,我們意識到已經不能簡單利用數百萬次對話訓練編碼器 - 解碼器 LSTM,并指望能夠借此建立起智能系統。正因為如此,Facebook Messenger 與 Telegram 中的大多數聊天機器人只能遵循硬編碼命令,或者最多只能算是具備 LSTM 與 word2vec 語句分類能力的神經網絡。現代先進自然語言處理技術的實際水平應該略高于此,Salesforce 公司做出的一些有趣實驗已經證明了這一點:


AI 研究 - Salesforce.com


他們正在著手構建自然語言處理與數據庫的接口,希望借此克服現代編碼器 - 解碼器自回歸模型——即不僅能夠對文字或句子進行嵌入,同時還可實現字符嵌入。此外,ROUGE 等自然語言評分優化機制等研究成果同樣值得關注。


我相信通過上述開發工作,未來我們的聊天機器人至少能夠獲得更強大的智能信息檢索與命名實體識別能力,并可能會在一部分封閉領域當中出現完全由深度學習技術驅動的機器人方案。


時序分析的當前發展水平


除了 Salesforce 之外,另一股遭受嚴重低估的機器學習研究力量當數優步 AI 實驗室。前一段時間,他們曾發表一篇博文,其中展示了其時序預測方法。老實講,這實在令我感到受寵若驚——因為其成果與我在應用當中使用的方法基本相同!下面來看這一將統計特征與深度學習表達加以結合的驚人示例:


優步公司利用遞歸神經網絡預測極端性工程事件在優步公司,事件預測能力允許我們根據預期中的用戶需求設計面向未來的服務方案。


https://eng.uber.com/neural-networks/


此外還出現了其它更激動人心的實例,包括利用 34 層 1 維 ResNet 診斷心律失常。最酷的是其擁有非常出色的成效——不僅遠超多種傳統統計模型,甚至在診斷率方面勝過了專業心臟病專家!算法診斷心律失常疾病,準確度超越心臟病專家|斯坦福新聞由斯坦福大學計算機科學家們發明的一種新算法能夠對心律數據進行篩選……


https://news.stanford.edu/2017/07/06/algorithm-diagnoses-heart-arrhythmiascardiologist-level-accuracy/


我最近一直投身于深度學習的時序分析工作當中,并可以向大家保證神經網絡在這方面確實表現良好。與傳統的“黃金標準”相比,其成效可達到原有水平的 5 到 10 倍。


 優化應當獲得更多關注


我們該如何對自己的神經網絡進行訓練?實事求是地講,大多數從業者只是在使用“Adam()”以及標準學習率。也有一些聰明的從業者會選擇最適合的優化器,同時調整并安排其學習速度。然而,大多數朋友對于優化這個主題仍然重視不足,因為我們習慣于直接按下“訓練”按鈕,并靜待自己的神經網絡收斂完成。但從計算能力、內存資源以及開源代碼解決方案等層面來看,我們實際上基本處于公平的競爭環境當中——最終的贏家屬于那些能夠立足同一 Amazon 實例在最短時間內獲得最佳 TensorFlow 模型成效的技術人員。從這個角度來看,決定一切的實際上正是優化。


2017 年深度學習優化大事記


目錄:深度學習的終極目標在于找出最低程度的概括方法……


http://ruder.io/deep-learning-optimization-2017/index.html


在這里,我建議大家參閱 Sebastian 的 Ruder 博文,其中談到了 2017 年內新近出現的、能夠對標準優化器加以改進的簡單方法,外加其它一些輕松易行的強化手段。


炒作態勢有所降溫



談到這里,我們能夠從以上圖片當中得到怎樣的啟示?很明顯,開發出有價值的新方案并借此獲利絕非易事,特別是考慮到目前正有大量開源工具與算法被持續發布出來。我認為 2018 年對于 Prisma 這樣的初創企業可能不會太友好——畢竟這個世界永遠不缺少競爭對手與“技術天才”。他們完全可以將如今的開源網絡部署在移動應用當中,并借此建立自己的商業企業。


在新的一年中,我們必須專注于更為基礎的技術研發——而非一味追求快錢。即使大家只是打算利用谷歌 Ratacon 語音識別技術生成語音讀物,也絕對不能僅僅將其視為簡單的 Web 服務——相反,良好的合作伙伴與商業模式將成為您獲得投資的必要前提。


總結


總結起來,我們目前已經擁有多種可以應用于實際產品的技術成果,具體包括時序分析、GAN、語音識別以及自然語言處理技術方面的改進等。我們不必再針對分類或者回歸等目標自己設計基礎架構,因為 AutoML 已經能夠幫助我們完成這些任務,希望在經過進一步優化之后,AutoML 能夠在速度方面更上一層樓。而在 ONNX 與模型 Zoo 的幫助下,我們將能夠輕松將基礎模型引入自己的應用程序當中。在我看來,至少就目前的最新發展水平而言,這將顯著簡化基于 AI 類應用程序的開發難度。


未來智能實驗室是人工智能學家與科學院相關機構聯合成立的人工智能,互聯網和腦科學交叉研究機構。由互聯網進化論作者,計算機博士劉鋒與中國科學院虛擬經濟與數據科學研究中心石勇、劉穎教授創建。


未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)云腦研究計劃,構建互聯網(城市)云腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
人工智能技術飛速發展:因循守舊你可能就會失敗
英特爾®人工智能大會2018
AI時代,我們在金融投資方面做了這些嘗試…
數據升維深挖信息價值,神經網絡賦能AI決策
如何結合AI找到商業價值?
寫給新人數據挖掘基礎知識介紹
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 玛纳斯县| 延安市| 台山市| 荣昌县| 罗田县| 屯留县| 罗平县| 忻州市| 康马县| 怀安县| 嘉祥县| 鹿泉市| 宁都县| 东兴市| 榆中县| 莎车县| 故城县| 大连市| 如东县| 乐平市| 夏邑县| 会同县| 龙州县| 儋州市| 万年县| 司法| 凉山| 苗栗市| 盐池县| 庆城县| 桐梓县| 西昌市| 繁峙县| 巴塘县| 象山县| 凌海市| 中卫市| 汝州市| 七台河市| 滦南县| 晴隆县|