一、人工智能發展的利好因素
政策利好:2016年5月24日,由國家四部聯合發布的《“互聯網+”人工智能三年行動實施方案》,從平臺資源、服務體系、技術支撐、人才培養等方面為國內人工智能發展提供有利條件。7月5日發改委就《戰略性新興產業重點產品和服務指導目錄》2016版公開征求意見。對原有的七大產業也進行了修訂,如在“新一代信息技術產業”中增加了人工智能產業。
經濟:從產業角度看,雖然人工智能現階段還處于“少年期”,但無論從技術成熟度還是資本市場關注度看,人工智能都有很大的發揮空間。首先互聯網經濟的繁榮,為人工智能提供了龐大的用戶群,同時出現人工智能投資熱點,2015年人工智能創業公司供獲得投資資金額達12.6億。
社會:在消費升級的趨勢下,零售開始智能化,有智能貨柜,智能家居生活用品,消費者與商家有更多的互動,有更精準的俄消費者畫像,品牌更加的娛樂化和年輕化;在醫療大健康的背景下,醫療需要智能化,需要有更先進的手段來滿足手術需求;在人工成本逐步上漲的背景下,工廠無人化,工業機器人大規模使用;車輛也開始無人化,京東開始用無人機無人車送花,還有無人駕駛的汽車等;這樣會形成新的生活態度,解放人的體力和部分腦力。
技術:國內一大批企業在視覺識別、語音識別等領域實現技術突破也為我國人工智能產業的發展提供了有利條件。深度學習技術,成為了比人更厲害的信息分類器。
二、什么是人工智能
人工智能,英文縮寫為AI,是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術以及應用系統的一門新的技術科學,是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式作出防御的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。如今,人工智能已經演化成了機器學習、自然語言處理、圖像識別以及人機交互這四大模塊。
機器學習技術:指計算機通過對大量已有數據的處理分析和學習,從而擁有預測判斷和做出最佳決策的能力。這項技術與計算機科學、統計學、數學優化算法等都有著密不可分的關系。其代表算法有深入學習、人工神經網絡、決策樹、增強算法等。
自然語言處理技術:指讓計算機可以理解人類的語言,包括將人類語言轉化為計算機程序可以處理的形式及將計算機數據轉化為人類自然語言兩種形式。這里指的語言可以是聲音也可以是文字。這項技術的主要內容包括信息檢索、信息抽取、詞性標注、句法分析、多語處理、語音識別等。
圖像處理技術:指讓計算機擁有人類的視覺功能,可以獲得、處理并分析和理解圖片或多維度數據。這項技術的主要內容包括圖像獲得、圖像過濾和調整、特征提取等。
人機交互技術:指計算機系統和用戶可以通過人機交互界面進行交流。這項技術包括的主要內容包括計算機圖像學、交互界面設計、增強現實等。
三、人工智能產業鏈的演變及分布
人工智能可以細分為13個領域:全面覆蓋了深度學習/機器學習(通用)、深度學習/機器學習(應用)、自然語言處理(通用)、自然語言處理(語音識別)、計算機視覺/圖像識別(通用)、計算機視覺/圖像識別(應用)、手勢控制、虛擬私人助手、智能機器人、推薦引擎和協助過濾算法、情境感知計算、語音翻譯、視頻內容自動識別等。
從產業鏈分布來看:
首先是計算處理及信息儲存的芯片巨頭,像英特爾、NVIDIA等公司,它們處于這一領域的最上游,為中下游產業鏈提供計算處理能力及相關解決方案,他們決定了人工智能發展的深度。
其次是大數據產業鏈中的原始數據獲取方,包括運營商、BAT、微軟、谷歌等把持互聯網入口的公司,它們掌握著機器學習必須的數據資源,決定了人工智能發展的廣度。
此外,還有人工智能技術的研發集團,其中自動駕駛、深度學習、語音識別以及圖像識別等領域都有著各自取得領先公司和團隊。
相較于全球市場,我國人工智能產業鏈主要包括基礎技術支撐、人工智能技術及人工智能應用三個層次。
基礎支撐層:國際IT巨頭長期盤踞,中國初創企業很難進入
在人工智能領域,傳統的芯片計算架構已無法支撐深度學習等大規模并行計算的需求,這就需要新的底層硬件來更好地儲備數據、加速計算過程。基礎層主要以硬件為核心,其中包括GPU/FPGA等用于性能加速的硬件、神經網絡芯片、傳感器與中間件,這些是支撐人工智能應用的前提。這些硬件為整個人工智能的運算提供算力,目前多以國際IT巨頭為主。
目前在GPU領域,英偉達主打工業級超大規模深度網絡加速,并于日前推出了基于Volta、首款速度超越100TFlops的處理器Tesla;英特爾主要圍繞FPGA構建產業,推出了模仿人腦的人工智能芯片。谷歌也推出了第二代TPU芯片,為自己的開源TensorFlow框架提供芯片支撐。除了這些談到的行業巨頭,在這一領域還有眾多的初創公司,如中星微、寒武紀以及西井科技等,但在產業布局能力和研發實力方面還不可與這些巨頭匹敵。
技術驅動層:算法和計算力成主要驅動力,開源化是趨勢
技術層是人工智能發展的核心,對應用層的產品智能化程度起到決定性作用,在這一發展過程中,算法和計算力對AI的發展起到主要推動作用。技術層主要依托基礎層的運算平臺和數據資源進行海量識別訓練和機器學習建模,以及開發面向不同領域的應用技術,包含感知智能和認知智能兩個階段。其中,感知智能階段通過傳感器、搜索引擎和人機交互等實現人與信息的連接,獲得建模所需的數據,如語音識別、圖像識別、自然語音處理和生物識別等;認知智能階段對獲取的數據進行建模運算,利用深度學習等類人腦的思考功能得出結果,如機器學習、預測類API和人工智能平臺等。在此基礎上,人工智能才能夠掌握“看”與“聽”的基礎性信息輸入與處理能力,才能向用戶層面演變出更多的應用型產品。
當前,國內的人工智能技術平臺在應用層面主要聚焦于計算機視覺、語音識別和語言技術處理領域,國內技術層公司發展勢頭也隨之迅猛,其中的代表性的企業包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。
場景應用層:AI與場景深度融合,領域應用更加廣泛
應用層主要是基于基礎層與技術層實現與傳統產業的融合,實現不同場景的應用。隨著人工智能在語音、語意、計算機視覺等領域實現的技術性突破,將加速應用到各個產業場景。
應用層按照對象不同,可分為消費級終端應用以及行業場景應用兩部分。
消費級終端包括智能機器人、智能無人機以及智能硬件三個方向,場景應用主要是對接各類外部行業的AI應用場景。近年來,國內企業陸續推出應用層面的產品和服務,比如小i機器人、智齒客服等智能客服,“出門問問”、“度秘”等虛擬助手,工業機器人和服務型機器人也層出不窮,應用層產品和服務正逐步落地。
其中,IBM最早布局人工智能,“萬能Watson”推動多行業變革;百度推出“百度大腦”計劃,重點布局無人駕駛汽車;而谷歌的人工智能業務則較為繁雜,多領域遍地開花,包括AlphaGo、無人駕駛汽車、智能手術機器人等;微軟在語言語義識別、計算機視覺等領域保持領先。除此此外,家電行業也掀起了人工智能的熱潮,不少家電企業都瞄準了人工智能,潛心研發AI技術,將其應用于家電產品。今年以來,長虹、美的、格力、格蘭仕等都在向智能制造轉型,試圖立足“SmartHome”,將人工智能和智慧家庭更緊密地結合在一起。
四、人工智能技術的三個階段:
人工智能主要分為計算智能、感知智能、認知智能。計算智能,即機器“能存會算”的能力;感知智能,即機器具有“能聽會說、能看會認”的能力,主要涉及語音合成、語音識別、圖像識別、多語種語音處理等技術;認知智能,即機器具有“能理解會思考”的能力,主要涉及教育評測、知識服務、智能客服、機器翻譯等技術。
五、人工智能領域的AI玩家:
中國市場 AI 玩家主要包括以下四大類:
1、傳統AI技術提供商,以科大訊飛、全志科技等為代表;
2、大型互聯網公司,以BAT、搜狗等為代表;
3、 新興AI創業公司,以云知聲、曠視科技等為代表;
4、垂直行業AI技術驅動型公司,以平安集團、華大基因等為代表。
我們根據產業圖譜分析,分別在人工智能基礎層、技術層、應用層三大層級中尋找一些代表企業:
1、在技術層的人工智能公司按照領域劃分有:
語音識別&自然語言處理:百度、騰訊、科大訊飛、微軟亞洲研究院、云知聲、思必馳、出門問問、紫冬銳意、普強科技等;
機器學習&深度學習:金山云、商湯科技、依圖科技、第四范式、深網視界、閱面科技;
計算機視覺:微軟亞洲研究院、漢王科技、商湯科技、face++曠視科技、圖譜科技、盛開互動、依圖科技、格林深瞳、諾亦騰、云從科技、圖森互聯、中科奧森、深網視界、圖漾科技、閱面科技、中科視拓、linkface、聚力維度、深圳科葩、速感科技等;
語義識別:智臻智能、圖靈機器人、ImageQ、玻森數據;
2、在基礎層的人工智能公司按照領域劃分有:
AI芯片:華為、全志科技、中星微電子、中科寒武紀科技、西井科技
計算能力平臺:阿里巴巴、百度、浪潮、搜狗、Chinapex創略、永洪科技、中科互聯、數據堂、明略數據、騰云天下、云天大數據、海致網絡、GrowingIO等
3、在應用層的人工智能公司按照領域劃分有:
機器人:博實股份、地平線機器人、旗瀚科技、智位科技、思嵐科技、智能管家、埃夫特、臻迪集團、祈飛科技、智久機器人科技、妙手機器人、科沃斯
自動駕駛:百度、阿里巴巴、中科創達、智車優行、佑駕創新、零零無限科技
無人機:臻迪科技
語音助手:百度、出門問問
產業應用:碳云智能、久其軟件
智能金融:平安集團、GEO集奧聚合、量化派
智能醫療:華大基因、碳云智能、貝瑞和康、匯醫慧影、醫渡云、錢璟康復
智能安防:大華股份
智能教育:英語流利說、乂學科技、小知科技
智能硬件:智位股份