周末推薦幾個關于人工智能的幾個觀點:
1、《追問人工智能:從劍橋到北京》的作者關于'自動化'和'智能化'的理解:
“現在的人工智能還遠遠未達到大家的期望,現在大家看到的AI某種意義上都是自動化或者是高級自動化,那智能化和自動化有什么區別呢?自動化是這樣的,固定的輸入及可期望的輸出,如很多生產線都是自動化生產線,而智能化不是這樣,輸入可以固定也可以不固定,但是輸出一定是非預期性的,絕大部分是非預期性,出乎意料的東西,這才是智能。”
“真正強人工智能里面肯定不全是邏輯,僅有邏輯,那都是自動化,那都是規則化的東西,非理性的東西,那個才是揪人心的東西,才是人類智慧的東西。”
2、新一代掃地機器人:SLAM是技術競爭的戰場
目前依據傳感器及SLAM技術的不同,具備SLAM能力的第三代掃地機器人產品又可以分為基于LDS激光測距傳感器的掃地機器人產品以及基于機器視覺(vSLAM)的掃地機器人產品。激光SLAM由于起步早,目前體系和框架已趨于穩定,產品落地相對成熟,主要分為單線式和多線式,目前市面上大多數建圖規劃的掃地機器人產品都屬于這個范疇。但其高昂的造價以及無可避免的凸起式的硬件結構使得掃地機器人機身厚度增加,降低了掃地機器人的通過性。而vSLAM方案作為以攝像頭為傳感器的導航方案,相比LDS方案來說,能夠以相對低廉的成本采集到更加豐富的數據。隨著手機行業對鏡頭的強勁需求,攝像頭/鏡頭制造及相關vSLAM技術發展迅猛,很快就引起了各大掃地機器人廠商的重視。
筆者解讀:掃地機器人只是機器人行業的一個小產品,應該說隨著機器人的發展,以自動駕駛、無人機、服務機器人等智能自主無人系統都將迎來巨大發展。這類自主無人系統的主要組成部分就是環境感知、決策規劃和智能控制,定位導航只是環境感知技術之一,其中SLAM則是比較關鍵、核心的技術。隨著計算能力和計算視覺的發展,VSLAM以及VSLAM與IMU(慣導)、激光雷達、GPS等多傳感器融合的導航定位將成為關鍵,而VSLAM+IMU則可以低成本、精度互補等優點在低速運轉的服務機器人中取得核心優勢。
3、2019年AI發展趨勢總結
中譯語通GTCOM綜編 對2019年的人工智能的發展趨勢給予了總結,如下:
從AI基礎設施來說,人工智能專用芯片的研發方興未艾,不僅包括英偉達GPU、谷歌TPU,國內的阿里、百度、華為等巨頭公司,以及大量創業公司,都在AI芯片方面加快布局,隨著AI應用進一步滲透到IOT等方向,相信對專用芯片的需求會越來越廣泛。而作為各種AI應用開發工具的AI框架,也在之前的百花齊放式發展中逐步收斂,目前形成了PyTorch引領學術界TensorFlow主導工業界的雙雄局面;而隨著中臺概念的日益興起,國內大型互聯網公司也正在以AI中臺的面貌推出各自的高層開發框架,大量AI創業公司則逐步轉向金融、安防等垂直行業深耕細作的模式。
從AI技術進展的角度來看,有幾個明顯的技術趨勢已日益凸顯。
首先,隨著以智能手機為代表的移動終端計算存儲能力快速加強,移動端AI與邊緣計算技術正在快速發展與普及,如何在應用效果盡可能高的前提下,將模型做小做精致做快,是這個發展方向的關鍵點。
其次,傳統機器學習嚴重依賴訓練數據的規模與質量,這制約了領域技術的快速發展,而最近的明顯趨勢是由最常見的監督學習向半監督、自監督甚至無監督機器學習轉向,如何用盡量少的有標訓練數據讓機器自主學會更多的知識,是大有前景的發展方向。
第三,AutoML正在快速地滲透到各個AI應用領域,從最早的圖像領域,目前已經拓展到NLP、推薦搜索、GAN等多個領域,隨著AutoML技術的逐漸成熟,搜索網絡結構成本越來越低,相信會有更多的領域模型會由機器來設計,而不是目前的算法專家主導的局面,這個技術趨勢基本是確定無疑的。
再者,隨著5G等傳輸技術的快速發展,視頻、圖片類應用快速成為最主流的APP消費場景,而機器學習技術如何更好地融合文本、圖片、視頻、用戶行為等各種不同模態的信息,來達到更好的應用效果,相信也會越來越重要。另外,如何讓機器能夠生成高質量的圖片、視頻、文本等,最近兩年也出現了大量有效新技術比如圖像領域的 GAN以及文本領域的GPT2等模型,而這種具備創造性的生成領域,雖然之前由于受到技術發展水平限制,大家投入的精力不多,隨著相關技術日益成熟,這塊相信也會越來越重要。
從AI應用領域發展趨勢來講,最主要的幾個AI方向比如自然語言處理、圖像視頻處理及搜索推薦方向,最近一年來技術發展各自精彩紛呈,又呈現出不同的發展格局。
自然語言領域在最近兩年發生了天翻地覆的技術變革,進入了技術井噴的快速發展期,而這一巨變的引發者是由Bert為代表的預訓練模型及新型特征抽取器Transformer的快速發展與普及帶來的。最近一年也陸續出現了大量效果突出的改進模型,比如XLNet、RoBERTa、ALBert、Google T5等一系列改進。相信隨著大家對Bert的理解逐漸深入,對Bert模型的快速改進以及更多領域更好的應用效果會成為NLP領域的常態,我們在不遠的未來會看到NLP 領域更多新模型的出現,以及這些新技術推動實際應用場景的快速進步。
圖像處理領域是AI的另一應用主戰場,但是,除了近年來深度學習、ResNet兩大圖像處理領域的巨大技術革新外,最近兩年來,CV領域并未有特別巨大的技術革新與進步,目前進入技術平穩發展期。歸功于基礎技術的快速進步,很多CV應用已相對成熟,所以近年來我們體會更多的是各種前沿技術在各個行業的應用落地與實踐。
對于推薦與搜索等具備較長工業化發展歷史的AI應用領域,深度學習在最近兩年已經在各種互聯網公司比較廣泛地獲得了嘗試和應用。盡管并未像NLP與圖像領域那樣,深度學習相對傳統模型獲得突飛猛進的技術突破,而且對于比如推薦領域DNN模型的效果到底如何在學術上還存在爭議,但是相信這些領域如果能夠正確借鑒其 AI領域的技術進展,會在未來兩年內出現令人驚喜的效果突出的技術進化。
筆者解讀:關于2019年人工智能的發展,正如上述所說,有一些進展和突破,但其實也算不上突飛猛進,僅限于一些單一的項目或技術有一些突破,而且這些項目一般都是固定的。一個比較顯著的特點是,現在大家討論的熱點都是圍繞5G+人工智能,而不是說自己是一家互聯網或物聯網公司,然而,5G的很多實際應用,大家都不是很清楚;同時,以硬件為基礎,以軟件或數據為核心支撐的模式也越來越多;工業互聯網、工業大數據分析在幾番政策的支持下,也在逐漸填補其藍海;圖像、OCR等模式識別以及深度強化學習技術的發展,也帶動了自動駕駛、機器人等智能自主無人系統等的發展,進一步帶動了嵌入式系統開發的繁榮;國際形勢、技術壓力等促進了國內對半導體芯片、類腦計算、量子計算、生物科技等硬科技的積累和突破;各大高校積極開展人工智能的教育,連小學生也開始學習編程語言,如Python,同時各大培訓機構也打出了保就業的培訓口號。然而,5G只是一種通信技術,最后掌握其核心只能有那么幾個公司,正如現在的三大運營商和華為等公司一樣,而其實際應用目前并不明確,其它公司也難以分一瓢羹,也就打打口號而已;人工智能方面,在深度學習沒有更大突破、類腦計算也僅限于脈沖網絡或融合網絡的情況下,也難做出更智能化的東西。當前,一方面是對技術較為成熟,但難以落地的行業、場景進行實踐;一方面是繼續保持熱情,進一步探索技術的突破。
最后放送一個《機器人認知自動化白皮書》
關注我們的公眾號“數聯未來”