近日,愛分析在京舉辦了2019愛分析·中國數據智能高峰論壇,數據智能領域眾多獨角獸企業、投資人和專業人士共聚一堂,共同分享、探討行業趨勢。愛分析邀請到了一覽群智CEO胡健進行了主題演講。
胡健認為,過去幾十年,人工智能經歷了發展的三個階段:專家智能、數據驅動的AI、大數據驅動的AI。接下來在五到十年之內,肯定會出現下一代的人工智能的進步,大知識驅動的AI。
現將其主題演講實錄分享給讀者。
胡?。悍浅s幸愛分析邀請,有機會跟大家分享數據智能方面的思考以及我們在這方面的實踐。
我喜歡兩部電影,一個是《終結者》,一個是《鋼鐵俠》,完全不同的設計場景,最終產生的結果也是完全不一樣。
《終結者》設計場景是,機器完全具有智能,要消滅人類,或者奴役人類。
《鋼鐵俠》是輔助人,是智能的助理?!朵撹F俠》產生的結果是,讓人成為一個超人,成為美國的英雄。
對人來說,從倫理上的選擇非常明確,我們的目標是讓機器服務我們,讓我們成為超人,而不是讓我們成為機器的奴隸。
從技術角度來看,雖然現在的人工智能技術能在很多決策上幫助我們,但是機器更擅長計算、存儲以及模式識別的能力,人更有同理心,具備理解、分析和決策能力,這兩者是天然的互補。
機器加上人工,讓機器取代簡單的重復性的工作,讓人做一些更有創造性,更加重要的工作。所以無論從倫理角度,還是技術角度來說,我相信人機結合肯定是未來大勢所趨。
但理想很豐滿,現實很骨感。某種意義上,現階段的人工智能屬于弱人工智能,就是“弱智”階段。
當前的人工智能完全是基于數據推理的方式。第一,沒法理解人類的情感,沒法跟人進行正常乃至深度的交流;第二,無法應對在復雜場景下的決策和規劃的問題。
現階段人工智能的落地都是快速反饋,單場景感知的智能。就像剛出生的孩子一樣,看得見,聽得見,但是需要長時間的培訓才能看得懂,聽得懂。
因此,接下來人工智能和數據智能很重要的任務怎么讓機器或者軟件具有大腦。
整個數據智能或者人工智能發展有四步:專家智能、數據驅動的AI、大數據驅動的AI以及大知識驅動的AI。
第一步是專家智能。60年代的時候,很多專家用一些規則,或者用一些符號邏輯的方式,把邏輯規則化,希望盡可能的用自動化的流程取代工作。
的確,這在很多場景中是有價值的,能夠提升勞動效率,但是本身用規則的方式去解決這個問題,專家就只有這么多,寫的規則非常復雜,適用性非常有限。
因此,很長一段時間專家庫知識庫陷入停滯狀態。
后來推出機器學習算法,我們在很多小數計算上實現非常大的突破,幫助我們在很多場景中做預測。但此類門檻比較高,需要做特征工程,另外,還要選擇不同的算法,它是比較小眾的應用場景。
一直到2011年深度學習出現,不需要懂算法,直接端到端的產品,里面具體參數不用設計,直接出成果,直接到大數據驅動的人工智能。
最近一直提“大力出奇跡”,它不是算法的進步,是算力對于數據使用的進步,是大數據驅動的人工智能。
但這種深度學習有很大的瓶頸。
第一,特點性問題,沒法解釋什么東西起作用,在很多關鍵的場景中沒法應用。
第二,泛化性問題,所謂大數據驅動人工智能,需要大量的數據去學習,才能學出很好的模型。這與人不同,人作為生物,有一套理論初步框架,有一套常識圖譜,常識圖譜的框架下,給幾張圖片就能產生非常好的泛化效果。
所以我們認為接下來在五到十年之內,肯定會出現下一代的人工智能,很多人提到大知識驅動的人工智能。
大知識驅動的人工智能,我們面臨的挑戰,首先是大。
傳統知識庫是有限的,但現在有大知識,數據庫上云,包括人的數據、物聯網數據能夠構建知識圖譜。
因為一覽群智大部分核心人員都是從微軟研究院出來的,曾經在微軟研究院做搜索、數據挖掘。
搜索是人工智能、數據第一次大規模的商業應用,很多人會問,NLP或者知識圖譜的市場規模和視覺相比,哪個大一點?
其實很顯然,因為自然語言,知識圖譜已經得到證明。搜索這個市場是巨大的市場,搜索本身核心的技術,都在用open的數據構建超大規模的知識圖譜,用知識圖譜去理解文檔,理解用戶的查詢,最終實現查詢跟文檔的精準匹配。
本身從搜索角度,它是一個通用的查詢的決策引擎。
我們從微軟出來以后在想,是否能將這樣的技術應用于企業與行業,如何將通用的知識圖譜與行業知識圖譜相結合,解決行業的問題。這是我們做一覽群智這家公司的初心。
最核心的問題,是怎樣從海量的多源異構數據中抽取知識,構建關系,把不同的數據進行消歧融合,并構建知識,這是第一個知識構建問題。
第二個問題,怎樣理解語義。比如,現在大部分人機對話,siri以及各領域的人機對話,不理解語義,這是現階段的困難。我堅信接下來利用自然語言處理技術,特別是語義理解技術的快速發展,會形成巨大的突破。就像前幾年視覺技術的突破一樣。
第三個是知識賦能的問題,有大的知識,怎么和生物技術、和語言技術結合?我們有通用的知識圖譜,怎么訓練識別特定的引擎,目標是基于四到五張圖片能做識別引擎。目前的情況是,現在還需要標注成千上萬張圖片。
我們的行業類似于搜索行業,我們現階段要做的事情是落地智能平臺。
一覽群智智能決策平臺包括四個基礎產品,分別解決了數據融合和快速打通數據閉環的問題、知識圖譜的構建問題、關聯分析的問題,以及AI模型的訓練問題,即為決策問題。這是基于我們團隊多年經驗,總結出的一套產品,或者方法論。
具體而言,一覽群智智能決策平臺輔助決策系統,由“感知-理解-分析-決策”四部分構成。
首先,我們的產品解決的問題是從多源異構數據,從公開的行業數據,包括物聯網數據中抽取出結構化的信息,形成通用知識圖譜。這過程中我們需要用自然語言理解,以及知識抽取,去構建知識圖譜。
當有了知識圖譜以后,用基礎的機器學習產品,可以降低很多行業人員、從業人員使用人工智能產品的門檻,就能快速的構建決策性產品。
有決策產品以后,產品不是取代人,而是幫助人在決策過程中理解數據,在人機交互中,快速利用人的決策能力。
構建了這樣一套框架體系后,用常識圖譜結合在公安、媒體具體的細分領域的數據,去賦能行業。
接下來具體講講我們在幾個細分領域做的應用場景。
第一個智能決策平臺在公安行業應用。
因為公安有數據,能夠商業化落地。當前的功能偏向于事后分析,歸類完數據之后,出了案件,用圖譜也好,數據中臺也好,業務中臺也好,抓住犯人。
另外一個場景是銀行。
人工智能真正把人從簡單工作中解放出來,一覽群智智能審單專家系統去年在國內某大型銀行成功上線,首次將人工智能技術與國際單證業務相結合,實現了人工智能領域在單證業務中從無到有的突破。
效果非常明顯,從數量上看,原來審單團隊需要2000名本碩高級人才,現在只需要100名通用人才。而且,審單效率大幅提高,基本杜絕了滯后的現象。對于大量票據,將其關鍵要素處理出來,同時用知識圖譜匹配,這個技術在保險、銀行、證券等行業,都有大量的需求。
另外一個是反洗錢的產品。
大家知道反洗錢,整個金融的血液是資金,所有的金融犯罪都是跟資金有關系的,比如說貪污受賄、恐怖性融資等。
所以對整個金融體系,像國家金融監管要求的一樣,必須要上反洗錢的系統。
目的很明確。
第一,要做到預防,是通過人工加規則的方式。比如這個人以前沒有放款,突然對外打了一筆巨額的資金,可能有問題。再比如你是做蘋果生意的,突然給做礦生意的人打了一筆巨額資金,這就需要上報給人民銀行。
這些可能的問題,首先要經過人工審核,比如一天一個銀行將近八萬筆有可能的嫌疑,但是需要通過人工變成兩百筆。
現階段的方式存在的問題是反應很慢。如果用我們的模型,第一,可以快速識別是不是洗錢交易。第二,我們能做到實時交付,可以有效的杜絕金融犯罪的行為。
以上是我們的理解和一些落地的場景。
每一次技術革命,都會帶來焦慮,但是,每次的結果都是人活的更幸福。接下來人工智能的新篇章肯定是以人為本,最重要的問題是讓機器具有人性,能跟人更好的理解交流,同時讓人成為超人,讓人的技能得到放大。
謝謝各位。