圖丨第四范式聯(lián)合創(chuàng)始人&首席架構(gòu)師 胡時偉
根據(jù)近日國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》顯示,到2030年人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元,胡時偉表示:“各家都在廣泛撒網(wǎng),但人工智能的紅利還沒開始,談收割尚早。
記者 | 郭敏
官網(wǎng) | www.datayuan.cn
微信公眾號ID | datayuancn
2007年1月28日,圖靈獎得主、關(guān)系數(shù)據(jù)庫的鼻祖Jim Gray獨自駕船出海失蹤,并留下了一份珍貴的“遺產(chǎn)”—《第四范式:數(shù)據(jù)密集型科學發(fā)現(xiàn)》。在這份文稿中,Jim Gray將人類科學的發(fā)展定義成為四個范式:幾千年前,記錄和描述自然現(xiàn)象的行為是“實驗科學”,即第一范式,典型案例如鉆木取火;數(shù)百年前,科學家們開始利用模型歸納總結(jié)過去記錄的現(xiàn)象并發(fā)展出了“理論科學”,即第二范式,典型案例如牛頓三定律、麥克斯韋方程組等;過去數(shù)十年,計算機的發(fā)明讓“計算科學”成為可能,即第三范式,典型案例如模擬核試驗、天氣預(yù)報等。
然而科學的發(fā)展并未止步于模擬核試驗,Jim Gray認為隨著數(shù)據(jù)量的增長,計算機不僅能進行模擬仿真還能實現(xiàn)智能,他將這種科學研究的方式稱為第四范式。第四范式聯(lián)合創(chuàng)始人&首席架構(gòu)師胡時偉說:“在Jim Gray的定義中,第四范式的本質(zhì)就是利用機器對數(shù)據(jù)進行理解和分析,最終實現(xiàn)智能,與我們的初衷一致,這也是公司為何以此命名的緣由。”
人工智能是目標 機器學習是手段
隨著數(shù)據(jù)的積累和算法技術(shù)的不斷進步,越來越多的公司希望借助機器學習來解決實際問題。在過去的幾年里,各大公司紛紛開源了自己的機器學習框架,但即便如此,機器學習仍然非常“昂貴”。胡時偉說:“想要獲得成功的機器學習解決方案,需要完成問題定義、特征工程、算法調(diào)優(yōu)、模型評估、線上應(yīng)用和模型迭代等多個環(huán)節(jié)。”機器學習有較高的技術(shù)門檻,主要體現(xiàn)在分布式架構(gòu)和計算能力與數(shù)據(jù)流的上下游緊密結(jié)合,以及算法間無標準化實現(xiàn)等技術(shù)難題上。
較高的技術(shù)門檻讓眾多企業(yè)望而卻步,2015年,為了突破技術(shù)上的轄制,降低機器學習的門檻,以人工智能技術(shù)為主的第四范式公司成立了,旨在通過自身所掌握的機器學習技術(shù)對數(shù)據(jù)進行精準預(yù)測與挖掘,幫助企業(yè)提升效率、降低風險。
成立之初到現(xiàn)在,第四范式一直遵循“人工智能=機器學習+大數(shù)據(jù)”的法則。胡時偉告訴數(shù)據(jù)猿記者,大數(shù)據(jù)分為兩部分:一部分是指數(shù)據(jù)本身,另外一部分是指大數(shù)據(jù)平臺。在大數(shù)據(jù)平臺上運行機器學習程序,把人工智能變成一個具備決策能力的應(yīng)用,發(fā)揮其精準營銷、風險評估等能力,并向各個行業(yè)輸出。
第四范式率先在金融行業(yè)進行試水,典型的應(yīng)用是為銀行信用卡業(yè)務(wù)提供的交易分期智能營銷系統(tǒng)。信用卡的主要盈利模式是客戶分期還款的利息,胡時偉說:“在持卡客戶中,一些人沒有辦理分期還款的需求,而另外一些人有辦理分期還款的需求卻不清楚如何辦理,需要短信提醒,哪些人要提醒?哪些人不需要提醒?這是一個決策問題。”傳統(tǒng)的解決辦法是人利用專家規(guī)則對客戶進行分群處理產(chǎn)生最終決策,周期長、任務(wù)重,而通過第四范式搭建的系統(tǒng),只要源源不斷的向系統(tǒng)輸入營銷記錄(購買和以往分期記錄)數(shù)據(jù),就可以自動生成一個代替人去判斷的決策。
為何把金融行業(yè)作為第一切入點?胡時偉給出的回答是:“金融行業(yè)不僅對信息安全有極高程度的要求,而且具備如江河般的數(shù)據(jù)源動力,金融的風險可能是人類共同的災(zāi)難,人工智能能夠幫助金融行業(yè)做出更加準確地預(yù)判、評估風險。”
除了交易分期智能營銷系統(tǒng)之外,第四范式還推出了通用平臺“先知(Prophet)”,該平臺聚集了數(shù)據(jù)免清洗、模型自學習、一鍵上線、彈性計算、實時數(shù)據(jù)流、智能數(shù)據(jù)集成、特征自動組合等特征。“先知” 平臺能夠自動化、智能化的實現(xiàn)機器學習全流程。以數(shù)據(jù)免清洗為例,大部分數(shù)據(jù)科學家有80%或更多的精力都花費在數(shù)據(jù)清洗上,而第四范式專利級的 “免清洗算法”功能,對于無效數(shù)據(jù)的容忍度極高,為AI“減負”。而先知平臺的研發(fā)團隊正是胡時偉帶領(lǐng)的。
兒時被熏陶 對技術(shù)有濃厚的興趣
作為公司的首席架構(gòu)師,胡時偉帶領(lǐng)產(chǎn)品研發(fā)團隊打造出了國內(nèi)首款人工智能全流程平臺“先知”。在這之前,胡時偉曾先后任職于百度、鏈家網(wǎng),而他對技術(shù)的癡迷要從兒時開始說起。
由于父母在醫(yī)院工作的緣故,小學五年級的胡時偉在放學后經(jīng)常到醫(yī)院等父母下班。有一次,醫(yī)院雇傭了三個計算機專業(yè)的在校大學生來設(shè)計信息管理系統(tǒng),胡時偉十分好奇,天天與他們待在一起,三個月的時間系統(tǒng)交付成功,胡時偉也對IT產(chǎn)生了濃厚的興趣。之后,胡時偉就經(jīng)常通過電視來觀看一些程序員的講座,并仿寫一些簡單的程序系統(tǒng),例如成績單系統(tǒng)、自來水公司報表系統(tǒng)等,通過技術(shù)來解決一些實際生活中的問題讓胡時偉很是興奮。在選擇大學專業(yè)時,胡時偉毅然決然地選擇了上海交通大學的計算機專業(yè)。
2011年,研究生畢業(yè)的胡時偉加入了百度,一開始負責百度商業(yè)廣告投放系統(tǒng)的運營和維護,之后隨著百度內(nèi)部的業(yè)務(wù)調(diào)整,胡時偉相繼主持了百度商業(yè)客戶運營、鳳巢新興變現(xiàn)、商業(yè)“知心”搜索、阿拉丁生態(tài)等多個核心系統(tǒng)的架構(gòu)設(shè)計工作,個人的發(fā)展順風順水。
“當時在百度做的還不錯,也獲得了一定的認可程度,處于一個相對舒適的狀態(tài)。”胡時偉說。2014年,他離開了原來的“舒適區(qū)”,加入了鏈家網(wǎng)創(chuàng)始團隊,當時的鏈家網(wǎng)正處于互聯(lián)網(wǎng)轉(zhuǎn)型的初期,“去鏈家網(wǎng)主要是因為這是一個全新的領(lǐng)域和行業(yè),我想嘗試不同的東西。”在鏈家網(wǎng)任職期間,胡時偉帶領(lǐng)團隊完成了鏈家網(wǎng)新主站、經(jīng)紀人新作業(yè)系統(tǒng)、績效變革系統(tǒng)的整體架構(gòu)設(shè)計,參與規(guī)劃及推動了鏈家系統(tǒng)和研發(fā)體系的互聯(lián)網(wǎng)化轉(zhuǎn)型。
利用機器學習技術(shù) 打造出像windows一樣的產(chǎn)品
在鏈家網(wǎng)任職期間,與之前同在百度共事的戴文淵進行的一次交流讓胡時偉萌生了創(chuàng)業(yè)的念頭。
戴文淵曾任職于百度,擔任過百度鳳巢策略技術(shù)負責人、商業(yè)產(chǎn)品技術(shù)委員會主席,并主持建設(shè)了百度的AI系統(tǒng)。二人一致認為,數(shù)據(jù)和計算能力的提升是不可逆轉(zhuǎn)的趨勢,AI是個有前途的技術(shù),它應(yīng)該像windows一樣具有自己的操作系統(tǒng)和應(yīng)用軟件。胡時偉說:“當時,如果我們不做的話會錯過機會。”
2015年,戴文淵、陳雨強和胡時偉成立了第四范式,戴文淵擔任CEO,陳雨強擔任首席研究科學家,胡時偉擔任首席架構(gòu)師。胡時偉說:“其實從鏈家網(wǎng)到第四范式是從一個垂直的行業(yè)走到了一個平臺性的公司,我們的愿景是‘AI for everyone’,‘for everyone’代表第四范式不僅只服務(wù)一個行業(yè),我們要為各個行業(yè)提供技術(shù)服務(wù),但會有一個通用的核心,這個核心就是先知平臺。”
胡時偉說,先知平臺設(shè)計的初衷是把第四范式頂尖專家的能力賦予到以下兩種人:
第一種是客戶的員工。他們擁有數(shù)據(jù),并對業(yè)務(wù)又十分了解,期望把數(shù)據(jù)轉(zhuǎn)換成智能決策引擎,先知平臺可以讓某些具備一定水平的客戶依靠自身力量就能做到這一點;
第二種是第四范式做項目交付的同事。先知平臺可以降低構(gòu)建企業(yè)AI應(yīng)用的上手門檻,讓更多的人具備數(shù)據(jù)科學家的能力,提升利用這個平臺交付實施的效率,最終提升服務(wù)規(guī)模和服務(wù)水平,為更多更廣泛的客戶創(chuàng)造價值。”
目前,先知平臺相繼在金融、電商、媒體、零售、醫(yī)療、游戲等領(lǐng)域展開了應(yīng)用,第四范式的AI的商業(yè)化的之路已經(jīng)開啟,但“覬覦”人工智能的公司又何止第四范式一家。
這幾年,谷歌、微軟、亞馬遜、阿里巴巴、百度、騰訊、大疆創(chuàng)新、華大基因、圖靈機器人和思必馳,既有以BAT為領(lǐng)銜的科技巨頭與美國為首的全球科技巨頭爭奪未來,也有初創(chuàng)企業(yè)蠢蠢欲動。根據(jù)近日國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》顯示,到2030年人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元,胡時偉表示:“各家都在廣泛撒網(wǎng),但人工智能的紅利還沒開始,談收割尚早。”
敬請期待,數(shù)據(jù)猿即將于10月25日舉辦的“2017金融科技價值—數(shù)據(jù)驅(qū)動金融商業(yè)裂變”高峰論壇!投遞案例、文章、產(chǎn)品,聯(lián)系視頻&文字專訪,請勾搭數(shù)據(jù)猿~