作者:陳強 來源:當代金融家
2018-01-02
本文共3406字,預計閱讀時間1分21秒。
人工智能從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,基于人工智能的科技產(chǎn)品通過對人的意識和思維過程進行模擬、學習,使產(chǎn)品能像人一樣思考,在某些方面達到甚至超過人類的智力水平。2017年5月在烏鎮(zhèn)舉行的圍棋峰會上,AlphaGo橫掃眾多圍棋高手,以深度學習為代表的人工智能算法將AlphaGo推向了圍棋界的巔峰。這表明人工智能在對傳統(tǒng)制造行業(yè)產(chǎn)生重大效能之后,已成功滲透到復雜的分析決策領域,也預示著人工智能算法今后將對社會生活的各個領域產(chǎn)生重要影響。
與此同時,移動互聯(lián)、物聯(lián)網(wǎng)的興起使許多線下活動轉移到線上,這些線上行為積累了海量的數(shù)據(jù),而云計算的極速發(fā)展又極大地提升了針對海量數(shù)據(jù)進行儲存與運算的能力。這些領域的發(fā)展進步為人工智能算法的深入應用創(chuàng)造了可行的條件。
金融業(yè)作為一個“泡”于數(shù)據(jù)、“跑”在云上的行業(yè),數(shù)字化程度很高,也極具客戶基礎、數(shù)據(jù)基礎和社會影響,在人工智能應用方面具備得天獨厚的優(yōu)勢和廣闊的前景。同時,人工智能算法通過對投資決策、風險定價等金融最核心職能的優(yōu)化,可以更有效地提高分析判斷的效率,助力金融經(jīng)營決策的智能化、動態(tài)化與前瞻化,最終造就了算法金融的創(chuàng)新業(yè)務模式。
在財富管理領域,智能算法的應用領域主要包括高頻交易、統(tǒng)計套利策略、動量與其他資產(chǎn)組合管理、機器學習與計算金融智能、衍生品估值算法分析、行為金融與投資者啟發(fā)以及輿情分析與文本處理等。比如機器人投顧,可以利用遞歸神經(jīng)網(wǎng)絡實現(xiàn)對金融市場中時變數(shù)據(jù)的最優(yōu)估計,獲取動態(tài)最優(yōu)的投資組合配置;可以利用XGBoost算法預測股票漲跌的概率,挑選股價上漲概率較大的股票;可以利用SVM算法對股票漲跌進行分類,對個股或大盤的走勢進行預測。正是在算法的驅(qū)動下,形成了從用戶屬性分析到投資組合推薦再到組合動態(tài)調(diào)整的全流程、自動化的機器人投顧業(yè)務模式(見圖1)。
在風險信貸領域,智能算法可以應用于對公企業(yè)的風險管理,實現(xiàn)客戶多維度數(shù)據(jù)管理、財務偵測、信用評級違約判定、授信額度計量、風險定價等功能,也可以用于審批針對零售小微客戶的線上快速貸款。比如在物流行業(yè),通過構建物流金融風控模型,可以提高銀行等金融機構在多種企業(yè)融資模式下的風險管理能力。一方面,借助層次分析法(AHP)處理較為復雜而模糊的大數(shù)據(jù),配合專家經(jīng)驗對指標排序,通過計算判斷矩陣的最大特征值和特征向量,得到各元素的權重,實現(xiàn)量化打分評級的效果,并將信用評分結果應用于額度計算、貸款定價等審批決策過程,實現(xiàn)信貸審批精準量化決策輔助。另一方面,在數(shù)據(jù)積累到一定程度下,基于人工智能、機器學習、統(tǒng)計學、信息檢索、數(shù)據(jù)庫等技術,利用信息值(IV)、相關性、共線性(VIF)等技術手段篩選并刪除失效的財務指標,讓中小融資企業(yè)為迎合傳統(tǒng)風控模型而人為調(diào)整的各項財務指標減弱或失效,同時挖掘出那些潛在的、有效的風險特征、數(shù)據(jù)規(guī)律、規(guī)則、趨勢等,達到“總結過去、預測未來”的智能化效果(見圖2)。
算法金融的本質(zhì)是要搭起計算科學、人工智能、數(shù)據(jù)科學等理論技術與金融行業(yè)具體業(yè)務場景之間的橋梁,使不同領域的算法在金融行業(yè)得到更為鮮活的應用,推動金融服務的智能化水平不斷提升。
算法的基礎理論及基本原理是公開的、共有的,但理論原理要落地,要進一步形成與金融場景相結合的具體方法技術,直到最終產(chǎn)品的出爐,還有很多具體環(huán)節(jié)需要實現(xiàn)突破。這個過程中的核心和關鍵就是算法理論和原理如何與具體的金融業(yè)務場景相融合。從這個角度,算法金融對產(chǎn)品或服務的創(chuàng)新并不一定是算法原理的改造,而是建立在金融場景與算法原理對接基礎上的數(shù)據(jù)工程化、原理實證化及算法產(chǎn)品化的過程。
以數(shù)據(jù)工程化為例,算法金融產(chǎn)品在某個金融場景能否得到成功應用,主要取決于產(chǎn)品對該場景中數(shù)據(jù)及信息的分析預測結果。如果說場景中的數(shù)據(jù)是基礎,如何在場景中選擇合適的數(shù)據(jù)并提取相關特征,對算法模型的效果起著至關重要的作用(見圖3)。好的訓練數(shù)據(jù)及特征能使算法模型產(chǎn)生更好的作用,即使在模型不是最優(yōu)的情況下也能產(chǎn)生不錯的效果。比如,利用XGBoost算法構造選股模型以選出股價上漲概率較高的股票時,一個很重要的步驟就是篩選與股價相關的數(shù)據(jù)并提取對股價影響較大的特征因子,如財務指標、技術指標等等,特征因子的好壞會直接影響模型預測股價漲跌的效果,而特征因子的提取又需要對股票市場行情、公司基本面等領域都有一定的專業(yè)知識。
從數(shù)據(jù)工程化到算法產(chǎn)品化,整個過程的實現(xiàn)必須建立在算法產(chǎn)品研發(fā)人員對場景、數(shù)據(jù)、算法原理、算法產(chǎn)品的系統(tǒng)部署等整個流程均具有較深厚的理解與認知的基礎上;需要將算法與場景連接起來,通過設計算法、開發(fā)模型來刻畫、描繪場景,將場景關系轉換成可以定量描述的狀態(tài)、空間,或者將變化規(guī)律通過數(shù)理方程、圖論支持的圖示、神經(jīng)網(wǎng)絡等算法刻畫出來。一個量化概念的構造或一個算法原理在不同場景中的應用過程往往千差萬別,其應用效果也是大相徑庭。比如,概率通常被用來表示一個事件發(fā)生的可能性,但既可以用來篩選建模樣本,也可以用來預測股票漲幅大小,還可以通過概率思維來表達特定個體某種嘗試行為的次數(shù)及相應的數(shù)據(jù)生成過程。
最近鄰域算法(KNN)是機器學習的分類算法之一。這一算法可以應用于信用卡產(chǎn)品的精準營銷上,基于海量信用卡交易信息,推算所有POS機的位置,以此構建每個用戶的消費軌跡,為精確進行用戶畫像、個性化推薦、商圈營銷等提供依據(jù);也可用以判斷股票走勢分化趨勢,確定強勢、中等、弱勢股票的分類邊界,分類邊界的形狀會因K的取值不同而不同,因此關鍵就是要找到合適的K值,而尋找最優(yōu)K值的過程可能又會涉及其他算法;同時,針對不同的數(shù)據(jù)特點,最適合的K值的算法也有所不同(見圖4)。
算法金融業(yè)務的最典型特征就是貫穿整個業(yè)務場景的全鏈條服務,而不是只在業(yè)務的某一個環(huán)節(jié)或者產(chǎn)品建設的某一個階段發(fā)揮作用。
從產(chǎn)品的打造過程來看,算法金融業(yè)務是全流程的算法驅(qū)動與串聯(lián):從業(yè)務場景端的切入開始,到場景內(nèi)外部數(shù)據(jù)整合、清洗挖掘、特征變量的加工,到算法體系設計與具體實施步驟,逐層落地算法偽代碼,業(yè)務實證結果的編碼實現(xiàn),數(shù)據(jù)集的增廣,直至業(yè)務痛點被解決,全過程均有算法的支持與驅(qū)動。整個過程中,為達到階段性的目標需要構造具體的、可描述的目標(函數(shù)),這些目標(函數(shù))的優(yōu)化又會涉及不同領域的算法推理實現(xiàn)環(huán)節(jié)及實現(xiàn)步驟的編碼過程。
從產(chǎn)品的生命周期來看,算法產(chǎn)品的開發(fā)驗證、測試上線、監(jiān)控優(yōu)化形成了一個閉環(huán),每一環(huán)節(jié)中都存在著不斷的調(diào)整優(yōu)化,甚至涉及具體實現(xiàn)算法的重新構造。算法模型通過不斷試錯迭代,循環(huán)修正當前算法對場景變遷刻畫不充分、不到位的地方,不斷化解場景與數(shù)據(jù)的關聯(lián)度、適配度不足的問題。因此,智能化算法金融業(yè)務產(chǎn)品往往能夠自動做出更精確有利的金融決策,提升金融資源利用效率,提高服務質(zhì)量,增強客戶的差異化競爭能力,增加業(yè)務經(jīng)營的商業(yè)價值。
以風控類的算法產(chǎn)品為例,金融機構對公客戶的授信審批催生了對風控算法產(chǎn)品的需求,產(chǎn)品建設的整個過程中,需要整合企業(yè)內(nèi)外部數(shù)據(jù)并提取風險相關特征,利用機器學習算法進行訓練分析,從業(yè)務穩(wěn)定性、還款能力、還款意愿、信用歷史等方面全面評估企業(yè)的信用風險,并將算法結果應用于授信審批過程,以降低業(yè)務審批的邊際成本。在風控算法產(chǎn)品上線使用后,仍需要對其表現(xiàn)持續(xù)監(jiān)控和驗證,評估實際運行效果,進行更新優(yōu)化及再開發(fā),修正其中存在的缺陷,以確保算法模型的有效性和滿足監(jiān)管合規(guī)要求。
算法金融產(chǎn)品的全流程數(shù)據(jù)算法驅(qū)動、模型不斷調(diào)整優(yōu)化等特點使得其與傳統(tǒng)人工決策相比具有較明顯的優(yōu)勢:算法金融產(chǎn)品利用大量數(shù)據(jù)對算法模型進行訓練,由模型自動生成分析結果,在數(shù)據(jù)信息發(fā)生變化時會及時調(diào)整,給出新的最優(yōu)結果;人工決策主要基于業(yè)務經(jīng)驗,對長期的業(yè)務實踐進行歸納總結,得出一些事件發(fā)生的規(guī)律,對變化的捕捉相對滯后。相比之下,算法金融產(chǎn)品在對客觀特征的發(fā)現(xiàn)識別、對未知的判斷預測上有更高的精準度。同時,算法金融產(chǎn)品基于強大的數(shù)據(jù)處理能力,在處理問題尤其是處理大量問題時的效率要明顯優(yōu)于人工。在很多情形下,算法金融產(chǎn)品所起到的服務效果往往需要許多相同種類的人工服務才能達到。
本文版權歸原作者所有,如有侵權,請聯(lián)系刪除。