陳強(qiáng) 主講
北京, 1月11-15日
Now or Never! (詳見(jiàn)頁(yè)底)
雖然機(jī)器學(xué)習(xí)源于計(jì)算機(jī)科學(xué)的人工智能領(lǐng)域,但在未來(lái)有望成為一種廣泛應(yīng)用于各行業(yè)的通用技術(shù)。比如,2018年9月,麻省理工學(xué)院名譽(yù)校長(zhǎng) Eric Grimson 在接受采訪(fǎng)時(shí)表示,機(jī)器學(xué)習(xí)在未來(lái) “會(huì)變得像使用Word、PowerPoint 或者 Excel 一樣”。
既然如此,機(jī)器學(xué)習(xí)與傳統(tǒng)的統(tǒng)計(jì)學(xué),以及廣泛用于社會(huì)科學(xué)的計(jì)量經(jīng)濟(jì)學(xué)有何關(guān)系呢?下面從研究目標(biāo)與方法論的區(qū)別,以及學(xué)科間融合的角度進(jìn)行闡述。
研究目標(biāo)的不同
從表面上看,機(jī)器學(xué)習(xí)通常使用大數(shù)據(jù)(樣本容量很大或變量很多),而統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)則一般樣本較小。但這種區(qū)別正在日益模糊,因?yàn)榻y(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)也越來(lái)越多地使用大數(shù)據(jù)。
在本質(zhì)上,這三個(gè)學(xué)科的區(qū)別在于其研究目的有所不同。機(jī)器學(xué)習(xí)的主要目的在于 “預(yù)測(cè)”(prediction),統(tǒng)計(jì)學(xué)側(cè)重于 “統(tǒng)計(jì)建模與推斷”(statistically modeling and inference),而計(jì)量經(jīng)濟(jì)學(xué)則著重于 “因果推斷”(causal inference),參見(jiàn)下表。
機(jī)器學(xué)習(xí)的主要目標(biāo)在于預(yù)測(cè),即根據(jù)
在機(jī)器學(xué)習(xí)的模型中,即使有
反之,計(jì)量經(jīng)濟(jì)學(xué)的主要目標(biāo)則在于 “因果推斷”(causal inferences),即推斷
然后,將所有精力集中于得到未知參數(shù)
顯然,由于計(jì)量經(jīng)濟(jì)學(xué)對(duì)于函數(shù)
方法論的區(qū)別
在方法論上,機(jī)器學(xué)習(xí)主要使用 “最優(yōu)化”(optimization)方法,通常需要最小化某個(gè) “目標(biāo)函數(shù)”(objective function)或 “損失函數(shù)”(loss function)。由于此最優(yōu)化問(wèn)題一般沒(méi)有“解析解”(closed-form solution),故通常需要通過(guò)某種迭代的 “算法”(algorithm)尋找近似的 “數(shù)值解”(numerical solution)。
由于機(jī)器學(xué)習(xí)的目標(biāo)是讓預(yù)測(cè)結(jié)果
另一方面,對(duì)于統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)而言,雖然也經(jīng)常作最優(yōu)化,但由于關(guān)注的重點(diǎn)為不可觀(guān)測(cè)的參數(shù)
由此可知,由于研究目標(biāo)的不同,機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)在研究范式上有著本質(zhì)的區(qū)別,參見(jiàn)下圖。
一般認(rèn)為機(jī)器學(xué)習(xí)使用了大量的統(tǒng)計(jì)方法,但事實(shí)上機(jī)器學(xué)習(xí)幾乎從不進(jìn)行統(tǒng)計(jì)推斷,而只是使用統(tǒng)計(jì)方法來(lái)估計(jì)函數(shù) 。由于機(jī)器學(xué)習(xí)可以直接比較預(yù)測(cè)值與實(shí)際值,故無(wú)須使用高深的漸近理論(依賴(lài)于大數(shù)定律與中心極限定理等)來(lái)證明預(yù)測(cè)效果;在這個(gè)意義上,機(jī)器學(xué)習(xí)反而比統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)更為簡(jiǎn)單!
學(xué)科間的融合
以上強(qiáng)調(diào)了機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)及計(jì)量經(jīng)濟(jì)學(xué)的區(qū)別。事實(shí)上,這些學(xué)科也存在密切的聯(lián)系,互相借鑒。比如,2011年圖靈獎(jiǎng)得主、人工智能先驅(qū) Judea Pearl 即主張將因果推斷引入人工智能領(lǐng)域,也成為越來(lái)越多研究者的共識(shí)。既然因果推斷是人類(lèi)智能的重要體現(xiàn),未來(lái)的 “機(jī)器人” 怎能缺乏因果推斷的能力呢?
當(dāng)然,業(yè)界人士可能認(rèn)為,做商業(yè)預(yù)測(cè)只需要變量之間的相關(guān)關(guān)系即可,并不一定需要因果關(guān)系。比如,你看到街上有人帶傘,就可預(yù)測(cè)可能下雨;但人們帶傘顯然并不導(dǎo)致下雨。但事實(shí)上,許多商業(yè)問(wèn)題都涉及因果效應(yīng)。
例如,你想預(yù)測(cè)某個(gè)公司政策的效應(yīng),比如將排名第一的搜索結(jié)果放到排名第三,將會(huì)對(duì)其點(diǎn)擊量有多少影響?此預(yù)測(cè)實(shí)際上是在估計(jì)該公司政策的因果效應(yīng)。
又比如,假設(shè)你收集了關(guān)于賓館房?jī)r(jià)與入住率的數(shù)據(jù),想預(yù)測(cè)賓館房?jī)r(jià)對(duì)入住率的影響。如果直接根據(jù)相關(guān)關(guān)系進(jìn)行預(yù)測(cè),會(huì)發(fā)現(xiàn)賓館入住率與房?jī)r(jià)顯著正相關(guān)。但這并非因果關(guān)系,因?yàn)樵诼糜瓮荆e館爆滿(mǎn)而房?jī)r(jià)也很高。顯然,如果根據(jù)機(jī)器學(xué)習(xí)的預(yù)測(cè)結(jié)果,建議賓館為了增加入住率而提高房?jī)r(jià),無(wú)疑將南轅北轍。因此,對(duì)于考察公司政策的效應(yīng)這一類(lèi)重要預(yù)測(cè)問(wèn)題,其實(shí)本質(zhì)上也在做因果推斷。
另一方面,因果推斷也離不開(kāi)預(yù)測(cè)。事實(shí)上,因果推斷的本質(zhì)上恰恰是在做預(yù)測(cè)。比如,某地區(qū)實(shí)施了扶貧政策,你想評(píng)估此政策的效應(yīng)。此時(shí),該地區(qū)扶貧之后的狀態(tài)可以度量,但最關(guān)鍵的信息卻不可觀(guān)測(cè),即此地區(qū)如果沒(méi)有實(shí)施扶貧會(huì)怎么樣?對(duì)于這種 “反事實(shí)結(jié)果”(counterfactual outcome),就只能進(jìn)行估計(jì)或預(yù)測(cè)。這也正是 “魯賓因果模型”(Rubin's Causal Model)的核心思想。由于機(jī)器學(xué)習(xí)擅長(zhǎng)作預(yù)測(cè),故機(jī)器學(xué)習(xí)方法在因果推斷方面也大有用武之地。
目前,機(jī)器學(xué)習(xí)的方法正在加速地進(jìn)入統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)。可以預(yù)見(jiàn),這三個(gè)學(xué)科之間的相互交融與借鑒將進(jìn)一步加強(qiáng)。
參考文獻(xiàn)
陳強(qiáng),《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,第2版,高等教育出版社,2014年
陳強(qiáng),《計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,高等教育出版社,2015年
陳強(qiáng),《機(jī)器學(xué)習(xí)及R應(yīng)用》,高等教育出版社,2020年,即將出版
Upcoming Events
現(xiàn)在的 “風(fēng)口” 是什么?那就是機(jī)器學(xué)習(xí)!得機(jī)器學(xué)習(xí)者,得未來(lái)……
聯(lián)系客服