精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)的區(qū)別與聯(lián)系

陳強(qiáng)  主講

北京, 1月11-15日

Now or Never! (詳見(jiàn)頁(yè)底)

雖然機(jī)器學(xué)習(xí)源于計(jì)算機(jī)科學(xué)的人工智能領(lǐng)域,但在未來(lái)有望成為一種廣泛應(yīng)用于各行業(yè)的通用技術(shù)。比如,2018年9月,麻省理工學(xué)院名譽(yù)校長(zhǎng) Eric Grimson 在接受采訪(fǎng)時(shí)表示,機(jī)器學(xué)習(xí)在未來(lái) “會(huì)變得像使用Word、PowerPoint 或者 Excel 一樣”。

既然如此,機(jī)器學(xué)習(xí)與傳統(tǒng)的統(tǒng)計(jì)學(xué),以及廣泛用于社會(huì)科學(xué)的計(jì)量經(jīng)濟(jì)學(xué)有何關(guān)系呢?下面從研究目標(biāo)與方法論的區(qū)別,以及學(xué)科間融合的角度進(jìn)行闡述。

研究目標(biāo)的不同

從表面上看,機(jī)器學(xué)習(xí)通常使用大數(shù)據(jù)(樣本容量很大或變量很多),而統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)則一般樣本較小。但這種區(qū)別正在日益模糊,因?yàn)榻y(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)也越來(lái)越多地使用大數(shù)據(jù)。

在本質(zhì)上,這三個(gè)學(xué)科的區(qū)別在于其研究目的有所不同。機(jī)器學(xué)習(xí)的主要目的在于 “預(yù)測(cè)”(prediction),統(tǒng)計(jì)學(xué)側(cè)重于 “統(tǒng)計(jì)建模與推斷”(statistically modeling and inference),而計(jì)量經(jīng)濟(jì)學(xué)則著重于 “因果推斷”(causal inference),參見(jiàn)下表。

機(jī)器學(xué)習(xí)的主要目標(biāo)在于預(yù)測(cè),即根據(jù) 

 來(lái)預(yù)測(cè) 
。為達(dá)到此目的,可以使用任何函數(shù) 
,甚至是難以解釋的黑箱方法(比如神經(jīng)網(wǎng)絡(luò));只要預(yù)測(cè)結(jié)果
接近
就好。因此,機(jī)器學(xué)習(xí)方法的 “可解釋性”(interpretability, explainability)一般比較差。

在機(jī)器學(xué)習(xí)的模型中,即使有 

,也只是作為預(yù)測(cè)的中間手段與橋梁而已。機(jī)器學(xué)習(xí)的關(guān)注重點(diǎn)就是
,幾乎完全生活在
 的世界里,成功與否就看
 的預(yù)測(cè)效果。

反之,計(jì)量經(jīng)濟(jì)學(xué)的主要目標(biāo)則在于 “因果推斷”(causal inferences),即推斷

 對(duì)
 的因果作用。為了識(shí)別并便于解釋此因果關(guān)系,經(jīng)濟(jì)學(xué)家通常需要對(duì)
 的函數(shù)形式作很強(qiáng)的假定,比如假設(shè)線(xiàn)性回歸模型(線(xiàn)性模型最容易解釋其參數(shù) 
 的含義):

然后,將所有精力集中于得到未知參數(shù)

 的估計(jì)量
,并針對(duì)
 進(jìn)行統(tǒng)計(jì)推斷(點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)等)。總之,計(jì)量經(jīng)濟(jì)學(xué)關(guān)注的重點(diǎn)為
,幾乎總是生活在
 的世界里。事實(shí)上,大多數(shù)實(shí)證論文只是為了說(shuō)明,
具有統(tǒng)計(jì)與經(jīng)濟(jì)的顯著性。

顯然,由于計(jì)量經(jīng)濟(jì)學(xué)對(duì)于函數(shù)

 的形式作了較強(qiáng)假定,可能與現(xiàn)實(shí)不符,故其預(yù)測(cè)效果一般并不理想(通常的實(shí)證研究也不作預(yù)測(cè))。另一方面,對(duì)于統(tǒng)計(jì)學(xué)而言,也十分注重對(duì)于
 的統(tǒng)計(jì)推斷,但所建模型可能只是相關(guān)關(guān)系,而不像計(jì)量經(jīng)濟(jì)學(xué)那樣專(zhuān)注于因果關(guān)系。

方法論的區(qū)別

在方法論上,機(jī)器學(xué)習(xí)主要使用 “最優(yōu)化”(optimization)方法,通常需要最小化某個(gè) “目標(biāo)函數(shù)”(objective function)或 “損失函數(shù)”(loss function)。由于此最優(yōu)化問(wèn)題一般沒(méi)有“解析解”(closed-form solution),故通常需要通過(guò)某種迭代的 “算法”(algorithm)尋找近似的 “數(shù)值解”(numerical solution)。

由于機(jī)器學(xué)習(xí)的目標(biāo)是讓預(yù)測(cè)結(jié)果 

盡量接近
,而
 可以觀(guān)測(cè),故度量機(jī)器學(xué)習(xí)的效果非常簡(jiǎn)單,直接比較
 與
 的接近程度即可(比如,均方誤差、預(yù)測(cè)錯(cuò)誤率等),并不需要使用漸近理論。

另一方面,對(duì)于統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)而言,雖然也經(jīng)常作最優(yōu)化,但由于關(guān)注的重點(diǎn)為不可觀(guān)測(cè)的參數(shù)

,故在估計(jì)出
 之后,無(wú)法直接比較
 與
 的接近程度,而只能使用概率統(tǒng)計(jì)的 “漸近理論”(asymptotics),也稱(chēng)為 “大樣本理論”(large sample theory),證明當(dāng)樣本容量趨向無(wú)窮大(
)時(shí),估計(jì)量
 會(huì)(依概率)收斂到真實(shí)參數(shù)
,以及
 服從漸近正態(tài)分布等性質(zhì)(以便進(jìn)行統(tǒng)計(jì)推斷);并輔之以小樣本的 “蒙特卡洛模擬”(Monte Carlo simulation)進(jìn)行驗(yàn)證。

由此可知,由于研究目標(biāo)的不同,機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)在研究范式上有著本質(zhì)的區(qū)別,參見(jiàn)下圖。

一般認(rèn)為機(jī)器學(xué)習(xí)使用了大量的統(tǒng)計(jì)方法,但事實(shí)上機(jī)器學(xué)習(xí)幾乎從不進(jìn)行統(tǒng)計(jì)推斷,而只是使用統(tǒng)計(jì)方法來(lái)估計(jì)函數(shù) 。由于機(jī)器學(xué)習(xí)可以直接比較預(yù)測(cè)值與實(shí)際值,故無(wú)須使用高深的漸近理論(依賴(lài)于大數(shù)定律與中心極限定理等)來(lái)證明預(yù)測(cè)效果;在這個(gè)意義上,機(jī)器學(xué)習(xí)反而比統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)更為簡(jiǎn)單!       

學(xué)科間的融合

以上強(qiáng)調(diào)了機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)及計(jì)量經(jīng)濟(jì)學(xué)的區(qū)別。事實(shí)上,這些學(xué)科也存在密切的聯(lián)系,互相借鑒。比如,2011年圖靈獎(jiǎng)得主、人工智能先驅(qū) Judea Pearl 即主張將因果推斷引入人工智能領(lǐng)域,也成為越來(lái)越多研究者的共識(shí)。既然因果推斷是人類(lèi)智能的重要體現(xiàn),未來(lái)的 “機(jī)器人” 怎能缺乏因果推斷的能力呢?

當(dāng)然,業(yè)界人士可能認(rèn)為,做商業(yè)預(yù)測(cè)只需要變量之間的相關(guān)關(guān)系即可,并不一定需要因果關(guān)系。比如,你看到街上有人帶傘,就可預(yù)測(cè)可能下雨;但人們帶傘顯然并不導(dǎo)致下雨。但事實(shí)上,許多商業(yè)問(wèn)題都涉及因果效應(yīng)。

例如,你想預(yù)測(cè)某個(gè)公司政策的效應(yīng),比如將排名第一的搜索結(jié)果放到排名第三,將會(huì)對(duì)其點(diǎn)擊量有多少影響?此預(yù)測(cè)實(shí)際上是在估計(jì)該公司政策的因果效應(yīng)。

又比如,假設(shè)你收集了關(guān)于賓館房?jī)r(jià)與入住率的數(shù)據(jù),想預(yù)測(cè)賓館房?jī)r(jià)對(duì)入住率的影響。如果直接根據(jù)相關(guān)關(guān)系進(jìn)行預(yù)測(cè),會(huì)發(fā)現(xiàn)賓館入住率與房?jī)r(jià)顯著正相關(guān)。但這并非因果關(guān)系,因?yàn)樵诼糜瓮荆e館爆滿(mǎn)而房?jī)r(jià)也很高。顯然,如果根據(jù)機(jī)器學(xué)習(xí)的預(yù)測(cè)結(jié)果,建議賓館為了增加入住率而提高房?jī)r(jià),無(wú)疑將南轅北轍。因此,對(duì)于考察公司政策的效應(yīng)這一類(lèi)重要預(yù)測(cè)問(wèn)題,其實(shí)本質(zhì)上也在做因果推斷。

另一方面,因果推斷也離不開(kāi)預(yù)測(cè)。事實(shí)上,因果推斷的本質(zhì)上恰恰是在做預(yù)測(cè)。比如,某地區(qū)實(shí)施了扶貧政策,你想評(píng)估此政策的效應(yīng)。此時(shí),該地區(qū)扶貧之后的狀態(tài)可以度量,但最關(guān)鍵的信息卻不可觀(guān)測(cè),即此地區(qū)如果沒(méi)有實(shí)施扶貧會(huì)怎么樣?對(duì)于這種 “反事實(shí)結(jié)果”(counterfactual outcome),就只能進(jìn)行估計(jì)或預(yù)測(cè)。這也正是 “魯賓因果模型”(Rubin's Causal Model)的核心思想。由于機(jī)器學(xué)習(xí)擅長(zhǎng)作預(yù)測(cè),故機(jī)器學(xué)習(xí)方法在因果推斷方面也大有用武之地。

目前,機(jī)器學(xué)習(xí)的方法正在加速地進(jìn)入統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)。可以預(yù)見(jiàn),這三個(gè)學(xué)科之間的相互交融與借鑒將進(jìn)一步加強(qiáng)。

參考文獻(xiàn)

陳強(qiáng),《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,第2版,高等教育出版社,2014年

陳強(qiáng),《計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,高等教育出版社,2015年

陳強(qiáng),《機(jī)器學(xué)習(xí)及R應(yīng)用》,高等教育出版社,2020年,即將出版

Upcoming Events   

 
 

現(xiàn)在的 “風(fēng)口” 是什么?那就是機(jī)器學(xué)習(xí)!得機(jī)器學(xué)習(xí)者,得未來(lái)……

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
當(dāng)計(jì)量經(jīng)濟(jì)學(xué)遭遇機(jī)器學(xué)習(xí)(二)
“經(jīng)濟(jì)學(xué) 機(jī)器學(xué)習(xí) 計(jì)算”我們整理了入門(mén)綜述、案例和代碼(人大校內(nèi)可訪(fǎng)問(wèn))
伍德里奇教授大談?dòng)?jì)量經(jīng)濟(jì)學(xué)的現(xiàn)狀與未來(lái), 絕對(duì)夠刺激, 夠前沿, 夠具啟發(fā)性!
獨(dú)家 | 一文讀懂統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)的本質(zhì)區(qū)別(附案例)
一場(chǎng)因果革命,Judea Pearl最新力作《為什么》中文版發(fā)布
Nature封面:機(jī)器學(xué)習(xí)攜手衛(wèi)星影像,理解電力設(shè)施與經(jīng)濟(jì)財(cái)富的因果關(guān)系
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 驻马店市| 紫阳县| 巴林左旗| 开阳县| 敦煌市| 韶山市| 桓仁| 运城市| 崇阳县| 福海县| 乌审旗| 分宜县| 曲水县| 奎屯市| 渑池县| 叶城县| 太谷县| 兰西县| 铜陵市| 池州市| 浠水县| 醴陵市| 佛冈县| 诸暨市| 乐清市| 宁化县| 灌南县| 临泉县| 嵊州市| 湟源县| 宝鸡市| 易门县| 阜南县| 镇原县| 莱西市| 德化县| 湾仔区| 卓尼县| 北票市| 社会| 读书|