回歸問(wèn)題的典型性能度量是均方根誤差(RMSE:Root Mean Square Error)。如下公式。
- m為是你計(jì)算RMSE的數(shù)據(jù)集中instance的數(shù)量。
- x(i)是第i個(gè)實(shí)例的特征值向量 ,y(i)是其label(期望的模型輸出)。如下:
- X是包含了所有實(shí)例的特征值(不包含label)的矩陣。每行代表一個(gè)實(shí)例,并且每行等于x(i)向量的轉(zhuǎn)置:(x(i))T 。 下圖矩陣中的第一行為2中向量的轉(zhuǎn)置(列向量變?yōu)樾邢蛄浚?br>
- h是預(yù)測(cè)函數(shù),當(dāng)輸入是某實(shí)例的特征向量x(i) ,應(yīng)用函數(shù)之后,結(jié)果為?(i)=h(x(i)). ?也叫作y-hat. 比如:對(duì)第一個(gè)實(shí)例應(yīng)用函數(shù)h后結(jié)果為158400,即?(1)=h(x(1))=158400。那么預(yù)測(cè)誤差/錯(cuò)誤為?(1)-y(1) = 158400 - 156400 = 2000.
- RMSE(X,h) 是在數(shù)據(jù)集X上應(yīng)用于函數(shù)h計(jì)算的cost function。
以上,我們使用小寫(xiě)斜體表示標(biāo)量(m,y(i)),函數(shù)名(h)。小寫(xiě)粗體表示向量(x(i)). 大寫(xiě)粗體表示矩陣(X).
還有一種度量方法為: Mean Absolute Error. 理解起來(lái)也比較簡(jiǎn)單。
下面是一張圖,通過(guò)線性關(guān)系生動(dòng)解釋了RMSE。4個(gè)黑色的點(diǎn)是數(shù)據(jù)集(包括標(biāo)簽),藍(lán)色的線是我們的預(yù)測(cè)函數(shù)h: ?=2.50x-2。從而可以求出RMSE為0.707.與之前不同的是這里取m為3(m-1)而不是4。
結(jié)論: RMSE越小,說(shuō)明模型越fit數(shù)據(jù)。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。