《中國(guó)科學(xué)院大學(xué)2012年《機(jī)器學(xué)習(xí)》試卷及其答案》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《中國(guó)科學(xué)院大學(xué)2012年《機(jī)器學(xué)習(xí)》試卷及其答案(5頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、中國(guó)科學(xué)院大學(xué) 20139310班中國(guó)科學(xué)院大學(xué)2012年機(jī)器學(xué)習(xí)試卷及其答案任課教師:卿來(lái)云一、基礎(chǔ)題(共36分)1、請(qǐng)描述極大似然估計(jì) MLE和最大后驗(yàn)估計(jì) MAP之間的區(qū)別。請(qǐng)解釋為什么 MLE比MAP 更容易過(guò)擬合。(10分)MLE :取似然函數(shù)最大時(shí)的參數(shù)值為該參數(shù)的估計(jì)值,ymie=argmaxp(x|y) ; MAP :取后驗(yàn)函數(shù)(似然與先驗(yàn)之積)最大時(shí)的參數(shù)值為該參數(shù)的估計(jì)值,ymap=argmaxp(x|y)p(y)。因?yàn)镸LE只考慮訓(xùn)練數(shù)據(jù)擬合程度沒(méi)有考慮先驗(yàn)知識(shí),把錯(cuò)誤點(diǎn)也加入模型中,導(dǎo)致過(guò)擬合。2、 在年度百花獎(jiǎng)評(píng)獎(jiǎng)揭曉之前,一位教授問(wèn)80個(gè)電影系的學(xué)生,誰(shuí)將分別獲得8
2、個(gè)獎(jiǎng)項(xiàng)(如 最佳導(dǎo)演、最佳男女主角等)。評(píng)獎(jiǎng)結(jié)果揭曉后,該教授計(jì)算每個(gè)學(xué)生的猜中率,同時(shí)也計(jì)算了所有80個(gè)學(xué)生投票的結(jié)果。他發(fā)現(xiàn)所有人投票結(jié)果幾乎比任何一個(gè)學(xué)生的結(jié)果正確率 都高。這種提高是偶然的嗎?請(qǐng)解釋原因。(10分)設(shè)x為第i個(gè)學(xué)生的猜中率(要么 0要么1) xBer( 0 ),E(x)= 0 ,V(x)= 0 (1- 0 )mean(x)N( 0 , 0 (1- 0 )/N),E(mean(x)=0 ,V(mean(x)=0 (1- 0 )/N-(N/2)*log(22)-冕(yi-Jxi)2/2 % 其損失為殘差平方和,放大了誤差,對(duì)離群點(diǎn)敏感。因此使用Laplace(或Studen
3、t)線(xiàn)性回歸模型能對(duì)噪聲魯棒。三、SVM分類(lèi)。(第15題各4分,第6題5分,共25分)下圖為采用不同核函數(shù)或不同的松弛因子得到的SVM決策邊界。但粗心的實(shí)驗(yàn)者忘記記錄每個(gè)圖形對(duì)應(yīng)的模型和參數(shù)了。請(qǐng)你幫忙給下面每個(gè)模型標(biāo)出正確的圖形。Ihf-eix* A1* A 1 i -i* *、 墓沖上旦巧cip -|i-r| |*答:1.c 2.b 3.d 4.a 5.e6、考慮帶松弛因子的線(xiàn)性 SVM分類(lèi)器:it-7.也;Wf 兇 Yr WJF面有一些關(guān)于某些變量隨參數(shù)C的增大而變化的表述。如果表述總是成立,標(biāo)示如果表述總是不成立,標(biāo)示否”;如果表述的正確性取決于C增大的具體情況,標(biāo)示是”;不一(1)
4、w0不會(huì)增大(不一定)|w|增大(不一定)(3)|w|不會(huì)減小 (是)(4)會(huì)有更多的訓(xùn)練樣本被分錯(cuò)(否)間隔(Margin)不會(huì)增大(是)四、一個(gè)初學(xué)機(jī)器學(xué)習(xí)的朋友對(duì)房?jī)r(jià)進(jìn)行預(yù)測(cè)。他在一個(gè)N=1000個(gè)房?jī)r(jià)數(shù)據(jù)的數(shù)據(jù)集上匹配了一個(gè)有533個(gè)參數(shù)的模型,該模型能解釋數(shù)據(jù)集上99%的變化。1、請(qǐng)問(wèn)該模型能很好地預(yù)測(cè)來(lái)年的房?jī)r(jià)嗎?簡(jiǎn)單解釋原因。(5分)2、如果上述模型不能很好預(yù)測(cè)新的房?jī)r(jià),請(qǐng)你設(shè)計(jì)一個(gè)合適的模型,給出模型的參數(shù)估計(jì),并解釋你的模型為什么是合理的。(10分)答:1不能。因?yàn)槟P蛥?shù)過(guò)多太復(fù)雜,訓(xùn)練集上擬合太好,把錯(cuò)誤點(diǎn)也考慮進(jìn)來(lái),因此發(fā) 生了過(guò)擬合,預(yù)測(cè)誤差較大。2.對(duì)之進(jìn)行 L1正則,即Lasso回歸。yN(wTx,知wLap(0,t)L( 0 )=C-工(yl-w) 2/2 2-工 |wi|/b NLL=RSS+入 |w|通過(guò)調(diào)節(jié)L1正則系數(shù)入大小避免模型過(guò)擬合,而且估計(jì)w參數(shù)的同時(shí)進(jìn)行了特征選擇, 得系數(shù)w盡可能多的為0,簡(jiǎn)化了模型。第5頁(yè)共4頁(yè)