數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析課件
《數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析課件(80頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、2022-5-161數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析回歸分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容實(shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問(wèn)題。、掌握用數(shù)學(xué)軟件求解回歸分析問(wèn)題。1、直觀了解回歸分析基本內(nèi)容。、直觀了解回歸分析基本內(nèi)容。1 1、回歸分析的基本理論回歸分析的基本理論。3 3、實(shí)驗(yàn)作業(yè)。實(shí)驗(yàn)作業(yè)。2、用數(shù)學(xué)軟件求解回歸分析問(wèn)題。用數(shù)學(xué)軟件求解回歸分析問(wèn)題。2022-5-163回歸分析回歸分析數(shù)學(xué)模型及定義數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)模型參數(shù)估計(jì)* *檢驗(yàn)、預(yù)測(cè)與控制檢驗(yàn)、預(yù)測(cè)與控制可線性化的一元非線可線性化的一元非線性回歸(曲線回歸性回歸(曲線回歸)數(shù)學(xué)模型及定義數(shù)學(xué)模型及定義*模型參
2、數(shù)估計(jì)模型參數(shù)估計(jì)*多元線性回歸中的多元線性回歸中的檢驗(yàn)與預(yù)測(cè)檢驗(yàn)與預(yù)測(cè)逐步回歸分析逐步回歸分析2022-5-164一、數(shù)學(xué)模型一、數(shù)學(xué)模型例例1 測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:身高143145146147149150153154155156157158159160162164腿長(zhǎng)8885889192939395969897969899100102以身高x為橫坐標(biāo),以腿長(zhǎng)y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.1401451501551601658486889092949698100102散點(diǎn)圖xy102022-5-165 一般地,稱由xy10確定的模型為一一元
3、元線線性性回回歸歸模模型型,記為 210, 0DExy固定的未知參數(shù)0、1稱為回歸系數(shù),自變量 x 也稱為回歸變量.一元線性回歸分析的主要任務(wù)主要任務(wù)是:1、用試驗(yàn)值(樣本值)對(duì)0、1和作點(diǎn)估計(jì);2、對(duì)回歸系數(shù)0、1作假設(shè)檢驗(yàn); 3、在 x=0 x處對(duì) y 作預(yù)測(cè),對(duì) y 作區(qū)間估計(jì).xY10,稱為 y 對(duì)對(duì) x的的回回歸歸直直線線方方程程.返回返回2022-5-166二、模型參數(shù)估計(jì)二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)、回歸系數(shù)的最小二乘估計(jì)有 n 組獨(dú)立觀測(cè)值, (x1,y1) , (x2,y2) , (xn,yn) 設(shè) 相互獨(dú)立且,niiiiDEnixy., , 0,.,2 , 1
4、,21210 記 niiiniixyQQ12101210),(最小二乘法最小二乘法就是選擇0和1的估計(jì)0,1使得 ),(min),(10,1010QQ2022-5-1672、2的的無(wú)無(wú)偏偏估估計(jì)計(jì)記 niniiiiieyyxyQQ11221010)(),(稱 Qe為殘殘差差平平方方和和或剩剩余余平平方方和和. 2的的無(wú)無(wú)偏偏估估計(jì)計(jì)為 )2(2nQee稱2e為剩剩余余方方差差(殘殘差差的的方方差差) , 2e分別與0、1獨(dú)立 。 e稱為剩剩余余標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差.返回返回2022-5-168三、檢驗(yàn)、預(yù)測(cè)與控制三、檢驗(yàn)、預(yù)測(cè)與控制1、回歸方程的顯著性檢驗(yàn)、回歸方程的顯著性檢驗(yàn) 對(duì)回歸方程xY10的顯
5、著性檢驗(yàn),歸結(jié)為對(duì)假設(shè) 0:; 0:1110HH進(jìn)行檢驗(yàn).假設(shè)0:10H被拒絕,則回歸顯著,認(rèn)為 y 與 x存在線性關(guān)系,所求的線性回歸方程有意義;否則回歸不顯著,y 與 x 的關(guān)系不能用一元線性回歸模型來(lái)描述,所得的回歸方程也無(wú)意義.2022-5-169()F檢驗(yàn)法檢驗(yàn)法 當(dāng)0H成立時(shí), )2/( nQUFeF(1,n-2)其中 niiyyU12(回歸平方和)回歸平方和)故 F)2, 1 (1nF,拒絕0H,否則就接受0H. ()t檢驗(yàn)法檢驗(yàn)法niiniixxxnxxxL12212)(其中當(dāng)0H成立時(shí),exxLT1t(n-2)故)2(21ntT,拒絕0H,否則就接受0H.2022-5-161
6、0()r檢驗(yàn)法檢驗(yàn)法當(dāng)|r| r1-時(shí),拒絕 H0;否則就接受 H0.記 niniiiniiiyyxxyyxxr11221)()()(其中2, 121111nFnr2022-5-16112、回歸系數(shù)的置信區(qū)間、回歸系數(shù)的置信區(qū)間0和和1置信水平為置信水平為 1-的置信區(qū)間分別為的置信區(qū)間分別為 xxexxeLxnntLxnnt221022101)2(,1)2(和 xxexxeLntLnt/)2(,/)2(2112112的的置置信信水水平平為為 1-的的置置信信區(qū)區(qū)間間為為 )2(,)2(22221nQnQee2022-5-16123、預(yù)測(cè)與控制、預(yù)測(cè)與控制(1)預(yù)測(cè))預(yù)測(cè)用 y0的回歸值010
7、0 xy作為 y0的預(yù)測(cè)值的預(yù)測(cè)值.0y的置信水平為1的預(yù)測(cè)區(qū)間預(yù)測(cè)區(qū)間為 )(),(0000 xyxy其中xxeLxxnntx2021011)2()( 特 別 , 當(dāng) n 很 大 且 x0在x附 近 取 值 時(shí) ,y 的 置 信 水 平 為1的 預(yù)預(yù) 測(cè)測(cè) 區(qū)區(qū) 間間 近近 似似 為為 2121,uyuyee2022-5-1613(2)控制)控制要求:xy10的值以1的概率落在指定區(qū)間yy ,只要控制 x 滿足以下兩個(gè)不等式 yxyyxy )(,)(要求)(2xyy .若yxyyxy )(,)(分別有解x和x ,即yxyyxy )(,)(. 則xx ,就是所求的 x 的控制區(qū)間.返回返回20
8、22-5-1614四、可線性化的一元非線性回歸四、可線性化的一元非線性回歸 (曲線回歸)(曲線回歸)例例2 出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對(duì)耐火材料的侵蝕, 容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān) 系.對(duì)一鋼包作試驗(yàn),測(cè)得的數(shù)據(jù)列于下表:使用次數(shù)增大容積使用次數(shù)增大容積234567896.428.209.589.509.7010.009.939.991011121314151610.4910.5910.6010.8010.6010.9010.762022-5-161524681012141666.577.588.599.51010.511散點(diǎn)圖此即非線性回歸非線性回歸或曲線
9、回歸曲線回歸 問(wèn)題(需要配曲線)配曲線的一般方法是:配曲線的一般方法是:先對(duì)兩個(gè)變量 x 和 y 作 n 次試驗(yàn)觀察得niyxii,.,2 , 1),(畫(huà)出散點(diǎn)圖,根據(jù)散點(diǎn)圖確定須配曲線的類型.然后由 n 對(duì)試驗(yàn)數(shù)據(jù)確定每一類曲線的未知參數(shù) a 和 b.采用的方法是通過(guò)變量代換把非線性回歸化成線性回歸,即采用非線性回歸線性化的方法.2022-5-1616通常選擇的六類曲線如下:(1)雙雙曲曲線線xbay1(2)冪冪函函數(shù)數(shù)曲曲線線y=abx, 其中 x0,a0(3)指指數(shù)數(shù)曲曲線線 y=abxe其中參數(shù) a0.(4)倒倒指指數(shù)數(shù)曲曲線線 y=axbe/其中 a0,(5)對(duì)對(duì)數(shù)數(shù)曲曲線線 y=a
10、+blogx,x0(6)S 型型曲曲線線xbeay1返回返回解例2.由散點(diǎn)圖我們選配倒指數(shù)曲線y=axbe/根據(jù)線性化方法,算得4587. 2,1107. 1Ab由此 6789.11Aea最后得 xey1107. 16789.112022-5-1617一、數(shù)學(xué)模型及定義一、數(shù)學(xué)模型及定義一般稱 nICOVEXY2),(, 0)( 為高斯馬爾柯夫線性模型(k k 元線性回歸模型元線性回歸模型),并簡(jiǎn)記為),(2nIXY nyyY.1,nknnkkxxxxxxxxxX.1.1.1212222111211,k.10,n.21kkxxy.110稱為回回歸歸平平面面方方程程. 返回返回線性模型),(2n
11、IXY考慮的主要問(wèn)題是: (1)用試驗(yàn)值(樣本值)對(duì)未知參數(shù)和2作點(diǎn)估計(jì)和假設(shè)檢驗(yàn),從而建立 y 與kxxx,.,21之間的數(shù)量關(guān)系; (2)在,.,0022011kkxxxxxx處對(duì) y 的值作預(yù)測(cè)與控制,即對(duì) y 作區(qū)間估計(jì). 2022-5-1618二、模型參數(shù)估計(jì)二、模型參數(shù)估計(jì)1、對(duì)、對(duì)i和和2作估計(jì)作估計(jì)用最小二乘法求k,.,0的估計(jì)量:作離差平方和 niikkiixxyQ12110.選擇k,.,0使 Q 達(dá)到最小。解得估計(jì)值 YXXXTT1 得到的i代入回歸平面方程得: kkxxy.110稱為經(jīng)經(jīng)驗(yàn)驗(yàn)回回歸歸平平面面方方程程.i稱為經(jīng)經(jīng)驗(yàn)驗(yàn)回回歸歸系系數(shù)數(shù).注注意意 :服從 p+1
12、 維正態(tài)分 布,且為的無(wú)偏估 計(jì),協(xié)方差陣為C2. C=L-1=(cij), L=XX2022-5-16192、 多多 項(xiàng)項(xiàng) 式式 回回 歸歸設(shè)變量 x、Y 的回歸模型為 ppxxxY.2210其中 p 是已知的,), 2 , 1(pii是未知參數(shù),服從正態(tài)分布), 0(2N. 令iixx ,i=1,2,k 多項(xiàng)式回歸模型變?yōu)槎嘣€性回歸模型.返回返回 kkxxxY.2210稱為回回歸歸多多項(xiàng)項(xiàng)式式.上面的回歸模型稱為多多項(xiàng)項(xiàng)式式回回歸歸.2022-5-1620三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)1、線線性性模模型型和和回回歸歸系系數(shù)數(shù)的的檢檢驗(yàn)驗(yàn)假設(shè) 0.:100kH
13、 ()F檢驗(yàn)法檢驗(yàn)法()r檢驗(yàn)法檢驗(yàn)法定義eyyQUULUR為 y 與 x1,x2,.,xk的多多元元相相關(guān)關(guān)系系數(shù)數(shù)或復(fù)復(fù)相相關(guān)關(guān)系系數(shù)數(shù)。由于2211RRkknF,故用 F 和用 R檢驗(yàn)是等效的。當(dāng) H0成立時(shí),)1,()1/(/knkFknQkUFe如果 F F1-(k,n-k-1) ,則拒絕 H0,認(rèn)為 y 與 x1, xk之間顯著地有線性關(guān)系;否則就接受 H0,認(rèn)為 y 與 x1, xk之間線性關(guān)系不顯著.其中 niiyyU12(回回歸歸平平方方和和) niiieyyQ12)(殘差平方和)殘差平方和)2022-5-16212、預(yù)測(cè)、預(yù)測(cè)(1)點(diǎn)預(yù)測(cè))點(diǎn)預(yù)測(cè)求出回歸方程kkxxy.11
14、0,對(duì)于給定自變量的值kxx ,.,*1,用*110*.kkxxy來(lái)預(yù)測(cè)*110.kkxxy.稱* y為*y的點(diǎn)預(yù)測(cè).(2)區(qū)間預(yù)測(cè))區(qū)間預(yù)測(cè)y 的1的預(yù)測(cè)區(qū)間(置信)區(qū)間為),(21yy,其中) 1(1) 1(12/10022/1001kntxxcyykntxxcyykikjjiijekikjjiijeC=L-1=(cij), L=XX1knQee返回返回2022-5-1622四、逐步回歸分析四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個(gè)變量開(kāi)始,把變量逐個(gè)引入方程;
15、選擇“最優(yōu)”的回歸方程有以下幾種方法: “最優(yōu)最優(yōu)”的回歸方程的回歸方程就是包含所有對(duì)Y有影響的變量, 而不包含對(duì)Y影響不顯著的變量回歸方程。 以第四種方法,即逐步回歸分析法逐步回歸分析法在篩選變量方面較為理想.2022-5-1623 這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,又無(wú)顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法逐步回歸分析法的思想: 從一個(gè)自變量開(kāi)始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。 當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。 引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。 對(duì)于每一步都要進(jìn)行Y值檢驗(yàn),以確
16、保每次引入新的顯著性變量前回歸方程中只包含對(duì)Y作用顯著的變量。返回返回2022-5-16241、多元線性回歸、多元線性回歸2、多項(xiàng)式回歸、多項(xiàng)式回歸3、非線性回歸、非線性回歸4、逐步回歸、逐步回歸返回返回2022-5-1625多元線性回歸多元線性回歸 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.1212222111211nYYYY.21pb.101、確定回歸系數(shù)的點(diǎn)估計(jì)值:確定回歸系數(shù)的點(diǎn)估計(jì)值:ppxxy.110對(duì)一元線性回歸,取 p=1 即可2022-5-16263、畫(huà)出殘差及其置信區(qū)間:畫(huà)出殘差及其置信區(qū)間: rcoplot(r,rint)2、求回歸系數(shù)的
17、點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對(duì)應(yīng)的概率p置信區(qū)間 顯著性水平(缺省時(shí)為0.05) 相關(guān)系數(shù) r2越接近 1,說(shuō)明回歸方程越顯著; F F1-(k,n-k-1)時(shí)拒絕 H0,F(xiàn) 越大,說(shuō)明回歸方程越顯著; 與 F 對(duì)應(yīng)的概率 p時(shí)拒絕 H0,回歸模型成立.2022-5-1627例例1 解:解:1、輸入數(shù)據(jù):輸入數(shù)據(jù): x=143 145 146 147 149 150 153 154
18、 155 156 157 158 159 160 162 164; X=ones(16,1) x; Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;2、回歸分析及檢驗(yàn):回歸分析及檢驗(yàn): b,bint,r,rint,stats=regress(Y,X) b,bint,stats得結(jié)果:b = bint = -16.0730 -33.7071 1.5612 0.7194 0.6047 0.8340 stats = 0.9282 180.9531 0.0000即7194. 0,073.1610;0的置信區(qū)間為-33.7017,1.5612, 1
19、的置信區(qū)間為0.6047,0.834;r2=0.9282, F=180.9531, p=0.0000p0.05, 可知回歸模型 y=-16.073+0.7194x 成立.To MATLAB(liti11)2022-5-16283、殘差分析,作殘差圖:、殘差分析,作殘差圖: rcoplot(r,rint) 從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說(shuō)明回歸模型 y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn). 4、預(yù)測(cè)及作圖:、預(yù)測(cè)及作圖:z=b(1)+b(2)*x plot(x,Y,k+,x,z,r)24681
20、0121416-5-4-3-2-101234Residual Case Order PlotResidualsCase Number返回返回To MATLAB(liti12)2022-5-1629多多 項(xiàng)項(xiàng) 式式 回回 歸歸 (一)一元多項(xiàng)式回歸(一)一元多項(xiàng)式回歸 (1)確定多項(xiàng)式系數(shù)的命令:p,S=polyfit(x,y,m) 其中 x=(x1,x2,xn) ,y=(y1,y2,yn) ;p=(a1,a2,am+1)是多項(xiàng)式y(tǒng)=a1xm+a2xm-1+amx+am+1的系數(shù);S 是一個(gè)矩陣,用來(lái)估計(jì)預(yù)測(cè)誤差.(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:、回歸:y=a1
21、xm+a2xm-1+amx+am+12、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處 的預(yù) 測(cè)值Y; (2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得 的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1- alpha的置信區(qū)間Y DELTA;alpha缺省時(shí)為0.5.2022-5-1630 例例 2 觀測(cè)物體降落的距離s 與時(shí)間t 的關(guān)系,得到數(shù)據(jù)如下表,求s關(guān)于 t 的回歸方程2ctbtas.t (s)1/302/303/304/305/306/307/30s (cm)11.8615.67
22、20.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146.48法一法一 直接作二次多項(xiàng)式回歸:直接作二次多項(xiàng)式回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2)To MATLAB(liti21)1329. 98896.652946.48
23、92tts得回歸模型為 :2022-5-1631法二法二化為多元線性回歸:化為多元線性回歸:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,statsTo MATLAB(liti22)22946.4898896.651329. 9tts得回歸模型為 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r
24、)預(yù)測(cè)及作圖預(yù)測(cè)及作圖To MATLAB(liti23)2022-5-1632(二)多元二項(xiàng)式回歸(二)多元二項(xiàng)式回歸命令:rstool(x,y,model, alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量由下列 4 個(gè)模型中選擇 1 個(gè)(用字符串輸入,缺省時(shí)為線性模型): linear(線性):mmxxy 110 purequadratic(純二次): njjjjmmxxxy12110 interaction(交叉): mkjkjjkmmxxxxy1110 quadratic(完全二次): mkjkjjkmmxxxxy,1110 2022-5-1633 例例3 設(shè)某商品的需求量
25、與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù) 據(jù)如下,建立回歸模型,預(yù)測(cè)平均收入為1000、價(jià)格為6時(shí) 的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300價(jià)格5766875439選擇純二次模型,即 2222211122110 xxxxy法一法一 直接用多元二項(xiàng)式回歸:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y
26、,purequadratic)2022-5-1634 在畫(huà)面左下方的下拉式菜單中選”all”, 則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。 則畫(huà)面左邊的“Predicted Y”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測(cè)出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.2022-5-1635在Matlab工作區(qū)中輸入命令: beta, rmse得結(jié)果:beta = 110.5313 0.1464 -26.5709 -0.0001 1.8475 rmse = 4.5362故回歸模型為:222121
27、8475. 10001. 05709.261464. 05313.110 xxxxy剩余標(biāo)準(zhǔn)差為 4.5362, 說(shuō)明此回歸模型的顯著性較好.To MATLAB(liti31)2) (2nyysxy為剩余標(biāo)準(zhǔn)差,表示應(yīng)變量Y值對(duì)于回歸直線的離散程度。 2022-5-1636X=ones(10,1) x1 x2 (x1.2) (x2.2);b,bint,r,rint,stats=regress(y,X);b,stats結(jié)果為: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 0.9702 40.6656 0.0005法二法二To MATLA
28、B(liti32)返回返回 2222211122110 xxxxy將 化為多元線性回歸:2022-5-1637非線性回非線性回 歸歸 (1)確定回歸系數(shù)的命令: beta,r,J=nlinfit(x,y,model, beta0)(2)非線性回歸命令:nlintool(x,y,model, beta0,alpha)1、回歸:、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為 矩陣和n維列向量,對(duì)一元非線性回歸,x為n維列向量。mn2、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):Y,DELTA=nlpredci(model, x,be
29、ta,r,J)求nlinfit 或nlintool所得的回歸函數(shù)在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間Y DELTA.2022-5-1638例例 4 對(duì)第一節(jié)例2,求解如下:1、對(duì)將要擬合的非線性模型 y=axbe/,建立 m-文件 volum.m 如下: function yhat=volum(beta,x) yhat=beta(1)*exp(beta(2)./x);2、輸入數(shù)據(jù): x=2:16; y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76; beta0=8
30、 2;3、求回歸系數(shù): beta,r ,J=nlinfit(x,y,volum,beta0); beta得結(jié)果:beta = 11.6036 -1.0641即得回歸模型為:xey10641. 16036.11To MATLAB(liti41)2022-5-16394、預(yù)測(cè)及作圖: YY,delta=nlpredci(volum,x,beta,r ,J); plot(x,y,k+,x,YY,r)To MATLAB(liti42)2022-5-1640例例5 財(cái)政收入預(yù)測(cè)問(wèn)題:財(cái)政收入與國(guó)民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了1952-1981年的原始
31、數(shù)據(jù),試構(gòu)造預(yù)測(cè)模型。 解解 設(shè)國(guó)民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財(cái)政收入為y,設(shè)變量之間的關(guān)系為:y= ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。2022-5-16411 對(duì)回歸模型建立對(duì)回歸模型建立M文件文件model.m如下如下: function yy=model(beta0,X) a=beta0(1); b=beta0(2); c=beta0(3); d=beta0(4); e=beta0(5); f=beta0(6); x1=X(:,1); x2=X(:,2); x3=X(:,3);
32、 x4=X(:,4); x5=X(:,5); x6=X(:,6); yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6; 2022-5-16422. 主程序主程序liti6.m如下如下:X=598.00 349.00 461.00 57482.00 20729.00 44.00 . 2927.00 6862.00 1273.00 100072.0 43280.00 496.00;y=184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00 . 271.00 230.00 266.00 323.00 393.00
33、466.00 352.00 303.00 447.00 . 564.00 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00 . 890.00 826.00 810.0;beta0=0.50 -0.03 -0.60 0.01 -0.02 0.35;betafit = nlinfit(X,y,model,beta0)To MATLAB(liti6)2022-5-1643 betafit = 0.5243 -0.0294 -0.6304 0.0112 -0.0230 0.3658即y= 0.5243x1-0.0294x2-0.6304x3
34、+0.0112x4-0.0230 x5+0.3658x6結(jié)果為結(jié)果為:返返 回回2022-5-1644逐逐 步步 回回 歸歸逐步回歸的命令是: stepwise(x,y,inmodel,alpha) 運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:Stepwise Plot,Stepwise Table,Stepwise History. 在Stepwise Plot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間. Stepwise Table 窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對(duì)應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),
35、給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水平(缺省時(shí)為0.5)自變量數(shù)據(jù), 階矩陣mn因變量數(shù)據(jù), 階矩陣1n2022-5-1645例例6 水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、 x4 有關(guān),今測(cè)得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè) 線性模 型. 序號(hào)12345678910111213x17111117113122111110 x226295631525571315447406668x3615886917221842398x46052204733226442226341212y78.574.3104.387.695.9109.2102.772.593.1
36、115.983.8113.3109.41、數(shù)據(jù)輸入:、數(shù)據(jù)輸入:x1=7 1 11 11 7 11 3 1 2 21 1 11 10;x2=26 29 56 31 52 55 71 31 54 47 40 66 68;x3=6 15 8 8 6 9 17 22 18 4 23 9 8;x4=60 52 20 47 33 22 6 44 22 26 34 12 12;y=78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4;x=x1 x2 x3 x4;2022-5-16462、逐步回歸:、逐步回歸:(1)先在
37、初始模型中取全部自變量:)先在初始模型中取全部自變量: stepwise(x,y)得圖Stepwise Plot 和表Stepwise Table圖圖Stepwise Plot中四條直線都是虛中四條直線都是虛線,說(shuō)明模型的顯著性不好線,說(shuō)明模型的顯著性不好從表從表Stepwise Table中看出變中看出變量量x3和和x4的顯著性最差的顯著性最差.2022-5-1647(2)在圖)在圖Stepwise Plot中點(diǎn)擊直線中點(diǎn)擊直線3和直線和直線4,移去變量,移去變量x3和和x4移去變量移去變量x3和和x4后模型具有顯著性后模型具有顯著性. 雖然剩余標(biāo)準(zhǔn)差(雖然剩余標(biāo)準(zhǔn)差(RMSE)沒(méi))沒(méi)有太大
38、的變化,但是統(tǒng)計(jì)量有太大的變化,但是統(tǒng)計(jì)量F的的值明顯增大,因此新的回歸模型值明顯增大,因此新的回歸模型更好更好.To MATLAB(liti51)2022-5-1648(3)對(duì)變量)對(duì)變量y和和x1、x2作線性回歸:作線性回歸: X=ones(13,1) x1 x2; b=regress(y,X)得結(jié)果:b = 52.5773 1.4683 0.6623故最終模型為:y=52.5773+1.4683x1+0.6623x2To MATLAB(liti52)返回返回2022-5-16491、考察溫度x對(duì)產(chǎn)量y的影響,測(cè)得下列10組數(shù)據(jù):溫度()20253035404550556065產(chǎn)量(kg)
39、13.215.116.417.117.918.719.621.222.524.3求y關(guān)于x的線性回歸方程,檢驗(yàn)回歸效果是否顯著,并預(yù)測(cè)x=42時(shí)產(chǎn)量的估值及預(yù)測(cè)區(qū)間(置信度95%).2、某零件上有一段曲線,為了在程序控制機(jī)床上加工這一零件,需要求這段曲線的解析表達(dá)式,在曲線橫坐標(biāo)xi處測(cè)得縱坐標(biāo)yi共11對(duì)數(shù)據(jù)如下:xi02468101214161820yi0.62.04.47.511.817.123.331.239.649.761.7求這段曲線的縱坐標(biāo)y關(guān)于橫坐標(biāo)x的二次多項(xiàng)式回歸方程.2022-5-16503、 在研究化學(xué)動(dòng)力學(xué)反應(yīng)過(guò)程中,建立了一個(gè)反應(yīng)速度和反應(yīng)物含量的數(shù)學(xué)模型,形式為
40、34231253211xxxxxy其中51,是未知參數(shù),321,xxx是三種反應(yīng)物(氫,n 戊烷,異構(gòu)戊烷)的含量,y 是反應(yīng)速度.今測(cè)得一組數(shù)據(jù)如表 4,試由此確定參數(shù)51,,并給出置信區(qū)間.51,的參考值為(1,0.05, 0.02, 0.1, 2).序號(hào)反應(yīng)速度 y氫 x1n 戊烷 x2異構(gòu)戊烷 x318.554703001023.79285801034.8247030012040.024708012052.754708010614.391001901072.54100806584.3547019065913.0010030054108.50100300120110.0510080120
41、1211.3228530010133.132851901202022-5-16514、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長(zhǎng)而增加,現(xiàn)將一批混凝土作成12個(gè)試塊,記錄了養(yǎng)護(hù)日期x(日)及抗壓強(qiáng)度y(kg/cm2)的數(shù)據(jù):養(yǎng)護(hù)時(shí)間 x234579121417212856抗壓強(qiáng)度 y354247535965687376828699試求xbayln型回歸方程.2022-5-1653四四 軟件開(kāi)發(fā)人員的薪金軟件開(kāi)發(fā)人員的薪金問(wèn)題:?jiǎn)栴}:一家高技術(shù)公司人事部門(mén)為研究軟件開(kāi)發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度等因素之間的關(guān)系,要建立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘用人員工資的參考。
42、他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開(kāi)發(fā)人員的檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué)程度,3表示更高程度(研究生)2022-5-1654編號(hào)薪金資歷管理教育編號(hào)薪金資歷管理教育0113876111131980031302116081031411417401031870111315202634130411283102161323140305117671031712844402062087221218132455020711772202191367750308105
43、352012015965511091219520321123666011012313302222135261311149753112313839602122137131224228846122022-5-1655編號(hào)薪金資歷管理教育編號(hào)薪金資歷管理教育251697871136168821202261480380237241701213271740481138159901301282218481339263301312291354880140179491402301446710014125685151331159421002422783716123223174101343188381602332
44、378010124417483160134254101112451920717023514861110146193462001開(kāi)發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度2022-5-1656分析與假設(shè):分析與假設(shè):按照常識(shí),薪金自然按照資歷(年)的增長(zhǎng)而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作y,資歷(年)記作1x,為了表示是否為管理人員定義2x1,管理人員0,非管理人員為了表示三種教育程度,定義3x1,中學(xué)0,其它4x1,大學(xué)0,其它這樣,中學(xué)用0, 143xx表示,大學(xué)用1, 043xx表示,研究生則用0, 043xx表示。2022-5-1657為了簡(jiǎn)單起見(jiàn),
45、我們假定資歷(年)對(duì)薪金的作用是線性的,即資歷每加一年,薪金的增長(zhǎng)是常數(shù);管理責(zé)任、教育程度、資歷諸因素之間沒(méi)有交互作用,建立線性回歸模型?;灸P停夯灸P停盒浇饄與資歷1x,管理責(zé)任2x,教育程度43,xx之間的多元線性回歸模型為443322110 xaxaxaxaay其中,410,aaa是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)間(置信水平 )05. 0、檢驗(yàn)統(tǒng)計(jì)量pFR,2的結(jié)果,見(jiàn)表。2022-5-1658參數(shù)參數(shù)估計(jì)值置信區(qū)間1103210258 11807546484 60868836248 7517-2994-3826 -216214
46、8-636 9310a1a2a3a4a0,226,957. 02pFR2022-5-1659結(jié)果分析:結(jié)果分析:從表中,957. 02R,即因變量(薪金)的95.7%可由模型確定,F(xiàn)值超過(guò)F檢驗(yàn)的臨界值,p遠(yuǎn)小于,因而模型從整體來(lái)看是可用的。比如,利用模型可以估計(jì)(或估計(jì))一個(gè)大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為12273100243210aaaaay模型中各個(gè)回歸系數(shù)的含義可初步解釋如下:1x的系數(shù)為546,說(shuō)明資歷每增加一年,薪金增長(zhǎng)546;2x的系數(shù)為6883,說(shuō)明管理人員的薪金比非管理人員多6883;3x的系數(shù)為-2994,說(shuō)明中學(xué)程度的薪金比研究生少2994;4x的系數(shù)為148,說(shuō)
47、明大學(xué)程度的薪金比研究生多148,但是應(yīng)該注意到4a的置信區(qū)間包含零點(diǎn),所以這個(gè)系數(shù)的解釋是不可靠的。注意:上述解釋是就平均值來(lái)說(shuō)的,并且,一個(gè)因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。2022-5-1660進(jìn)一步討論:進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說(shuō)明上述基本模型存在缺點(diǎn)。為了4a尋找改進(jìn)的方向,常用殘差分析法(殘差指薪金的實(shí)際值y與模型估計(jì)的薪金y 之差,是基本模型中隨機(jī)誤差的估計(jì)值,這里用同一個(gè)符號(hào))。我們將影響因素分成資歷與管理教育組合兩類,管理-教育組合定義如表。組合1 23456管理010101教育112233管理管理教育組合教育組合2022-5-1661
48、為了對(duì)殘差進(jìn)行分析,下圖給出與資歷1x的關(guān)系,及與管理2x-教育43, xx組合間的關(guān)系。與資歷1x的關(guān)系與432,xxx 組合的關(guān)系從左圖看,殘差大概分成3個(gè)水平,這是由于6種管理教育組合混在一起,在模型中未被正確反映的結(jié)果;從右圖看,對(duì)于前4個(gè)管理教育組合,殘差或者全為正,或者全為負(fù),也表明管理-教育組合在模型中處理不當(dāng)。在模型中,管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交互作用,如大學(xué)程度的管理人員的薪金會(huì)比二者分別的薪金之和高一點(diǎn)。2022-5-1662以上分析提示我們,應(yīng)在基本模型中增加管理更好的模型:更好的模型:2x與教育43, xx的交互項(xiàng),建立新的回歸模型。增加2
49、x與43, xx的交互項(xiàng)后,模型記作426325443322110 xxaxxaxaxaxaxaay利用MATLAB的統(tǒng)計(jì)工具箱得到的結(jié)果如表:2022-5-1663參數(shù)參數(shù)估計(jì)值置信區(qū)間1120411044 11363497486 50870486841 7255-1727-1939 -1514-348-545 -152-3071-3372 -276918361571 21010a1a2a3a4a5a6a0,554,999. 02pFR2022-5-1664由上表可知,這個(gè)模型的做該模型的兩個(gè)殘差分析圖,可以看出,已經(jīng)消除了不正常現(xiàn)象,這也說(shuō)明了模型的適用性。2R和F值都比上一個(gè)模型有所改進(jìn)
50、,并且所有回歸系數(shù)的置信區(qū)間都不含零點(diǎn),表明這個(gè)模型完全可用。與1x的關(guān)系與432,xxx 組合的關(guān)系2022-5-1665從上圖,還可以發(fā)現(xiàn)一個(gè)異常點(diǎn):具有10年資歷、大學(xué)程度的管理人員(編號(hào)33)的實(shí)際薪金明顯低于模型的估計(jì)值,也明顯低于與他有類似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的。為了使個(gè)別數(shù)據(jù)不致影響整個(gè)模型,應(yīng)該將這個(gè)異常數(shù)據(jù)去掉,對(duì)模型重新估計(jì)回歸系數(shù),得到的結(jié)果如表。殘差分析見(jiàn)圖??梢钥吹?,去掉異常數(shù)據(jù)后結(jié)果又有改善。2022-5-1666參數(shù)參數(shù)估計(jì)值置信區(qū)間1120011139 11261498494 50370416962 7120-1737-1818 -1
51、656-356-431 -281-3056-3171 -294219971894 21000a1a2a3a4a5a6a0,36701,9998. 02pFR2022-5-1667與1x的關(guān)系與432,xxx 組合的關(guān)系模型的應(yīng)用:模型的應(yīng)用:對(duì)于第二個(gè)模型,用去掉異常數(shù)據(jù)(33號(hào))后估計(jì)出的系數(shù)得到的結(jié)果是滿意的。模型的應(yīng)用之一,可以用來(lái)“制訂”6種管理教育組合人員的“基礎(chǔ)”薪金(即資歷為零的薪金),這是平均意義上的。利用第二個(gè)模型和去掉異常數(shù)據(jù)后得到的回歸系數(shù),可以得到如下結(jié)果:2022-5-1668組合管理教育系數(shù)“基礎(chǔ)”薪金10194632111344830210844412198825
52、03112006131824130aa 5320aaaa40aa 6420aaaa0a20aa 2022-5-1669可以看出,大學(xué)程度的管理人員薪金比研究生程度管理人員薪金高,而大學(xué)程度的非管理人員薪金比研究生程度非管理人員薪金略低。當(dāng)然,這是根據(jù)這家公司實(shí)際數(shù)據(jù)建立的模型得到的結(jié)果,并不具普遍性。評(píng)注:評(píng)注:從建立回歸模型的角度,通過(guò)這個(gè)問(wèn)題的求解我們學(xué)習(xí)了:1) 對(duì)于影響因變量的定性因素(管理、教育),可以引入 01變量來(lái)處理,01變量的個(gè)數(shù)比定性因素的水平少 1(如教育程度有3個(gè)水平,引入2個(gè)01變量)。2) 用殘差分析法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項(xiàng)常 ??梢缘玫礁纳啤?) 若發(fā)
53、現(xiàn)異常值應(yīng)剔除,有助于結(jié)果的合理性。思考:思考:在這里我們由簡(jiǎn)到繁,先分別引進(jìn)管理和教育因素,再引入交互項(xiàng)。試直接對(duì)6種管理-教育組合引入5個(gè)01變量,建立模型,看結(jié)果如何。2022-5-1670五五 教學(xué)評(píng)估教學(xué)評(píng)估為了考評(píng)教師的教學(xué)質(zhì)量,教學(xué)研究部門(mén)設(shè)計(jì)了一個(gè)教學(xué)評(píng)估表,對(duì)學(xué)生進(jìn)行一次問(wèn)卷調(diào)查,要求學(xué)生對(duì)12位教師的15門(mén)課程(其中3為教師有兩門(mén)課程)按以下7項(xiàng)內(nèi)容打分,分值為15分(5分最好,1分最差):?jiǎn)栴}:?jiǎn)栴}:1X課程內(nèi)容組織的合理性;2X主要問(wèn)題展開(kāi)的邏輯性;3X回答學(xué)生問(wèn)題的有效性;4X課下交流的有助性;5X教科書(shū)的幫助性;6X考試評(píng)分的公正性;Y對(duì)教師的總體評(píng)價(jià)。2022-5
54、-1671收回問(wèn)卷調(diào)查表后,得到了學(xué)生對(duì)12為教師、15門(mén)課程各項(xiàng)評(píng)分的平均值,見(jiàn)表。 教師編號(hào)課程編號(hào)12014.464.424.234.104.564.374.1122244.113.823.293.603.993.823.3833013.583.313.243.764.393.753.1743014.424.374.344.403.634.274.3953014.624.474.534.674.634.574.691X2X3X4X5X6XY2022-5-1672教師編號(hào)課程編號(hào)63093.183.823.923.623.504.143.2573112.472.793.583.502.84
55、3.842.8483114.293.924.053.762.764.113.9593124.414.364.274.754.594.114.18103124.594.344.244.392.644.384.44113334.554.454.434.574.454.404.47124244.674.644.524.393.484.214.6133513.713.413.394.184.064.063.1744114.284.454.104.073.764.434.1594244.244.384.354.484.154.504.331X2X3X4X5X6XY2022-5-167361 XX不一定每
56、項(xiàng)都對(duì)教師總體評(píng)價(jià)Y有顯著影響,并且各項(xiàng)內(nèi)容之間也可能存在很強(qiáng)的相關(guān)性,他們希望得到一個(gè)總體評(píng)價(jià)與各項(xiàng)具體內(nèi)容之間的模型,模型應(yīng)盡量簡(jiǎn)單和有效,并且由此能給教師一些合理的建議,以提高總體評(píng)價(jià)。準(zhǔn)備知識(shí):準(zhǔn)備知識(shí):逐步回歸這個(gè)問(wèn)題給出了6個(gè)自變量,但我們希望從中選出對(duì)因變量Y影響顯著的那些來(lái)建立回歸模型。變量選擇的標(biāo)準(zhǔn)應(yīng)該是將所有對(duì)因變量影響顯著的自變量都選入模型,而影響不顯著的自變量都不選入模型,從便于應(yīng)用的角度,應(yīng)使模型中的自變量個(gè)數(shù)盡量少。逐步回歸就是一種從眾多自變量中有效的選擇重要變量的方法。教學(xué)研究部門(mén)認(rèn)為,所列各項(xiàng)具體內(nèi)容2022-5-1674逐步回歸的基本思路是,先確定一個(gè)包含若干
57、自變量的初始集合,然后每次從集合外的變量中引入一個(gè)對(duì)因變量影響最大的,再對(duì)集合中的變量進(jìn)行檢驗(yàn),從變得不顯著的變量中移出一個(gè)影響最小的,依次進(jìn)行,直到不能引入和移出為止。引入和移出都以給定的顯著性水平為標(biāo)準(zhǔn)。利用MATLAB系統(tǒng)工具箱中的逐步回歸命令stepwise可以實(shí)現(xiàn)逐步回歸。Stepwise提供人機(jī)交互式畫(huà)面,可以在畫(huà)面上自由引入和移出變量,進(jìn)行統(tǒng)計(jì)分析。具體用法參見(jiàn)MATLAB叢書(shū)回歸模型的建立與求解:回歸模型的建立與求解:我們利用MATLAB命令得到各個(gè)變量的回歸系數(shù),置信區(qū)間,及剩余標(biāo)準(zhǔn)差(RMSE),決定系數(shù)(R-square),F(xiàn)值,p值。見(jiàn)表。2022-5-1675參數(shù)參數(shù)
58、估計(jì)值置信區(qū)間10.51620.01546 0.0192-0.05469-0.853 0.7436 30.6706-0.03795 1.37940.1245-0.462 0.67515-0.04335-0.2514 0.164760.1363-0.6958 0.9684RMSER-squareFp0.11250.980667.292.071e-006可以看到,除1X外其他自變量的回歸系數(shù)置信區(qū)間都包含零點(diǎn)3X在臨界狀態(tài),將6542,XXXX一一移去(與次序無(wú)關(guān)),當(dāng)模型中僅含31, XX時(shí)結(jié)果見(jiàn)下表。2022-5-1676參數(shù)參數(shù)估計(jì)值置信區(qū)間10.50990.326 0.69382-0.11
59、37-0.689 0.4616 30.7678-0.5124 1.02340.0833-0.2767 0.44335-0.018-0.1565 0.120560.1109-0.5594 0.7811RMSER-squareFp0.10.977254.71.487e-010可以看到,僅含31, XX模型的回歸系數(shù)置信區(qū)間遠(yuǎn)離零點(diǎn),31, XX對(duì)Y的影響是顯著的,與上個(gè)結(jié)果比較,剩余標(biāo)準(zhǔn)差由0.1125減少到0.1,雖然2R略有下降,但F值大大提高。這些表明僅含31, XX模型是合適的。但MATLAB命令并未給出回歸模型的常數(shù)項(xiàng)。我們由以下方法計(jì)算得到:2022-5-1677終得到的模型為在最終模
60、型里回歸變量只有2471.133110XbXbYb其中,31,XXY分別是31,XXY的平均值。利用逐步回歸最2471.17678.05099.031XXY模型解釋:模型解釋:31, XX,是一個(gè)簡(jiǎn)單易用的模型,據(jù)此可把課程內(nèi)容組織的合理性( )1X和回答學(xué)生問(wèn)題的有效性( )列入考評(píng)的重點(diǎn)。上式表明,3X1X的分值每增加一分,對(duì)教師的總體評(píng)價(jià)就增加約0.5分;3X的分值每增加一分,對(duì)教師的總體評(píng)價(jià)就增加約0.77分。應(yīng)建議教師注重這兩方面的工作。為了分析其它變量沒(méi)有進(jìn)入最終模型的原因,可以計(jì)算YXX,61的相關(guān)系數(shù),利用MATLAB系統(tǒng)工具箱中的corrcoef命令直接得到這7個(gè)變量的相關(guān)系
61、數(shù)矩陣:2022-5-16781.00000.90080.67520.73610.29100.64710.89730.90081.00000.85040.73990.27750.80260.93630.67520.85041.00000.74990.08080.84900.91160.73610.73990.74991.00000.43700.70410.82190.29100.27750.08080.43701.00000.18720.17830.64710.80260.84900.70410.18721.00000.82460.89730.93630.91160.82190.17830.8
62、2461.0000一般認(rèn)為,兩個(gè)變量的相關(guān)系數(shù)超過(guò)0.85時(shí)才具有顯著的相關(guān)關(guān)系。由上面的結(jié)果知,與Y相關(guān)關(guān)系顯著的只有321,XXX而2X未進(jìn)入最終模型,是由于它與31,XX的相關(guān)系數(shù)顯著(相關(guān)系數(shù)8504. 0,9008. 03212rr),可以說(shuō),模型中有了31, XX以后2022-5-1679變量如果初步看來(lái)影響因變量的因素較多,并得到了大量的數(shù)據(jù)。為了建立一個(gè)有效的、便于應(yīng)用的模型,可以利用逐步回歸只選擇那些影響顯著的變量“入圍”。如果懷疑原有變量的平方項(xiàng)、交叉項(xiàng)等也會(huì)對(duì)變量有顯著影響也可以將這些項(xiàng)作為新的自變量加入到候選行列,用逐步回歸來(lái)處理。2X是多余的,應(yīng)該去掉。評(píng)注:評(píng)注:2022-5-1680練習(xí):練習(xí):下表給出了某工廠產(chǎn)品的生產(chǎn)批量與單位成本(元)的數(shù)據(jù),從散點(diǎn)圖,可以明顯的發(fā)現(xiàn),生產(chǎn)批量在500以內(nèi)時(shí),單位成本對(duì)生產(chǎn)批量服從一種線性關(guān)系,生產(chǎn)批量超過(guò)500時(shí)服從另一種線性關(guān)系,此時(shí)單位成本明顯下降。希望你構(gòu)造一個(gè)合適的回歸模型全面地描述生產(chǎn)批量與單位成本的關(guān)系。生產(chǎn)批量650340400800300600720480440540750單位成本2.48 4.454.52 1.384.652.96 2.18 4.04 4.20 3.101.50
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商品營(yíng)業(yè)員培訓(xùn)教程-價(jià)格法
- 我的團(tuán)隊(duì)我的班(班會(huì))(PPT34頁(yè))
- 綠色食品知識(shí)培訓(xùn)
- 打擊盜版演講ppt課件
- 電子分廠車間成本管理培訓(xùn)
- 電影院服務(wù)禮儀教材
- 第三章生產(chǎn)費(fèi)用匯集和分配的程序和方法-PowerPoin
- 保險(xiǎn)的產(chǎn)生與發(fā)展講義課件(ppt 47頁(yè))
- 現(xiàn)代慶典策劃設(shè)計(jì)方案
- 現(xiàn)代企業(yè)項(xiàng)目管理知識(shí)講義
- 配電網(wǎng)自動(dòng)化技術(shù)—CH6配電網(wǎng)饋線自動(dòng)化
- 房地產(chǎn)電子虛擬現(xiàn)實(shí)展示銷售系統(tǒng)
- 第三講 工作分析
- 法律解釋學(xué)第十三章--不確定概念及一般條款的價(jià)值補(bǔ)充[精]課件
- 零售店鋪業(yè)績(jī)的提升