《人教版 高中數(shù)學 選修23 學案第3章章末分層突破》由會員分享,可在線閱讀,更多相關《人教版 高中數(shù)學 選修23 學案第3章章末分層突破(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2019人教版精品教學資料·高中選修數(shù)學
章末分層突破
,
[自我校對]
①散點圖
②=x+
③殘差圖
④相關指數(shù)
⑤等高條形圖
2、
線性回歸分析
回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.根據(jù)兩個變量的一組觀測值,可以畫出散點圖或利用相關系數(shù)r,判斷兩個變量是否具有線性相關關系,若具有線性相關關系,可得出線性回歸直線方程.
利用公式求回歸直線方程時應注意以下幾點:
(1)求時,利用公式=,先求出=(x1+x2+x3+…+xn),=(y1+y2+y3+…+yn).再由=- 求的值,并寫出回歸直線方程.
(2)回歸直線一定經(jīng)過樣本的中心點(,).
(3)回歸直線方程中的截距和斜率都是通過樣本估計得來的,存在誤差,這種誤差可能導致預報結果的偏差.
(4)
3、回歸直線方程=+x中的表示x每增加1個單位時預報變量y的平均變化量,而表示預報變量y不隨x的變化而變化的部分.
(5)在一元線性回歸模型中,相關指標R2與相關系數(shù)r都能刻畫線性回歸模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,用線性回歸模型擬合數(shù)據(jù)的效果就越好.
關于x與y有以下數(shù)據(jù):
x
2
4
5
6
8
y
30
40
60
50
70
已知x與y線性相關,由最小二乘法得=6.5,
(1)求y與x的線性回歸方程;
(2)現(xiàn)有第二個線性模型:=7x+17,且R2=0.82.
若與(1)的線性模型比較,哪一個線性模型擬合效果比較好,請說明理由.
【規(guī)
4、范解答】 (1)依題意設y與x的線性回歸方程為=6.5x+.
==5,
==50,
∴=6.5x+經(jīng)過(,),
∴50=6.5×5+,∴=17.5,
∴y與x的線性回歸方程為=6.5x+17.5.
(2)由(1)的線性模型得yi-i與yi-的關系如下表:
yi-i
-0.5
-3.5
10
-6.5
0.5
yi-
-20
-10
10
0
20
所以(yi-i)2=(-0.5)2+(-3.5)2+(-10)2+(-6.5)2+0.52=155.
(yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以R=1-=
5、1-=0.845.
由于R=0.845,R2=0.82知R>R2,
所以(1)的線性模型擬合效果比較好.
[再練一題]
1.(2016·長春高二檢測)已知某連鎖經(jīng)營公司的5個零售店某月的銷售額和利潤額資料如下表:
商店名稱
A
B
C
D
E
銷售額x(千萬元)
3
5
6
7
9
利潤額y(千萬元)
2
3
3
4
5
(1)畫出散點圖;
(2)根據(jù)如下的參考公式與參考數(shù)據(jù),求利潤額y與銷售額x之間的線性回歸方程;
(3)若該公司還有一個零售店某月銷售額為10千萬元,試估計它的利潤額是多少.
(參考公式:=,=-.
其
6、中,iyi=112,=200)
【解】 (1)散點圖.
(2)由已知數(shù)據(jù)計算得n=5,==6,==3.4,==0.5,=3.4-0.5×6=0.4.
則線性回歸方程為=0.5x+0.4.
(3)將x=10代入線性回歸方程中得到=0.5×10+0.4=5.4(千萬元).
即估計該零售店的利潤額約為5.4千萬元.
非線性回歸分析
一般地,有些非線性回歸模型通過變換可以轉化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關系的兩個變量之間的關系.具體處理方法為:
(1)描點,選模.畫出已知數(shù)據(jù)的散點圖,把它與已經(jīng)學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函
7、數(shù)等)圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù).
(2)解模.先對變量進行適當?shù)淖儞Q,再利用線性回歸模型來解模.
(3)比較檢驗.通過回歸分析比較所建模型的優(yōu)劣.
常見的非線性函數(shù)轉換方法:
(1)冪型函數(shù)y=axm(a為正數(shù),x,y取正值)
解決方案:對y=axm兩邊取常用對數(shù),有l(wèi)g y=lg a+mlg x,令u=lg y,v=lg x,則原式可變?yōu)閡=mv+lg a,其中m,lg a為常數(shù),該式表示u,v的線性函數(shù).
(2)指數(shù)型函數(shù)y=cax(a,c>0,且a≠1)
解決方案:對y=cax兩邊取常用對數(shù),則有l(wèi)g y=lg c+xlg a,令u=lg y,則
8、原式可變?yōu)閡=xlg a+lg c,其中l(wèi)g a和lg c為常數(shù),該式表示u,x的線性函數(shù).與冪函數(shù)不同的是x保持不變,用y的對數(shù)lg y代替了y.
(3)反比例函數(shù)y=(k>0)
解決方案:令u=,則y=ku,該式表示y,u的線性函數(shù).
(4)二次函數(shù)y=ax2+c
解決方案:令u=x2,則原函數(shù)可變?yōu)閥=au+c,該式表示y,u的線性函數(shù).
(5)對數(shù)型函數(shù)y=clogax
解決方案:令x=au,則原函數(shù)可變?yōu)閥=cu,該式表示y,u的線性函數(shù).
某種書每冊的成本費y(元)與印刷冊數(shù)x(千冊)有關,經(jīng)統(tǒng)計得到如下數(shù)據(jù):
x
1
2
3
5
10
20
9、
30
50
100
200
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
作出x與y的散點圖,判斷x與y之間的關系,并建立y與x的回歸方程.
【精彩點撥】 首先作出x與y的散點圖,根據(jù)散點圖特征,判斷x與y的關系并建立y與x的回歸方程.
【規(guī)范解答】 散點圖如圖所示:
由圖可知,該散點圖與反比例函數(shù)圖象擬合得最好.于是,作變量變換u=,問題所給數(shù)據(jù)變成如下表所示的10對數(shù)據(jù):
ui
1
0.5
0.33
0.2
0.1
yi
10.15
5.52
4.08
2.85
10、
2.11
ui
0.05
0.03
0.02
0.01
0.005
yi
1.62
1.41
1.30
1.21
1.15
然后作相關性檢驗:r≈0.999 8,我們認為u與y之間具有線性相關關系,由y對u的回歸方程有意義,通過計算可知≈8.973,≈1.125,故回歸直線方程為=8.973u+1.125,最后代回u=可得,=1.125+.
[再練一題]
2.一個昆蟲的某項指標和溫度有關,現(xiàn)收集了7組數(shù)據(jù)如下表:
溫度
x/℃
2
3
4
5
6
7
8
某項
指標y
5.790
6.810
8.199
11、
10.001
12.190
14.790
17.801
試建立某項指標y關于溫度x的回歸模型,并判斷你所建立的回歸模型的擬合效果.
【解】
畫出散點圖如圖所示,樣本點并沒有分布在某個帶狀區(qū)域內(nèi),而是分布在某一條二次函數(shù)曲線y=Bx2+A的周圍.
令X=x2,則變換后的樣本點應該分布在y=bX+a(b=B,a=A)的周圍.
由已知數(shù)據(jù)可得變換后的樣本數(shù)據(jù)表:
X
4
9
16
25
36
49
64
某項
指標y
5.790
6.810
8.199
10.001
12.190
14.790
17.801
計算得到線性回歸方程為=0.
12、199 94X+4.999 03.
用x2替換X,得某項指標y關于溫度x的回歸方程=0.199 94x2+4.999 03.
計算得R2≈0.999 997,幾乎為1,說明回歸模型的擬合效果非常好.
獨立性檢驗
獨立性檢驗是判斷兩個分類變量之間是否有關系的一種方法.在判斷兩個分類變量之間是否有關系時,作出等高條形圖只能近似地判斷兩個分類變量是否有關系,而獨立性檢驗可以精確地得到可靠的結論.
獨立性檢驗的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.
(2)根據(jù)公式計算K2的觀測值k.
(3)比較k與臨界值的大小關系作統(tǒng)計推斷.
(2016·池州高二
13、檢測)為了調(diào)查胃病是否與生活規(guī)律有關,在某地對540名40歲以上的人進行了調(diào)查,結果是:患胃病者生活不規(guī)律的共60人,患胃病者生活規(guī)律的共20人,未患胃病者生活不規(guī)律的共260人,未患胃病者生活規(guī)律的共200人.
(1)根據(jù)以上數(shù)據(jù)列出2×2列聯(lián)表;
(2)判斷40歲以上的人患胃病與生活規(guī)律是否有關.
【精彩點撥】 (1)解決本題關鍵是首先弄清問題中的兩個分類變量及其取值分別是什么,其次掌握2×2列聯(lián)表的結構特征.
(2)利用2×2列聯(lián)表計算K2的觀測值,再結合臨界值表來分析相關性的大小.
【規(guī)范解答】 (1)由已知可列2×2列聯(lián)表如下:
14、
患胃病
未患胃病
總計
生活規(guī)律
20
200
220
生活不規(guī)律
60
260
320
總計
80
460
540
(2)根據(jù)列聯(lián)表得K2的觀測值為
k=≈9.638.
因為9.638>7.879,
因此,我們在犯錯誤的概率不超過0.005的前提下認為40歲以上的人患胃病和生活規(guī)律有關.
[再練一題]
3.(2016·威海高二檢測)為了解某班學生喜愛打籃球是否與性別有關,對本班50人進行問卷調(diào)查得到了如下的列聯(lián)表:
喜愛打籃球
不喜愛打籃球
總計
男生
5
女生
10
總計
50
15、
已知在全部50人中隨機抽取1人抽到喜愛打籃球的學生的概率為0.6.
(1)請將上面的列聯(lián)表補充完整(不用寫計算過程);
(2)能否有99%的把握認為喜愛打籃球與性別有關?說明你的理由.
(參考公式:K2=,
其中n=a+b+c+d)
【解】 (1)依題意可知喜愛打籃球的學生的人數(shù)為30.
列聯(lián)表補充如下:
喜愛
打籃球
不喜愛
打籃球
總計
男生
20
5
25
女生
10
15
25
總計
30
20
50
(2)因為k=≈8.333>6.635,所以,有99%的把握認為喜愛打籃球與性別有關.
1.(2014·重慶高
16、考)已知變量x與y正相關,且由觀測數(shù)據(jù)算得樣本平均數(shù)=3,=3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
【解析】 因為變量x和y正相關,則回歸直線的斜率為正,故可以排除選項C和D.因為樣本點的中心在回歸直線上,把點(3,3.5)的坐標分別代入選項A和B中的直線方程進行檢驗,可以排除B,故選A.
【答案】 A
2.(2015·福建高考)為了解某社區(qū)居民的家庭年收入與年支出的關系,隨機調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:
收入x(萬元)
8.2
8.6
17、
10.0
11.3
11.9
支出y(萬元)
6.2
7.5
8.0
8.5
9.8
根據(jù)上表可得回歸直線方程=x+,其中=0.76,=-.據(jù)此估計,該社區(qū)一戶年收入為15萬元家庭的年支出為( )
A.11.4萬元 B.11.8萬元
C.12.0萬元 D.12.2萬元
【解析】 由題意知,==10,
==8,
∴=8-0.76×10=0.4,
∴當x=15時,=0.76×15+0.4=11.8(萬元).
【答案】 B
3.(2014·湖北高考)根據(jù)如下樣本數(shù)據(jù)
x
3
4
5
6
7
8
y
4.0
18、2.5
-0.5
0.5
-2.0
-3.0
得到的回歸方程為=bx+a,則( )
A.a(chǎn)>0,b>0 B.a(chǎn)>0,b<0
C.a(chǎn)<0,b>0 D.a(chǎn)<0,b<0
【解析】 作出散點圖如下:
觀察圖象可知,回歸直線=bx+a的斜率b<0,當x=0時,=a>0.故a>0,b<0.
【答案】 B
4.(2015·山東東營二模)某商品的銷售量y(件)與銷售價格x(元/件)存在線性相關關系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=-10x+200,則下列結論正確的是( )
A.y與x具有正的線性相關關系
B.若r表示變量y與x之間的線性相關系數(shù),則r=-10
C.當銷售價格為10元時,銷售量為100件
D.當銷售價格為10元時,銷售量為100件左右
【解析】 當銷售價格為10元時,=-10×10+200=100,即銷售量為100件左右,選D.
【答案】 D