《2020版高考數學二輪復習 專題限時集訓6 統計與統計案例 理》由會員分享,可在線閱讀,更多相關《2020版高考數學二輪復習 專題限時集訓6 統計與統計案例 理(8頁珍藏版)》請在裝配圖網上搜索。
1、專題限時集訓(六) 統計與統計案例
[專題通關練]
(建議用時:20分鐘)
1.下列說法中正確的是( )
A.先把高三年級的2 000名學生編號:1到2 000,再從編號為1到50的50名學生中隨機抽取1名學生,其編號為m,然后抽取編號為m+50,m+100,m+150,…的學生,這樣的抽樣方法是分層抽樣法
B.線性回歸直線=x+不一定過樣本中心點(,)
C.若兩個隨機變量的線性相關性越強,則相關系數r的值越接近于1
D.若一組數據1,a,3的平均數是2,則該組數據的方差是
D [對于A,先把高三年級的2 000名學生編號:1到2 000,再從編號為1到50的50名學生中隨機
2、抽取1名學生,其編號為m,然后抽取編號為m+50,m+100,m+150,…的學生,這樣的抽樣方法是系統抽樣,故A項錯誤;對于B,線性回歸直線=x+一定過樣本中心點(,),故B項錯誤;對于C,若兩個隨機變量的線性相關性越強,則相關系數r的絕對值越接近于1,故C項錯誤;對于D,若一組數據1,a,3的平均數是2,則a=2,則該組數據的方差是×=,故D項正確,故選D.]
2.[重視題](2019·青島一模)調查機構對某高科技行業(yè)進行調查統計,得到該行業(yè)從業(yè)者學歷分布餅狀圖、從事該行業(yè)崗位分布條形圖,如圖所示.
給出下列三種說法:①該高科技行業(yè)從業(yè)人員中學歷為博士的占一半以上;②該高科技行業(yè)中
3、從事技術崗位的人數超過總人數的30%;③該高科技行業(yè)中從事運營崗位的人員主要是本科生,其中正確的個數為( )
A.0個 B.1個
C.2個 D.3個
C [在①中,由該行業(yè)從業(yè)者學歷分布餅狀圖得到:該高科技行業(yè)從業(yè)人員中學歷為博士的占一半以上,故①正確;在②中,由從事該行業(yè)崗位分布條形圖得到:該高科技行業(yè)中從事技術崗位的人數超過總人數的30%,故②正確;在③中,由該行業(yè)從業(yè)者學歷分布餅狀圖、從事該行業(yè)崗位分布條形圖,無法得到該高科技行業(yè)中從事運營崗位的人員主要是本科生,故③錯誤.故選C.]
3.(2019·鄭州二模)將甲、乙兩個籃球隊5場比賽的得分數據整理成如圖所示的莖葉圖,
4、由圖可知以下結論正確的是( )
A.甲隊平均得分高于乙隊的平均得分
B.甲隊得分的中位數大于乙隊得分的中位數
C.甲隊得分的方差大于乙隊得分的方差
D.甲乙兩隊得分的極差相等
C [對于A,甲的平均數為(29+28+26+31+31)=29,乙的平均數為(28+29+30+31+32)=30,故A錯誤.
對于B,甲隊得分的中位數是29,乙隊得分的中位數是30,故B錯誤;
對于C,甲成績的方差為:s2=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=.
乙成績的方差為:s2=×[(28-30)2+(29-30)2+(30-30
5、)2+(31-30)2+(32-30)2]=2.
可得甲隊得分的方差大于乙隊得分的方差,故C正確;
對于D,甲的極差是31-26=5,乙的極差是32-28=4,兩者不相等,故D錯誤.故選C.]
4.為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據測量數據的散點圖可以看出y與x之間有線性相關關系,設其線性回歸方程為=x+.已知xi=225,yi=1 600,=4.該班某學生的腳長為24,據此估計其身高為( )
A.160 B.163
C.166 D.170
C [∵xi=225,∴=xi=22.5.
∵yi=1 600,∴
6、=yi=160.
又=4,∴=-=160-4×22.5=70.
∴線性回歸方程為=4x+70.
將x=24代入上式,得=4×24+70=166.故選C.]
5.(2019·全國卷Ⅰ)某學校為了解1 000名新生的身體素質,將這些學生編號為1,2,…,1 000,從這些新生中用系統抽樣方法等距抽取100名學生進行體質測驗.若46號學生被抽到,則下面4名學生中被抽到的是( )
A.8號學生 B.200號學生
C.616號學生 D.815號學生
C [根據題意,系統抽樣是等距抽樣,
所以抽樣間隔為=10.
因為46除以10余6,所以抽到的號碼都是除以10余6的數,結合選項知應為6
7、16.故選C.]
6.(2018·聊城市一模)某工廠從生產的一批產品中隨機抽出一部分,對這些產品的一項質量指標進行了檢測,整理檢測結果得到如下頻率分布表:
質量指標分組
[10,30)
[30,50)
[50,70]
頻率
0.1
0.6
0.3
據此可估計這批產品的此項質量指標的方差為________.
144 [由題意得這批產品的此項質量指標的平均數為20×0.1+40×0.6+60×0.3=44,
故方差為(20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3=144.]
[能力提升練]
(建議用時:15分鐘)
7.某球迷為了解A,B兩
8、支籃球隊的攻擊能力,從某賽季常規(guī)賽中隨機調查了20場與這兩支籃球隊有關的比賽.兩隊所得分數分別如下.
A籃球隊:122 110 105 105 109 101 107 129
115 100 114 118 118 104 93 120
96 102 105 83
B籃球隊:114 114 110 108 103 117 93 124
75 106 91 81 107 112 107 101 106
120 107 79
(1)根據兩組數據完成兩隊所得分數的莖葉圖,并通過莖葉圖比較兩支籃球隊所得分數的平均值及分散程度(不要求計算出具體值,得出結論即可);
(2)根據籃球隊所
9、得分數,將籃球隊的攻擊能力從低到高分為三個等級,如下表所示.
籃球隊所得分數
低于100分
100分到119分(包含100分和119分)
不低于120分
攻擊能力等級
較弱
較強
很強
記事件C:“A籃球隊的攻擊能力等級高于B籃球隊的攻擊能力等級”.假設兩支籃球隊的攻擊能力相互獨立,根據所給數據,視事件發(fā)生的頻率為相應事件發(fā)生的概率,求事件C發(fā)生的概率.
[解](1)兩隊所得分數的莖葉圖如圖.
通過莖葉圖可以看出,A籃球隊所得分數的平均值高于B籃球隊所得分數的平均值;
A籃球隊所得分數比較集中,B籃球隊所得分數比較分散.
(2)記CA1表示事件:“A籃球隊的攻擊能
10、力等級為較強”.
CA2表示事件:“A籃球隊的攻擊能力等級為很強”.
CB1表示事件:“B籃球隊的攻擊能力等級為較弱”.
CB2表示事件:“B籃球隊的攻擊能力等級為較弱或較強”.
則CA1與CB1為相互獨立事件,CA2與CB2為相互獨立事件,CA1與CA2為互斥事件,C=(CA1CB1)∪(CA2CB2).
P(C)=P(CA1CB1)+P(CA2CB2)=P(CA1)P(CB1)+P(CA2)P(CB2).
由所給數據得CA1,CA2,CB1,CB2發(fā)生的頻率分別為,,,,
故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,P(C)=×+×=0.31.
8.[
11、重視題]某市房管局為了了解該市市民2018年1月至2019年1月期間購買二手房情況,首先隨機抽樣其中200名購房者,并對其購房面積m(單位:平方米,60≤m≤130)進行了一次調查統計,制成了如圖1所示的頻率分布直方圖,接著調查了該市2018年1月至2019年1月期間當月在售二手房均價y(單位:萬元/平方米),制成了如圖2所示的散點圖(圖中月份代碼1至13分別對應2018年1月至2019年1月)
(1)試估計該市市民的平均購房面積;
(2)從該市2018年1月至2019年1月期間所有購買二手房的市民中任取3人,用頻率估計概率,記這3人購房面積不低于100平方米的人數為X,求X的分布
12、列與數學期望;
(3)根據散點圖選擇=+和=+ln x兩個模型進行擬合,經過數據處理得到兩個回歸方程,分別為=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到一些統計量的值,如表所示:
=0.936 9
+0.028 5
=0.955 4+
0.030 6ln x
(yi-i)2
0.000 591
0.000 164
(yi-)2
0.006 050
請利用相關指數R2判斷哪個模型的擬合效果更好,并用擬合效果更好的模型預測2020年6月份的二手房購房均價(精確到0.001).
參考數據:ln 2≈0.69,ln 3≈1.10,l
13、n 10≈2.30,ln 19≈2.94,≈1.41,≈1.73,≈3.16,≈4.36.
參考公式:R2=1-.
[解](1)=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.
(2)每一位市民購房面積不低于100平方米的概率為0.20+0.15+0.05=0.4,
∴X~B(3,0.4),
∴P(X=k)=C×0.4k×0.63-k,(k=0,1,2,3),
P(X=0)=0.63=0.216,
P(X=1)=C×0.4×0.62=0.432,
P(X=2)=C×0.42×0.6=0.288,
P(X=
14、3)=0.43=0.064,
∴X的分布列為:
X
0
1
2
3
P
0.216
0.432
0.288
0.064
∴E(X)=3×0.4=1.2.
(3)設模型=0.936 9+0.028 5和=0.955 4+0.030 6ln x的相關指數分別為R,R,則R=1-,R=1-,
∴R<R,
∴模型=0.955 4+0.030 6ln x的擬合效果更好,
2020年6月份對應的x=30,
∴=0.955 4+0.030 6ln 30=0.955 4+0.030 6(ln 3+ln 10)≈1.059萬元/平方米.
內容
押題依據
獨立性檢驗、離
15、散型隨機變量的期望、概率的計算
以圖表的形式呈現數據,符合高考的命題模式,與期望、概率交匯命題體現了高考命題的特點
【押題】 高鐵、網購、移動支付和共享單車被譽為中國的“新四大發(fā)明”,彰顯出中國式創(chuàng)新的強勁活力.某移動支付公司從我市移動支付用戶中隨機抽取100名進行調查,得到如下數據:
每周移動支付次數
1
2
3
4
5
6及其以上
男
10
8
7
3
2
15
女
5
4
6
4
6
30
合計
15
12
13
7
8
45
(1)把每周使用移動支付超過3次的用戶稱為“移動支付活躍用戶”,請完成下列2×2列聯表,并判斷能否在
16、犯錯誤的概率不超過0.005的前提下,認為是否為“移動支付活躍用戶”與性別有關?
非移動支付活躍用戶
移動支付活躍用戶
合計
男
女
合計
(2)把每周使用移動支付6次及6次以上的用戶稱為“移動支付達人”,視頻率為概率,在我市所有“移動支付達人”中隨機抽取4名用戶.
①求抽取的4名用戶中,既有男“移動支付達人”,又有女“移動支付達人”的概率;
②為了鼓勵男性用戶使用移動支付,對抽出的男“移動支付達人”每人獎勵300元,記獎勵總金額為X,求X的分布列及數學期望.
附公式及表如下:K2=.
P(K2≥k)
0.15
0.10
0.
17、05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
[解](1)由表格數據可得2×2列聯表如下:
非移動支付活躍用戶
移動支付活躍用戶
合計
男
25
20
45
女
15
40
55
合計
40
60
100
將列聯表中的數據代入公式計算得
K2=
==≈8.249>7.879.
所以在犯錯誤的概率不超過0.005的前提下,能認為是否為“移動支付活躍用戶”與性別有關.
(2)視頻率為概率,在我市“移動支付達人”中隨機抽取1名用戶,該
18、用戶為男“移動支付達人”的概率為,女“移動支付達人”的概率為.
①抽取的4名用戶中,既有男“移動支付達人”,又有女“移動支付達人”的概率為P=1--=.
②記抽出的男“移動支付達人”人數為Y,則X=300Y.由題意得Y~B,P(Y=0)=C=;
P(Y=1)=C=;
P(Y=2)=C=;
P(Y=3)=C=;
P(Y=4)=C=.
所以Y的分布列為
Y
0
1
2
3
4
P
所以X的分布列為
X
0
300
600
900
1 200
P
由E(Y)=4×=,得X的數學期望E(X)=300E(Y)=400.
- 8 -