2019高考數(shù)學(xué)二輪復(fù)習(xí) 專題四 概率與統(tǒng)計(jì) 第1講 統(tǒng)計(jì)與統(tǒng)計(jì)案例課件.ppt
第1講統(tǒng)計(jì)與統(tǒng)計(jì)案例,高考定位1.抽樣方法、樣本的數(shù)字特征、統(tǒng)計(jì)圖表、回歸分析與獨(dú)立性檢驗(yàn)主要以選擇題、填空題形式命題,難度較?。?.注重知識(shí)的交匯滲透,統(tǒng)計(jì)與概率,回歸分析與概率是近年命題的熱點(diǎn),2016年,2017年和2018年在解答題中均有考查.,1.(2018全國(guó)卷)某地區(qū)經(jīng)過(guò)一年的新農(nóng)村建設(shè),農(nóng)村的經(jīng)濟(jì)收入增加了一倍,實(shí)現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況,統(tǒng)計(jì)了該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例,得到如圖所示的餅圖:,真題感悟,則下面結(jié)論中不正確的是()A.新農(nóng)村建設(shè)后,種植收入減少B.新農(nóng)村建設(shè)后,其他收入增加了一倍以上C.新農(nóng)村建設(shè)后,養(yǎng)殖收入增加了一倍D.新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過(guò)了經(jīng)濟(jì)收入的一半解析設(shè)新農(nóng)村建設(shè)前經(jīng)濟(jì)收入為a,則新農(nóng)村建設(shè)后經(jīng)濟(jì)收入為2a,則由餅圖可得新農(nóng)村建設(shè)前種植收入為0.6a,其他收入為0.04a,養(yǎng)殖收入為0.3a.新農(nóng)村建設(shè)后種植收入為0.74a,其他收入為0.1a,養(yǎng)殖收入為0.6a,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和為1.16a,所以新農(nóng)村建設(shè)后,種植收入減少是錯(cuò)誤的.故選A.答案A,2.(2018全國(guó)卷)某公司有大量客戶,且不同年齡段客戶對(duì)其服務(wù)的評(píng)價(jià)有較大差異.為了解客戶的評(píng)價(jià),該公司準(zhǔn)備進(jìn)行抽樣調(diào)查,可供選擇的抽樣方法有簡(jiǎn)單隨機(jī)抽樣、分層抽樣和系統(tǒng)抽樣,則最合適的抽樣方法是_.解析因?yàn)椴煌挲g段的客戶對(duì)公司的服務(wù)評(píng)價(jià)有較大差異,所以需按年齡進(jìn)行分層抽樣,才能了解到不同年齡段的客戶對(duì)公司服務(wù)的客觀評(píng)價(jià).答案分層抽樣,3.(2018全國(guó)卷)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.,(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值;(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由.,(2)利用模型得到的預(yù)測(cè)值更可靠.理由如下:,1.抽樣方法,抽樣方法包括簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣,三種抽樣方法都是等概率抽樣,體現(xiàn)了抽樣的公平性,但又各有其特點(diǎn)和適用范圍.,考點(diǎn)整合,2.統(tǒng)計(jì)中的四個(gè)數(shù)據(jù)特征,3.直方圖的兩個(gè)結(jié)論,4.回歸分析與獨(dú)立性檢驗(yàn),熱點(diǎn)一抽樣方法【例1】(1)(2018合肥模擬)某校為了解學(xué)生學(xué)習(xí)的情況,采用分層抽樣的方法從高一1000人、高二1200人、高三n人中抽取81人進(jìn)行問(wèn)卷調(diào)查,已知高二被抽取的人數(shù)為30,那么n()A.860B.720C.1020D.1040,(2)(2018長(zhǎng)沙雅禮中學(xué)質(zhì)檢)在一次馬拉松比賽中,35名運(yùn)動(dòng)員的成績(jī)(單位:分鐘)的莖葉圖如圖所示:,若將運(yùn)動(dòng)員按成績(jī)由好到差編為135號(hào),再用系統(tǒng)抽樣方法從中抽取7人,則其中成績(jī)?cè)趨^(qū)間139,151上的運(yùn)動(dòng)員人數(shù)是_.,(2)依題意,可將編號(hào)為135號(hào)的35個(gè)數(shù)據(jù)分成7組,每組有5個(gè)數(shù)據(jù).在區(qū)間139,151上共有20個(gè)數(shù)據(jù),分在4個(gè)小組內(nèi),每組抽取1人,共抽取4人.答案(1)D(2)4,【訓(xùn)練1】(1)(2018鄭州模擬)為規(guī)范學(xué)校辦學(xué),某省教育廳督察組對(duì)某所高中進(jìn)行了抽樣調(diào)查.抽到的班級(jí)一共有52名學(xué)生,現(xiàn)將該班學(xué)生隨機(jī)編號(hào),用系統(tǒng)抽樣的方法抽取一個(gè)容量為4的樣本,已知7號(hào)、33號(hào)、46號(hào)同學(xué)在樣本中,那么樣本中還有一位同學(xué)的編號(hào)應(yīng)是()A.13B.19C.20D.51(2)某工廠生產(chǎn)甲、乙、丙、丁四種不同型號(hào)的產(chǎn)品,產(chǎn)量分別為200,400,300,100件,為檢驗(yàn)產(chǎn)品的質(zhì)量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進(jìn)行檢驗(yàn),則應(yīng)從丙種型號(hào)的產(chǎn)品中抽取_件.,解析(1)由系統(tǒng)抽樣的原理知,抽樣的間隔為52413,故抽取的樣本的編號(hào)分別為7,713,7132,7133,即7號(hào),20號(hào),33號(hào),46號(hào).樣本中還有一位同學(xué)的編號(hào)為20號(hào).,答案(1)C(2)18,熱點(diǎn)二用樣本估計(jì)總體考法1數(shù)字特征與莖葉圖的應(yīng)用【例21】(2018北京東城區(qū)質(zhì)檢)某班男女生各10名同學(xué)最近一周平均每天的鍛煉時(shí)間(單位:分鐘)用莖葉圖記錄如下:,假設(shè)每名同學(xué)最近一周平均每天的鍛煉時(shí)間是互相獨(dú)立的.男生每天鍛煉的時(shí)間差別小,女生每天鍛煉的時(shí)間差別大;從平均值分析,男生每天鍛煉的時(shí)間比女生多;男生平均每天鍛煉時(shí)間的標(biāo)準(zhǔn)差大于女生平均每天鍛煉時(shí)間的標(biāo)準(zhǔn)差;從10個(gè)男生中任選一人,平均每天的鍛煉時(shí)間超過(guò)65分鐘的概率比同樣條件下女生鍛煉時(shí)間超過(guò)65分鐘的概率大.其中符合莖葉圖所給數(shù)據(jù)的結(jié)論是()A.B.C.D.,解析由莖葉圖知,男生每天鍛煉時(shí)間差別小,女生差別大,正確.,又根據(jù)莖葉圖,男生鍛煉時(shí)間較集中,女生鍛煉時(shí)間較分散,s甲<s乙,錯(cuò)誤,因此符合莖葉圖所給數(shù)據(jù)的結(jié)論是.答案C,考法2用樣本的頻率分布估計(jì)總體分布【例22】(2017北京卷)某大學(xué)藝術(shù)專業(yè)400名學(xué)生參加某次測(cè)評(píng),根據(jù)男女學(xué)生人數(shù)比例,使用分層抽樣的方法從中隨機(jī)抽取了100名學(xué)生,記錄他們的分?jǐn)?shù),將數(shù)據(jù)分成7組:20,30),30,40),80,90,并整理得到如下頻率分布直方圖:,(1)從總體的400名學(xué)生中隨機(jī)抽取一人,估計(jì)其分?jǐn)?shù)小于70的概率;(2)已知樣本中分?jǐn)?shù)小于40的學(xué)生有5人,試估計(jì)總體中分?jǐn)?shù)在區(qū)間40,50)內(nèi)的人數(shù);(3)已知樣本中有一半男生的分?jǐn)?shù)不小于70,且樣本中分?jǐn)?shù)不小于70的男女生人數(shù)相等.試估計(jì)總體中男生和女生人數(shù)的比例.解(1)根據(jù)頻率分布直方圖可知,樣本中分?jǐn)?shù)不小于70的頻率為(0.020.04)100.6,所以樣本中分?jǐn)?shù)小于70的頻率為10.60.4.所以從總體的400名學(xué)生中隨機(jī)抽取一人,其分?jǐn)?shù)小于70的概率估計(jì)為0.4.,(2)根據(jù)題意,樣本中分?jǐn)?shù)不小于50的頻率為(0.010.020.040.02)100.9,分?jǐn)?shù)在區(qū)間40,50)內(nèi)的人數(shù)為1001000.955.,(3)由題意可知,樣本中分?jǐn)?shù)不小于70的學(xué)生人數(shù)為(0.020.04)1010060,,所以樣本中的男生人數(shù)為30260,女生人數(shù)為1006040,男生和女生人數(shù)的比例為604032.所以根據(jù)分層抽樣原理,總體中男生和女生人數(shù)的比例估計(jì)為32.,探究提高1.平均數(shù)與方差都是重要的數(shù)字特征,是對(duì)數(shù)據(jù)的一種簡(jiǎn)明描述,它們所反映的情況有著重要的實(shí)際意義.平均數(shù)、中位數(shù)、眾數(shù)描述數(shù)據(jù)的集中趨勢(shì),方差和標(biāo)準(zhǔn)差描述數(shù)據(jù)的波動(dòng)大小.2.在本例22中,抓住頻率分布直方圖各小長(zhǎng)方形的面積之和為1,這是求解的關(guān)鍵;本題易混淆頻率分布條形圖和頻率分布直方圖,誤把頻率分布直方圖縱軸的幾何意義當(dāng)成頻率,導(dǎo)致樣本數(shù)據(jù)的頻率求錯(cuò).,答案A,【訓(xùn)練2】(1)如圖所示的莖葉圖記錄了甲乙兩組各5名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平均值也相等,則x和y的值分別為()A.3,5B.5,5C.3,7D.5,7,(2)我國(guó)是世界上嚴(yán)重缺水的國(guó)家,某市為了制定合理的節(jié)水方案,對(duì)居民用水情況進(jìn)行了調(diào)查.通過(guò)抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數(shù)據(jù)按照0,0.5),0.5,1),4,4.5分成9組,制成了如圖所示的頻率分布直方圖.,求直方圖中a的值;設(shè)該市有30萬(wàn)居民,估計(jì)全市居民中月均用水量不低于3噸的人數(shù),說(shuō)明理由;估計(jì)居民月均用水量的中位數(shù).,解由頻率分布直方圖可知:月均用水量在0,0.5)內(nèi)的頻率為0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等組的頻率分別為0.08,0.21,0.25,0.06,0.04,0.02.由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30.由知,該市100位居民中月均用水量不低于3噸的頻率為0.060.040.020.12.由以上樣本的頻率分布,可以估計(jì)30萬(wàn)居民中月均用水量不低于3噸的人數(shù)為3000000.1236000.,設(shè)中位數(shù)為x噸.因?yàn)榍?組的頻率之和為0.040.080.150.210.250.730.5.又前4組的頻率之和為0.040.080.150.210.48<0.5.所以2x<2.5.由0.50(x2)0.50.48,解得x2.04.故可估計(jì)居民月均用水量的中位數(shù)為2.04噸.,熱點(diǎn)三回歸分析【例3】(2018成都質(zhì)檢)某省的一個(gè)氣象站觀測(cè)點(diǎn)在連續(xù)4天里記錄的AQI指數(shù)M與當(dāng)天的空氣水平可見(jiàn)度y(單位:cm)的情況如表1:,該省某市2017年11月份AQI指數(shù)頻數(shù)分布如表2:,(2)根據(jù)表3可知,該月30天中有3天每天虧損2000元,有6天每天虧損1000元,有12天每天收入2000元,有6天每天收入6000元,有3天每天收入8000元.,【訓(xùn)練3】(2016全國(guó)卷)如圖是我國(guó)2008年至2014年生活垃圾無(wú)害化處理量(單位:億噸)的折線圖.,注:年份代碼17分別對(duì)應(yīng)年份20082014.(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明;(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測(cè)2016年我國(guó)生活垃圾無(wú)害化處理量.,解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得,因?yàn)閥與t的相關(guān)系數(shù)近似為0.99,說(shuō)明y與t的線性相關(guān)程度相當(dāng)高,從而可以用線性回歸模型擬合y與t的關(guān)系.,所以預(yù)測(cè)2016年我國(guó)生活垃圾無(wú)害化處理量將約為1.82億噸.,熱點(diǎn)四獨(dú)立性檢驗(yàn)【例4】(2018全國(guó)卷)某工廠為提高生產(chǎn)效率,開(kāi)展技術(shù)創(chuàng)新活動(dòng),提出了完成某項(xiàng)生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機(jī)分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時(shí)間(單位:min)繪制了如圖所示的莖葉圖:,(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說(shuō)明理由;(2)求40名工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時(shí)間超過(guò)m和不超過(guò)m的工人數(shù)填入下面的列聯(lián)表:,(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異?,第二種生產(chǎn)方式的效率更高.,(2)由莖葉圖數(shù)據(jù)得到m80.由此填寫列聯(lián)表如下:,(3)根據(jù)(2)中的列聯(lián)表計(jì)算.,所以有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異.,【訓(xùn)練4】微信是騰訊公司推出的一種手機(jī)通訊軟件,它支持發(fā)送語(yǔ)音短信、視頻、圖片和文字,一經(jīng)推出便風(fēng)靡全國(guó),甚至涌現(xiàn)出一批在微信的朋友圈內(nèi)銷售商品的人(被稱為微商).為了調(diào)查每天微信用戶使用微信的時(shí)間,某經(jīng)銷化妝品的微商在一廣場(chǎng)隨機(jī)采訪男性、女性用戶各50名,將男性、女性使用微信的時(shí)間分成5組:(0,2,(2,4,(4,6,(6,8,(8,10分別加以統(tǒng)計(jì),得到如圖所示的頻率分布直方圖.,(1)根據(jù)女性頻率分布直方圖估計(jì)女性使用微信的平均時(shí)間;(2)若每天玩微信超過(guò)4小時(shí)的用戶列為“微信控”,否則稱其為“非微信控”,請(qǐng)你根據(jù)已知條件完成22的列聯(lián)表,并判斷是否有90%的把握認(rèn)為“微信控”與“性別有關(guān)”?解(1)女性平均使用微信的時(shí)間為:0.1610.2430.2850.270.1294.76(小時(shí)).,(2)由已知得:2(0.04a0.1420.12)1,解得a0.08.由題設(shè)條件得列聯(lián)表,所以有90%的把握認(rèn)為“微信控”與“性別”有關(guān).,1.用樣本估計(jì)總體是統(tǒng)計(jì)的基本思想.用樣本頻率分布來(lái)估計(jì)總體分布的重點(diǎn)是頻率分布表和頻率分布直方圖的繪制及用樣本頻率分布估計(jì)總體分布;難點(diǎn)是頻率分布表和頻率分布直方圖的理解及應(yīng)用.2.(1)眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢(shì)的量,平均數(shù)是最重要的量,與每個(gè)樣本數(shù)據(jù)有關(guān),這是中位數(shù)、眾數(shù)所不具有的性質(zhì).(2)標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度就越大.,3.莖葉圖、頻率分布表和頻率分布直方圖,4.回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法,只有在散點(diǎn)圖大致呈線性時(shí),求出的線性回歸方程才有實(shí)際意義,否則,求出的線性回歸方程毫無(wú)意義.根據(jù)回歸方程進(jìn)行預(yù)報(bào),僅是一個(gè)預(yù)報(bào)值,而不是真實(shí)發(fā)生的值.,