2019高考數(shù)學(xué)二輪復(fù)習(xí) 第一篇 微型專題 專題5 概率與統(tǒng)計(jì)知識(shí)整合學(xué)案 理.docx
專題5概率與統(tǒng)計(jì)一、計(jì)數(shù)原理1.分類加法計(jì)數(shù)原理和分步乘法計(jì)數(shù)原理的區(qū)別是什么?分類加法計(jì)數(shù)原理針對(duì)“分類”問(wèn)題,其中各種方法相互獨(dú)立,用其中任何一種方法都可以做完這件事;分步乘法計(jì)數(shù)原理針對(duì)“分步”問(wèn)題,各個(gè)步驟相互依存,只有各個(gè)步驟都完成了才算完成這件事.2.排列數(shù)、組合數(shù)的公式及性質(zhì)是什么?公式(1)Anm=n(n-1)(n-2)(n-m+1)=n!(n-m)!(2)Cnm=AnmAmm=n(n-1)(n-2)(n-m+1)m!=n!m!(n-m)!(n,mN+,且mn)特別地,Cn0=1性質(zhì)(1)0!=1;Ann=n!(2)Cnm=Cnn-m;Cn+1m=Cnm+Cnm-13.二項(xiàng)式系數(shù)的性質(zhì)是什么?性質(zhì)性質(zhì)描述對(duì)稱性與首末兩端“等距離”的兩個(gè)二項(xiàng)式系數(shù)相等,即Cnk=Cnn-k增減性二項(xiàng)式系數(shù)Cnk當(dāng)k<n+12(nN+)時(shí),二項(xiàng)式系數(shù)是遞增的當(dāng)k>n+12(nN+)時(shí),二項(xiàng)式系數(shù)是遞減的二項(xiàng)式系數(shù)的最大值當(dāng)n為偶數(shù)時(shí),中間的一項(xiàng)Cnn2取得最大值當(dāng)n為奇數(shù)時(shí),中間的兩項(xiàng)Cnn-12與Cnn+12取得最大值并且相等4.各二項(xiàng)式系數(shù)的和是什么?(1)(a+b)n展開(kāi)式的各項(xiàng)二項(xiàng)式系數(shù)的和為Cn0+Cn1+Cn2+Cnn=2n.(2)偶數(shù)項(xiàng)的二項(xiàng)式系數(shù)的和等于奇數(shù)項(xiàng)的二項(xiàng)式系數(shù)的和,即Cn0+Cn2+Cn4+=Cn1+Cn3+Cn5+=2n-1.二、概率1.互斥事件與對(duì)立事件有什么區(qū)別與聯(lián)系?互斥與對(duì)立都是兩個(gè)事件的關(guān)系,互斥事件是不可能同時(shí)發(fā)生的兩個(gè)事件,而對(duì)立事件除要求這兩個(gè)事件不同時(shí)發(fā)生外,還要求二者之一必須有一個(gè)發(fā)生.因此,對(duì)立事件是互斥事件的特殊情況,而互斥事件不一定是對(duì)立事件.2.基本事件的三個(gè)特點(diǎn)是什么?(1)每一個(gè)基本事件發(fā)生的可能性都是相等的;(2)任何兩個(gè)基本事件都是互斥的;(3)任何事件(除不可能事件)都可以表示成基本事件的和.3.古典概型、幾何概型的概率公式分別是什么?古典概型的概率公式:P(A)=事件A包含的基本事件的個(gè)數(shù)(m)基本事件的總數(shù)(n).幾何概型的概率公式:P(A)=構(gòu)成事件A的區(qū)域長(zhǎng)度(面積或體積)試驗(yàn)的全部結(jié)果所構(gòu)成的區(qū)域長(zhǎng)度(面積或體積).三、統(tǒng)計(jì)初步與統(tǒng)計(jì)案例1.分層抽樣的適用范圍是什么?當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣的方法.2.如何作頻率分布直方圖?(1)求極差(即一組數(shù)據(jù)中最大值與最小值的差).(2)決定組距與組數(shù).(3)將數(shù)據(jù)分組.(4)列頻率分布表.(5)畫(huà)頻率分布直方圖.3.頻率分布直方圖的特點(diǎn)是什么?(1)頻率分布直方圖中相鄰兩橫坐標(biāo)之差表示組距,縱坐標(biāo)表示頻率組距,頻率=組距頻率組距.(2)在頻率分布直方圖中,各小長(zhǎng)方形的面積總和等于1.因?yàn)樵陬l率分布直方圖中組距是一個(gè)固定值,所以各小長(zhǎng)方形高的比也就是頻率比.(3)頻率分布表和頻率分布直方圖是一組數(shù)據(jù)頻率分布的兩種形式,前者準(zhǔn)確,后者直觀.4.如何進(jìn)行回歸分析?(1)定義:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.(2)樣本點(diǎn)的中心對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn),其中(x-,y-)稱為樣本點(diǎn)的中心.(3)相關(guān)系數(shù)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng).r的絕對(duì)值越接近于0,表明兩個(gè)變量之間的線性相關(guān)性越弱.通常當(dāng)|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性.5.獨(dú)立性檢驗(yàn)的一般步驟是什么?解決獨(dú)立性檢驗(yàn)的應(yīng)用問(wèn)題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論.獨(dú)立性檢驗(yàn)的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表;(2)根據(jù)公式K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)計(jì)算K2的觀測(cè)值k;(3)比較k與臨界值的大小關(guān)系,做出統(tǒng)計(jì)推斷.四、隨機(jī)變量及其應(yīng)用1.離散型隨機(jī)變量的分布列及性質(zhì)是什么?(1)離散型隨機(jī)變量的分布列:若離散型隨機(jī)變量X所有可能的取值為x1,x2,xi,xn,X取每一個(gè)值xi(i=1,2,n)的概率為p1,p2,pn,則表Xx1x2xixnPp1p2pipn稱為離散型隨機(jī)變量X的概率分布列或稱為離散型隨機(jī)變量X的分布列.(2)離散型隨機(jī)變量的分布列的性質(zhì):0pi1(i=1,2,3,n);p1+p2+pn=1;P(xiXxj)=pi+pi+1+pj.2.事件的相互獨(dú)立性的概念及公式是什么?(1)相互獨(dú)立的定義:事件A是否發(fā)生對(duì)事件B是否發(fā)生的概率沒(méi)有影響,即P(B|A)=P(B).這時(shí),稱事件A與事件B相互獨(dú)立,并把這兩個(gè)事件叫作相互獨(dú)立事件.(2)概率公式條件公式事件A,B相互獨(dú)立P(AB)=P(A)P(B)事件A1,A2,An相互獨(dú)立P(A1A2An)=P(A1)P(A2)P(An)3.獨(dú)立重復(fù)試驗(yàn)與二項(xiàng)分布的概念和公式是什么?(1)獨(dú)立重復(fù)試驗(yàn)定義:在相同條件下,重復(fù)地做n次試驗(yàn),各次試驗(yàn)相互獨(dú)立,那么一般就稱它們?yōu)閚次獨(dú)立重復(fù)試驗(yàn).概率公式:在一次試驗(yàn)中事件A發(fā)生的概率為p,則n次獨(dú)立重復(fù)試驗(yàn)中,事件A恰好發(fā)生k次的概率為Pn(k)=Cnkpk(1-p)n-k(k=0,1,2,n).(2)二項(xiàng)分布:在n次獨(dú)立重復(fù)試驗(yàn)中,事件A發(fā)生的次數(shù)設(shè)為X,事件A不發(fā)生的概率為q=1-p,則n次獨(dú)立重復(fù)試驗(yàn)中事件A恰好發(fā)生k次的概率是P(X=k)=Cnkpkqn-k,其中k=0,1,2,n,于是X的分布列:X01knPCn0p0qnCn1pqn-1Cnkpkqn-kCnnpnq0此時(shí)稱離散型隨機(jī)變量X服從參數(shù)為n,p的二項(xiàng)分布,記作XB(n,p).4.正態(tài)分布的概念及性質(zhì)是什么?(1)正態(tài)曲線:正態(tài)變量的概率密度函數(shù)的圖象叫作正態(tài)曲線,其函數(shù)表達(dá)式為f(x)=12e-(x-)222,xR,其中,為參數(shù),且>0,-<<+.(2)正態(tài)曲線的性質(zhì)曲線位于x軸上方,與x軸不相交,與x軸之間的面積為1;曲線是單峰的,它關(guān)于直線x=對(duì)稱;曲線在x=處達(dá)到峰值12;當(dāng)一定時(shí),曲線的形狀由確定,越小,曲線越“瘦高”,表示總體的分布越集中;越大,曲線越“矮胖”,表示總體的分布越分散.(3)正態(tài)總體在三個(gè)特殊區(qū)間內(nèi)取值的概率值P(-<X+)=0.6826;P(-2<X+2)=0.9544;P(-3<X+3)=0.9974.5.離散型隨機(jī)變量的數(shù)學(xué)期望(或均值)與方差的概念是什么?設(shè)一個(gè)離散型隨機(jī)變量X所有可能取的值是x1,x2,xn,這些值對(duì)應(yīng)的概率分別是p1,p2,pn.(1)數(shù)學(xué)期望:稱E(X)=x1p1+x2p2+xnpn為離散型隨機(jī)變量X的均值或數(shù)學(xué)期望(簡(jiǎn)稱期望),它刻畫(huà)了這個(gè)離散型隨機(jī)變量取值的平均水平.(2)方差:稱D(X)=(x1-E(X)2p1+(x2-E(X)2p2+(xn-E(X)2pn為離散型隨機(jī)變量X的方差,它反映了離散型隨機(jī)變量取值相對(duì)于期望的平均波動(dòng)大小(或說(shuō)離散程度),D(X)的算術(shù)平方根D(X)叫作離散型隨機(jī)變量X的標(biāo)準(zhǔn)差.6.均值與方差的性質(zhì)有哪些?(1)E(aX+b)=aE(X)+b(a,b為常數(shù)).(2)D(aX+b)=a2D(X)(a,b為常數(shù)).(3)兩點(diǎn)分布與二項(xiàng)分布的均值、方差的公式若X服從兩點(diǎn)分布,則E(X)=p,D(X)=p(1-p).若XB(n,p),則E(X)=np,D(X)=np(1-p).幾何概型、古典概型、相互獨(dú)立事件與互斥事件的概率、條件概率是高考的熱點(diǎn),幾何概型主要以客觀題形式考查,求解的關(guān)鍵在于找準(zhǔn)測(cè)度(長(zhǎng)度或面積);相互獨(dú)立事件、互斥事件常作為解答題的一部分考查,也是進(jìn)一步求分布列、期望與方差的基礎(chǔ),求解該類問(wèn)題要正確理解題意,準(zhǔn)確判定概率模型,恰當(dāng)選擇概率公式.近幾年的高考數(shù)學(xué)試題對(duì)統(tǒng)計(jì)案例的考查一般不單獨(dú)命題,而是與概率、隨機(jī)變量的數(shù)學(xué)期望交匯命題,高考對(duì)此類題目的要求是能根據(jù)給出的或通過(guò)統(tǒng)計(jì)圖表給出的相關(guān)數(shù)據(jù)求線性回歸方程,了解獨(dú)立性檢驗(yàn)的思想方法,會(huì)判斷兩個(gè)分類變量是否有關(guān).從近幾年高考情形來(lái)看,該類專題在高考中占的比例大約為15%,以簡(jiǎn)單題、中檔題為主,考查題型分選擇題、填空題和解答題.一、選擇題、填空題的命題特點(diǎn)(一)考查排列、組合的應(yīng)用,以考查兩個(gè)計(jì)數(shù)原理和排列、組合的應(yīng)用為主,難度中等,常常以選擇題、填空題的形式出現(xiàn).1.(2018全國(guó)卷理T15改編)從2名女生,4名男生中選3人參加科技比賽,恰有1名女生入選,則不同的選法共有種.(用數(shù)字填寫(xiě)答案)解析由題意可得有1名女生,2名男生,則有C21C42=12種不同的選法.答案122.(2018浙江卷T16改編)從1,3,5,7,9中任取2個(gè)數(shù)字,從2,4,6中任取2個(gè)數(shù)字,一共可以組成個(gè)沒(méi)有重復(fù)數(shù)字的四位數(shù).(用數(shù)字作答)解析一共可以組成C52C32A44=720個(gè)沒(méi)有重復(fù)數(shù)字的四位數(shù).答案7203.(2017全國(guó)卷理T6改編)安排5名志愿者完成4項(xiàng)工作,每項(xiàng)工作只需由1人完成,則不同的安排方式共有().A.120種B.180種C.240種D.360種解析由題意可得,5人中選出4人完成工作,剩下1人沒(méi)有工作,故不同的安排方式有C54A44=120(種).答案A(二)考查二項(xiàng)式定理的應(yīng)用,以考查運(yùn)用二項(xiàng)式定理求特定項(xiàng)、求項(xiàng)數(shù)和二項(xiàng)式定理性質(zhì)的應(yīng)用為主,難度中等,常常以選擇題、填空題的形式出現(xiàn).4.(2018全國(guó)卷理T5改編)x2+2x5的展開(kāi)式中x的系數(shù)為().A.10B.20C.40D.80解析由題可得Tr+1C=5r(x2)5-r2xrC=5r2rx10-3r,令10-3r=1,得r=3.所以C5r2r=C5323=80.答案D5.(2017全國(guó)卷理T6改編)1+1x2(1+x)6的展開(kāi)式中x4的系數(shù)為().A.15B.16C.30D.35解析因?yàn)?1+x)6展開(kāi)式的通項(xiàng)為T(mén)r+1C=6rxr,所以1+1x2(1+x)6的展開(kāi)式中含x4的項(xiàng)為1C64x4和1x2C66x6.因?yàn)镃66+C64=16,所以1+1x2(1+x)6的展開(kāi)式中x4的系數(shù)為16.答案B(三)考查隨機(jī)事件的概率,以考查隨機(jī)事件、互斥事件與對(duì)立事件的概率為主,難度中等,常與事件的頻率交匯考查.本節(jié)內(nèi)容在高考中三種題型都有可能出現(xiàn),隨機(jī)事件的頻率與概率題目往往以解答題的形式出現(xiàn),互斥事件、對(duì)立事件的概念及概率題目常常以選擇、填空題的形式出現(xiàn).6.(2018全國(guó)卷文T5改編)若某群體中的成員只用現(xiàn)金支付的概率為0.25,既用現(xiàn)金支付也用非現(xiàn)金支付的概率為0.15,則不用現(xiàn)金支付的概率為().A.0.3B.0.4C.0.6D.0.7解析設(shè)事件A為“不用現(xiàn)金支付”,事件B為“既用現(xiàn)金支付也用非現(xiàn)金支付”,事件C為“只用現(xiàn)金支付”,則P(A)=1-P(B)-P(C)=1-0.15-0.25=0.6,故選C.答案C(四)考查古典概型,全國(guó)卷對(duì)古典概型每年都會(huì)考查,難度中等,主要考查實(shí)際背景的可能事件,通常與互斥事件、對(duì)立事件一起考查.在高考中單獨(dú)命題時(shí),通常以選擇題、填空題形式出現(xiàn),屬于中低檔題.7.(2018全國(guó)卷理T8改編)我國(guó)數(shù)學(xué)家陳景潤(rùn)在哥德巴赫猜想的研究中取得了世界領(lǐng)先的成果.哥德巴赫猜想是“每個(gè)大于2的偶數(shù)可以表示為兩個(gè)素?cái)?shù)的和”,如30=7+23.在不超過(guò)30的素?cái)?shù)中,隨機(jī)選取2個(gè)不同的數(shù),其和等于26的概率是().A.112B.114C.115D.245解析不超過(guò)30的素?cái)?shù)有2,3,5,7,11,13,17,19,23,29,共10個(gè),從中隨機(jī)選取2個(gè)不同的數(shù),共有C102=45種取法.因?yàn)?+23=7+19=26,所以隨機(jī)選取2個(gè)不同的數(shù),其和等于26的有2種取法,故所求概率為245.答案D8.(2018江蘇卷T6改編)某興趣小組有2名男生和3名女生,現(xiàn)從中任選2名學(xué)生去參加活動(dòng),則恰好選中1名男生和1名女生的概率為.解析從5名學(xué)生中任選2名學(xué)生,共有C52=10種選法,其中恰好選中1名男生和1名女生的選法有C21C31=6種,因此所求概率為610=35.答案35(五)考查幾何概型,難度較大,以理解幾何概型的概念、概率公式為主,會(huì)求一些簡(jiǎn)單的幾何概型的概率,常與平面幾何、線性規(guī)劃、不等式的解集等知識(shí)交匯考查,在高考中多以選擇題、填空題的形式考查,難度中等.9.(2018全國(guó)卷理T10改編)折紙藝術(shù)是我國(guó)古代留下來(lái)寶貴的民間藝術(shù),具有很高的審美價(jià)值和應(yīng)用價(jià)值.如圖所示的是一個(gè)折紙圖案,由一個(gè)正方形內(nèi)切一個(gè)圓形,然后在四個(gè)頂點(diǎn)處分別嵌入半徑為正方形邊長(zhǎng)一半的扇形.向圖中隨機(jī)投入一個(gè)質(zhì)點(diǎn),則質(zhì)點(diǎn)落在陰影部分的概率P1與質(zhì)點(diǎn)落在正方形內(nèi)圓形區(qū)域外面的概率P2的大小關(guān)系是().A.P1>P2B.P1<P2C.P1=P2D.不能確定解析將正方形內(nèi)圓形區(qū)域外面的四個(gè)角進(jìn)行沿直角邊重合組合,恰好得到的圖形就是陰影部分圖形,所以陰影部分區(qū)域的面積等于正方形內(nèi)圓形區(qū)域外面的面積,故P1=P2.答案C10.(2016全國(guó)卷文T8改編)某路口人行橫道的信號(hào)燈為紅燈和綠燈交替出現(xiàn),紅燈持續(xù)時(shí)間為40秒.若一名行人來(lái)到該路口遇到紅燈,則至少需要等待10秒才出現(xiàn)綠燈的概率為().A.34B.710C.58D.310解析至少需要等待10秒才出現(xiàn)綠燈的概率為40-1040=34,故選A.答案A(六)考查隨機(jī)抽樣,在抽樣方法的考查中,系統(tǒng)抽樣、分層抽樣是考查的重點(diǎn),題型主要以選擇題和填空題為主,屬于中低檔題.11.(2017江蘇卷T3改編)某工廠生產(chǎn)甲、乙、丙、丁四種不同型號(hào)的產(chǎn)品,產(chǎn)量分別為200、400、300、100件,為檢驗(yàn)產(chǎn)品的質(zhì)量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進(jìn)行檢驗(yàn),則應(yīng)從甲種型號(hào)的產(chǎn)品中抽取件.解析樣本容量總體個(gè)數(shù)=60200+400+300+100=350,應(yīng)從甲種型號(hào)的產(chǎn)品中抽取350200=12(件).答案12(七)用樣本估計(jì)總體,主要考查平均數(shù)、方差等的計(jì)算以及莖葉圖、頻率分布直方圖的簡(jiǎn)單應(yīng)用.題型以選擇題和填空題為主,出現(xiàn)解答題時(shí)經(jīng)常與概率相結(jié)合,屬于中檔題.12.(2018全國(guó)卷理T3改編)某地區(qū)經(jīng)過(guò)一年的新農(nóng)村建設(shè),農(nóng)村的經(jīng)濟(jì)收入增加了一倍,實(shí)現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況,統(tǒng)計(jì)了該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例,得到如下餅圖:則下列選項(xiàng)中不正確的是().A.新農(nóng)村建設(shè)后,種植收入增加B.新農(nóng)村建設(shè)后,其他收入增加了一倍以上C.新農(nóng)村建設(shè)后,養(yǎng)殖收入沒(méi)有增加D.新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過(guò)了經(jīng)濟(jì)收入的一半解析由題干可知,農(nóng)村的經(jīng)濟(jì)收入增加了一倍,實(shí)現(xiàn)翻番.為方便可設(shè)建設(shè)前后的經(jīng)濟(jì)收入分別為100,200(單位省去).A中,種植收入前后分別為60,74,收入增加了,A正確;B中,其他收入前后分別為4,10,增加了一倍以上,B正確;C中,養(yǎng)殖收入前后分別為30,60,收入增加了一倍,C錯(cuò)誤;D中,建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和為(30+28)2=116>100,D正確.故選C.答案C13.(2017全國(guó)卷理T3)某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務(wù)質(zhì)量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬(wàn)人)的數(shù)據(jù),繪制了下面的折線圖.根據(jù)該折線圖,下列結(jié)論錯(cuò)誤的是().A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相對(duì)于7月至12月,波動(dòng)性更小,變化比較平穩(wěn)解析對(duì)于選項(xiàng)A,由圖易知,月接待游客量每年7,8月份明顯高于12月份,故A錯(cuò)誤;對(duì)于選項(xiàng)B,觀察折線圖的變化趨勢(shì)可知,年接待游客量逐年增加,故B正確;對(duì)于選項(xiàng)C,D,由圖可知顯然正確.答案A(八)考查離散型隨機(jī)變量分布列、超幾何分布、條件概率、正態(tài)分布、數(shù)學(xué)期望與方差,求離散型隨機(jī)變量的數(shù)學(xué)期望是全國(guó)卷高考重點(diǎn)考查的內(nèi)容,在選擇題、填空題中有時(shí)會(huì)出現(xiàn).主要考查離散型隨機(jī)變量的分布列、數(shù)學(xué)期望、正態(tài)分布等.14.(2018全國(guó)卷理T8改編)某群體中的每位成員使用移動(dòng)支付的概率都為p,各成員的支付方式相互獨(dú)立,設(shè)X為該群體的10位成員中使用移動(dòng)支付的人數(shù),D(X)=2.1,P(X=4)<P(X=6),則p=().A.0.7B.0.6C.0.4D.0.3解析因?yàn)閄B(n,p),所以D(X)=np(1-p)=2.1,所以p=0.3或p=0.7.因?yàn)镻(X=4)=C104p4(1-p)6<P(X=6)=C106p6(1-p)4,所以(1-p)2<p2,可得p>0.5.故p=0.7.答案A15.(2017全國(guó)卷理T13改編)一批產(chǎn)品的二等品率為0.08,從這批產(chǎn)品中每次隨機(jī)取一件,有放回地抽取100次,X表示抽到的二等品件數(shù),則D(X)=.解析有放回地抽取,是一個(gè)二項(xiàng)分布模型,其中p=0.08,n=100,則D(X)=np(1-p)=1000.080.92=7.36.答案7.36二、解答題的命題特點(diǎn)概率與統(tǒng)計(jì)綜合試題的題干閱讀量大,容易造成考生在數(shù)學(xué)模型轉(zhuǎn)化過(guò)程中失誤,得分率不高.這些試題主要考查古典概型,用樣本估計(jì)總體,利用回歸方程進(jìn)行預(yù)測(cè),獨(dú)立性檢驗(yàn)的應(yīng)用,離散型隨機(jī)變量的分布列和數(shù)學(xué)期望,正態(tài)分布等.概率、隨機(jī)變量的數(shù)學(xué)期望交匯命題,高考對(duì)此類題目的要求是能根據(jù)給出的或通過(guò)統(tǒng)計(jì)圖表給出的相關(guān)數(shù)據(jù)求線性回歸方程.1.(2018全國(guó)卷理T18)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.為了預(yù)測(cè)該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時(shí)間變量t的兩個(gè)線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,17)建立模型:y=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,7)建立模型:y=99+17.5t.(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值.(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由.解析(1)利用模型,從2000年開(kāi)始算起,2018年即t=19,所以該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為y=-30.4+13.519=226.1(億元).利用模型,從2010年開(kāi)始算起,2018年即t=9,所以該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為y=99+17.59=256.5(億元).(2)利用模型得到的預(yù)測(cè)值更可靠.理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒(méi)有隨機(jī)散布在直線y=-30.4+13.5t上下,這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線性模型不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì).2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線的附近,這說(shuō)明從2010年開(kāi)始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性增長(zhǎng)趨勢(shì),利用2010年至2016年的數(shù)據(jù)建立的線性模型y=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì),因此利用模型得到的預(yù)測(cè)值更可靠.(ii)從計(jì)算結(jié)果看,相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型得到的預(yù)測(cè)值226.1億元的增幅明顯偏低,而利用模型得到的預(yù)測(cè)值的增幅比較合理,說(shuō)明利用模型得到的預(yù)測(cè)值更可靠.2.(2018全國(guó)卷,理T20)某工廠的某種產(chǎn)品成箱包裝,每箱200件,每一箱產(chǎn)品在交付用戶之前要對(duì)產(chǎn)品作檢驗(yàn),如檢驗(yàn)出不合格品,則更換為合格品.檢驗(yàn)時(shí),先從這箱產(chǎn)品中任取20件作檢驗(yàn),再根據(jù)檢驗(yàn)結(jié)果決定是否對(duì)余下的所有產(chǎn)品作檢驗(yàn).設(shè)每件產(chǎn)品為不合格品的概率都為p(0<p<1),且各件產(chǎn)品是否為不合格品相互獨(dú)立.(1)記20件產(chǎn)品中恰有2件不合格品的概率為f(p),求f(p)的最大值點(diǎn)p0.(2)現(xiàn)對(duì)一箱產(chǎn)品檢驗(yàn)了20件,結(jié)果恰有2件不合格品,以(1)中確定的p0作為p的值.已知每件產(chǎn)品的檢驗(yàn)費(fèi)用為2元,若有不合格品進(jìn)入用戶手中,則工廠要對(duì)每件不合格品支付25元的賠償費(fèi)用.(i)若不對(duì)該箱余下的產(chǎn)品作檢驗(yàn),這一箱產(chǎn)品的檢驗(yàn)費(fèi)用與賠償費(fèi)用的和記為X,求E(X).(ii)以檢驗(yàn)費(fèi)用與賠償費(fèi)用和的期望值為決策依據(jù),是否該對(duì)這箱余下的所有產(chǎn)品作檢驗(yàn)?解析(1)由題意可知,獨(dú)立重復(fù)試驗(yàn)符合二項(xiàng)分布,20件產(chǎn)品中恰有2件不合格品的概率為f(p)C=202p2(1-p)18=190p2(1-p)18,對(duì)上式求導(dǎo)得f(p)=190p2(1-p)18=1902p(1-p)18-18p2(1-p)17=190p(1-p)172(1-p)-18p=380p(1-p)17(1-10p).當(dāng)f(p)=0時(shí),有p(1-p)17(1-10p)=0,由0<p<1,得當(dāng)p0,110時(shí),f(p)>0,f(p)單調(diào)遞增;當(dāng)p110,1時(shí),f(p)<0,f(p)單調(diào)遞減.故f(p)max=f(p0)=f110,即p0=110.(2)(i)由題意,剩余未作檢驗(yàn)的產(chǎn)品有180件,其中Y表示不合格品的件數(shù),其服從二項(xiàng)分布YB180,110.故E(Y)=180110=18.又X=40+25Y,故E(X)=E(40+25Y)=40+2518=490(元).(ii)若對(duì)這箱余下的所有產(chǎn)品作檢驗(yàn),則需要的檢驗(yàn)費(fèi)為2002=400(元).因?yàn)镋(X)=490>400,所以需要對(duì)這箱余下的所有產(chǎn)品作檢驗(yàn).3.(2018全國(guó)卷理T18)某工廠為提高生產(chǎn)效率,開(kāi)展技術(shù)創(chuàng)新活動(dòng),提出了完成某項(xiàng)生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機(jī)分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時(shí)間(單位:min)繪制了如下莖葉圖:(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說(shuō)明理由.(2)求40名工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時(shí)間超過(guò)m和不超過(guò)m的工人數(shù)填入下面的列聯(lián)表:超過(guò)m不超過(guò)m第一種生產(chǎn)方式第二種生產(chǎn)方式(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.0500.0100.001k03.8416.63510.828解析(1)第二種生產(chǎn)方式的效率更高.理由如下:(i)由莖葉圖可知,用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時(shí)間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時(shí)間至多79分鐘,因此第二種生產(chǎn)方式的效率更高.(ii)由莖葉圖可知,用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)為85.5分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)為73.5分鐘,因此第二種生產(chǎn)方式的效率更高.(iii)由莖葉圖可知,用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時(shí)間高于80分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時(shí)間低于80分鐘,因此第二種生產(chǎn)方式的效率更高.(iv)由莖葉圖可知,用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布在莖8上的最多,關(guān)于莖8大致呈對(duì)稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布在莖7上的最多,關(guān)于莖7大致呈對(duì)稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布的區(qū)間相同,故可以認(rèn)為用第二種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時(shí)間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時(shí)間更少,因此第二種生產(chǎn)方式的效率更高.(2)由莖葉圖知m=79+812=80.列聯(lián)表如下:超過(guò)m不超過(guò)m第一種生產(chǎn)方式155第二種生產(chǎn)方式515(3)因?yàn)镵2的觀測(cè)值k=40(1515-55)220202020=10>6.635,所以有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異.4.(2017全國(guó)卷理T19)為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過(guò)程,檢驗(yàn)員每天從該生產(chǎn)線上隨機(jī)抽取16個(gè)零件,并測(cè)量其尺寸(單位:cm).根據(jù)長(zhǎng)期生產(chǎn)經(jīng)驗(yàn),可以認(rèn)為這條生產(chǎn)線正常狀態(tài)下生產(chǎn)的零件的尺寸服從正態(tài)分布N(,2).(1)假設(shè)生產(chǎn)狀態(tài)正常,記X表示一天內(nèi)抽取的16個(gè)零件中其尺寸在(-3,+3)之外的零件數(shù),求P(X1)及X的數(shù)學(xué)期望.(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(-3,+3)之外的零件,就認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過(guò)程可能出現(xiàn)了異常情況,需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查.(i)試說(shuō)明上述監(jiān)控生產(chǎn)過(guò)程方法的合理性.(ii)下面是檢驗(yàn)員在一天內(nèi)抽取的16個(gè)零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95經(jīng)計(jì)算得x-=116i=116xi=9.97,s=116i=116(xi-x-)2=116(i=116xi2-16x-2)0.212,其中xi為抽取的第i個(gè)零件的尺寸,i=1,2,16.用樣本平均數(shù)x-作為的估計(jì)值,用樣本標(biāo)準(zhǔn)差s作為的估計(jì)值,利用估計(jì)值判斷是否需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查?剔除(-3,+3)之外的數(shù)據(jù),用剩下的數(shù)據(jù)估計(jì)和(精確到0.01).附:若隨機(jī)變量Z服從正態(tài)分布N(,2),則P(-3<Z<+3)=0.9974,0.9974160.9592,0.0080.09.解析(1)由題可知抽取的一個(gè)零件的尺寸落在(-3,+3)之內(nèi)的概率為0.9974,從而零件的尺寸落在(-3,+3)之外的概率為0.0026,故XB(16,0.0026).因此P(X1)=1-P(X=0)=1-0.9974161-0.9592=0.0408,X的數(shù)學(xué)期望E(X)=160.0026=0.0416.(2)(i)如果生產(chǎn)狀態(tài)正常,一個(gè)零件尺寸在(-3,+3)之外的概率只有0.0026,一天內(nèi)抽取的16個(gè)零件中,出現(xiàn)尺寸在(-3,+3)之外的零件的概率只有0.0408,發(fā)生的概率很小,因此一旦發(fā)生這種情況,就有理由認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過(guò)程可能出現(xiàn)了異常情況,需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查,可見(jiàn)上述監(jiān)控生產(chǎn)過(guò)程的方法是合理的.(ii)由x-=9.97,s0.212,得的估計(jì)值為=9.97,的估計(jì)值為=0.212,由樣本數(shù)據(jù)可以看出有一個(gè)零件的尺寸在(-3,+3)之外,因此需對(duì)當(dāng)天的生產(chǎn)過(guò)程進(jìn)行檢查.剔除(-3,+3)之外的數(shù)據(jù)9.22,剩下數(shù)據(jù)的平均數(shù)為115(169.97-9.22)=10.02,因此的估計(jì)值為10.02.i=116xi2=160.2122+169.9721591.134,剔除(-3,+3)之外的數(shù)據(jù)9.22,剩下數(shù)據(jù)的樣本方差為115(1591.134-9.222-1510.022)0.008,因此的估計(jì)值為0.0080.09.1.樣本數(shù)據(jù)(1)眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢(shì)的量,平均數(shù)是最重要的量,與每個(gè)樣本數(shù)據(jù)有關(guān),這是中位數(shù)、眾數(shù)所不具有的性質(zhì).(2)標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度就越大.(3)莖葉圖、頻率分布表和頻率分布直方圖都是用圖表直觀描述樣本數(shù)據(jù)的分布規(guī)律的.2.頻率分布直方圖(1)用樣本估計(jì)總體是統(tǒng)計(jì)的基本思想,而利用頻率分布表和頻率分布直方圖來(lái)估計(jì)總體則是用樣本的頻率分布去估計(jì)總體分布的兩種主要方法.頻率分布表在數(shù)量表示上比較準(zhǔn)確,頻率分布直方圖比較直觀.(2)頻率分布表中的頻數(shù)之和等于樣本容量,各組中的頻率之和等于1;在頻率分布直方圖中,各小長(zhǎng)方形的面積表示相應(yīng)各組的頻率,所以所有小長(zhǎng)方形的面積的和等于1;平均數(shù)是頻率分布直方圖各個(gè)小矩形的面積底邊中點(diǎn)的橫坐標(biāo)之和.3.排列與組合(1)解決“在”與“不在”的有限制條件的排列問(wèn)題,既可以從元素入手,也可以從位置入手,原則是誰(shuí)“特殊”誰(shuí)優(yōu)先.不管是從元素考慮還是從位置考慮,都要貫徹到底,不能既考慮元素又考慮位置.解決相鄰問(wèn)題的方法是“捆綁法”,即把相鄰元素看作一個(gè)整體和其他元素一起排列,同時(shí)要注意捆綁元素的內(nèi)部排列.解決不相鄰問(wèn)題的方法是“插空法”,即先考慮不受限制的元素的排列,再將不相鄰的元素插在前面元素排列的空當(dāng)中.對(duì)于定序問(wèn)題,可先不考慮順序限制,排列后,再除以定序元素的全排列.若某些問(wèn)題從正面考慮比較復(fù)雜,可從其反面入手,即采用“間接法”.(2)組合問(wèn)題的限制條件主要體現(xiàn)在取出元素中“含”或“不含”某些元素,或者“至少”或“最多”含有幾個(gè)元素:“含有”或“不含有”某些元素的組合題型.“含”,則先將這些元素取出,再由另外元素補(bǔ)足;“不含”,則先將這些元素剔除,再?gòu)氖O碌脑刂腥ミx取.“至少”或“最多”含有幾個(gè)元素的題型.考慮逆向思維,用間接法處理.(3)分組分配問(wèn)題是排列、組合問(wèn)題的綜合運(yùn)用,解決這類問(wèn)題的一個(gè)基本指導(dǎo)思想就是先分組后分配.關(guān)于分組問(wèn)題,有整體均分、部分均分和不等分三種,無(wú)論分成幾組,都應(yīng)注意只要有一些組中元素的個(gè)數(shù)相等,就存在均分現(xiàn)象.4.隨機(jī)變量的均值與方差一般計(jì)算步驟:(1)理解X的意義,寫(xiě)出X的所有可能取的值.(2)求X取各個(gè)值的概率,寫(xiě)出分布列.(3)根據(jù)分布列,由均值的定義求出均值E(X),進(jìn)一步由公式D(X)=i=1n(xi-E(X)2pi=E(X2)-(E(X)2求出D(X).(4)以特殊分布(兩點(diǎn)分布、二項(xiàng)分布、超幾何分布)為背景的均值與方差的計(jì)算:先根據(jù)隨機(jī)變量的特點(diǎn)判斷出隨機(jī)變量服從什么特殊分布;可以根據(jù)特殊分布的概率公式列出分布列,根據(jù)計(jì)算公式計(jì)算出均值和方差,也可以直接應(yīng)用離散型隨機(jī)變量服從特殊分布時(shí)的均值與方差公式來(lái)計(jì)算,若X=a+b不服從特殊分布,但服從特殊分布,可利用有關(guān)性質(zhì)及E(),D()公式求均值和方差.