高考數學 9.4 變量間的相關關系與統(tǒng)計案例課件.ppt
《高考數學 9.4 變量間的相關關系與統(tǒng)計案例課件.ppt》由會員分享,可在線閱讀,更多相關《高考數學 9.4 變量間的相關關系與統(tǒng)計案例課件.ppt(81頁珍藏版)》請在裝配圖網上搜索。
第四節(jié) 變量間的相關關系與統(tǒng)計案例,【知識梳理】 1.必會知識 教材回扣 填一填 (1)回歸分析 回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方 法;判斷相關性的常用統(tǒng)計圖是:_______;統(tǒng)計量有:_________(取 值范圍[-1,1])、相關指數等.,散點圖,相關系數,(2)線性回歸方程 兩個具有線性相關關系的變量的一組數據:(x1,y1),(x2,y2),…,(xn,yn),其回歸方程為 其中, 是回歸方程的_____, 是在y軸上的截距.,斜率,(3)獨立性檢驗 ①2×2列聯表: 假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱2×2列聯表)為:,a+b,b+d,②K2統(tǒng)計量: K2= (其中n=a+b+c+d為樣本容量).,2.必備結論 教材提煉 記一記 (1)從散點圖看相關性: 正相關:樣本點分布在從_______________的區(qū)域內; 負相關:樣本點分布在從_______________的區(qū)域內.,左下角到右上角,左上角到右下角,(2)從相關系數看相關性: ①當r0時,表明兩個變量正相關; 當r0.75時具有較強的相關性.,越弱,越強,(3)從相關指數看相關性: R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好.在線性回歸模型中,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好. 3.必用技法 核心總結 看一看 統(tǒng)計思想的應用:結論都是估計結果,不是精確結果.,【小題快練】 1.思考辨析 靜心思考 判一判 (1)相關關系的兩個變量是非確定關系.( ) (2)散點圖中的點越集中,兩個變量的線性相關性越強.( ) (3)對于分類變量X與Y,它們的隨機變量K2的觀測值越小.“X與Y有關聯”的把握程度越大.( ),【解析】(1)正確.相關關系不是確定關系. (2)錯誤.散點圖上的點大致分布在通過散點圖中心的那條直線附近,整體上呈線性分布時,兩個變量相關關系越強. (3)錯誤.K2越大,“X與Y有關聯”的把握程度越大. 答案:(1)√ (2)× (3)×,2.教材改編 鏈接教材 練一練 (1)(選修2-3P81例1改編)若8名學生的身高和體重數據如下表:,第3名學生的體重漏填,但線性回歸方程是 =0.849x-85.712,則第3名學生的體重估計為 .,【解析】設第3名學生的體重為a,根據樣本點的中心一定在回歸 直線上,可得 解得a≈50. 答案:50 kg,(2)(選修2-3P97習題3.2T1改編)為了解某班學生喜愛打籃球是否與性別有關,對該班50名學生進行了問卷調查,得到了如下的2×2列聯表:,則在犯錯誤的概率不超過 的前提下認為喜愛打籃球與性別 有關. 附:K2=,【解析】由公式可得K2≈8.3337.879,故填0.005. 答案:0.005,3.真題小試 感悟考題 試一試 (1)(2014·湖北高考)根據如下樣本數據,得到的回歸方程為 =bx+a,則( ) A.a0,b0,b0 C.a0,【解析】選A.畫出散點圖如圖所示,y的值大致隨x的增加而減小,所以b0.,(2)(2015·蘭州模擬)如表提供了某廠節(jié)能降耗技術改造后在生產A 產品過程中記錄的產量x(噸)與相應的生產能耗y(噸)的幾組對應數 據,根據表提供的數據,求出y關于x的線性回歸方程為 =0.7x+0.35, 則下列結論錯誤的是( ),A.產品的生產能耗與產量呈正相關 B.t的取值必定是3.15 C.回歸直線一定過(4.5,3.5) D.A產品每多生產1噸,則相應的生產能耗約增加0.7噸,【解析】選B.由題意, 因為 =0.7x+0.35, 所以 =0.7×4.5+0.35=3.5, 所以t=4×3.5-2.5-4-4.5=3,故選B.,(3)(2015·泉州模擬)已知某產品連續(xù)4個月的廣告費用x1(千元) 與銷售額y1(萬元),經過對這些數據的處理,得到如下數據信息: ① ②廣告費用x和銷售額y之間具有較強的線性相關關系; ③回歸直線方程 中的 =0.8(用最小二乘法求得). 那么,廣告費用為6千元時,可預測銷售額約為( ) A.3.5萬元 B.4.7萬元 C.4.9萬元 D.6.5萬元,【解析】選B.因為 所以 因為回歸直線方程 所以 所以 x=6時,可預測銷售額約為4.7萬元.故選B.,考點1 相關關系的判斷 【典例1】(1)已知變量x,y呈線性相關關系,回歸方程為 =0.5+2x,則變量x,y呈( ) A.線性正相關關系 B.由回歸方程無法判斷其正負相關 C.線性負相關關系 D.非常強的相關關系,(2)甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數r與殘差平方和m如下表:,則哪位同學的試驗結果體現A、B兩變量有更強的線性相關性( ) A.甲 B.乙 C.丙 D.丁 【解題提示】(1)看隨x的變化y的變化趨勢. (2)利用相關系數和殘差平方和的意義判斷.,【規(guī)范解答】(1)選A.因為 =20,所以變量x,y呈線性正相關關系. (2)選D.在驗證兩個變量之間的線性相關關系時,相關系數的絕對值越接近于1,相關性越強,在四個選項中只有丁的相關系數最大;殘差平方和越小,相關性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結果體現了A,B兩變量有更強的線性相關性,故選D.,【互動探究】題(1)中,x增加3個單位,y的變化是 . 【解析】因為是正相關關系,所以y增加6個單位. 答案:增加6個單位,【規(guī)律方法】線性相關關系與函數關系的區(qū)別 (1)函數關系中的兩個變量間是一種確定性關系.例如,正方形面積S與邊長x之間的關系S=x2就是函數關系. (2)相關關系是一種非確定性關系,即相關關系是非隨機變量與隨機變量之間的關系.例如,商品的銷售額與廣告費是相關關系.兩個變量具有相關關系是回歸分析的前提.,【變式訓練】1.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關指數R2如下,其中擬合效果最好的模型是( ) A.模型1的相關指數R2為0.98 B.模型2的相關指數R2為0.80 C.模型3的相關指數R2為0.50 D.模型4的相關指數R2為0.25 【解析】選A.相關指數R2越大,擬合效果越好.,2.對于給定的兩個變量的統(tǒng)計數據,下列說法正確的是( ) A.都可以分析出兩個變量的關系 B.都可以用一條直線近似表示兩者的關系 C.都可以作出散點圖 D.都可以用確定的表達式表示兩者的關系 【解析】選C.給出一組樣本數據,總可以作出相應的散點圖,故C正確,但不一定能分析出兩個變量的關系,故A不正確,更不一定符合線性相關,不一定用一條直線近似表示,故B不正確,兩個變量的統(tǒng)計數據不一定有函數關系,故D不正確.故選C.,【加固訓練】1.下列命題:①線性回歸方法就是由樣本點去尋找一 條貼近這些樣本點的直線的數學方法;②利用樣本點的散點圖可以 直觀判斷兩個變量的關系是否可以用線性關系表示;③通過回歸直 線 及回歸系數 ,可以估計和預測變量的取值和變化趨 勢.其中正確的命題是( ) A.①② B.①③ C.②③ D.①②③,【解析】選D.線性回歸方法就是由樣本點去尋找一條貼近這些樣本點 的直線的數學方法,找擬合效果最好的直線,故①正確,利用樣本點的 散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示,②正 確,通過回歸直線 及回歸系數 ,可以估計和預測變量的取值和變化趨勢,③正確,綜上可知①②③正確,故選D.,2.某棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進行施化肥量x對產量y影響的試驗,得到如表所示的一組數據(單位:kg).,(1)畫出散點圖. (2)判斷是否具有相關關系.,【解析】(1)散點圖如圖所示.,(2)由散點圖知,各組數據對應點大致都在一條直線附近,所以施化肥量x與棉花產量y具有線性相關關系.,考點2 獨立性檢驗 【典例2】(1)某高校“統(tǒng)計初步”課程的教師隨機調查了選該課程的一些學生的情況,具體數據如表:,為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據表中的數據,得到 K2= ≈4.844. 因為K23.841,所以判定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性為 .,(2)(2014·遼寧高考改編)某大學餐飲中心為了解新生的飲食習慣,在全校一年級學生中進行了抽樣調查,調查結果如下表所示:,①根據表中數據,問是否在犯錯誤的概率不超過5%的前提下認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”. ②已知在被調查的北方學生中有5名數學系的學生,其中2名喜歡甜品,現在從這5名學生中隨機抽取3人,求至多有1人喜歡甜品的概率. 附:K2=,【解題提示】(1)對照臨界值表判斷. (2)①代入公式求出K2值再判斷;②利用古典概型的概率公式求解.,【規(guī)范解答】(1)因為P(K2≥3.841)=0.05,4.8443.841, 所以判斷出錯的可能性不超過5%. 答案:不超過5% (2)①將2×2列聯表中的數據代入計算公式, 得K2= 由于4.7623.841,所以在犯錯誤的概率不超過5%的前提下認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”.,②從5名數學系學生中抽取3人的一切可能結果所組成的基本事件為下列10個: (a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2), (a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3), (a2,b2,b3),(b1,b2,b3),,其中ai(i=1,2)表示喜歡甜品的學生,bj(j=1,2,3)表示不喜歡甜品的學生, 這10個基本事件的出現是等可能的. 抽取3人,至多有1人喜歡甜品的事件為以下7個: (a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2), (a2,b1,b3),(a2,b2,b3),(b1,b2,b3), 從這5名學生中隨機抽取3人,至多有1人喜歡甜品的概率為,【規(guī)律方法】解獨立性檢驗的應用問題的關注點 (1)兩個明確: ①明確兩類主體. ②明確研究的兩個問題. (2)兩個關鍵: ①準確畫出2×2列聯表; ②準確理解K2. 提醒:準確計算K2的值是正確判斷的前提.,【變式訓練】(2014·安徽高考改編)某高校共有學生15000人,其中男生10500人,女生4500人,為調查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時間的樣本數據(單位:小時).,(1)應收集多少位女生的樣本數據? (2)根據這300個樣本數據,得到學生每周平均體育運動時間的頻率 分布直方圖(如圖所示),其中樣本數據的分組區(qū)間為:[0,2],(2,4], (4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率.,(3)在樣本數據中,有60位女生的每周平均體育運動時間超過4小時.請完成每周平均體育運動時間與性別的列聯表,并判斷是否在犯錯誤的概率不超過5%的前提下認為“該校學生的每周平均體育運動時間與性別有關”. 附:K2=,【解題提示】分清樣本總體、個體的概念,識別頻率分布直方圖,正確列出列聯表求解,本題屬于容易題.,【解析】(1)300× =90, 所以應收集90位女生的樣本數據. (2)由頻率分布直方圖得2×(0.150+0.125+0.075+0.025)=0.75, 所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75. (3)由(2)知,300位學生中有300×0.75=225人的每周平均體育運動時間超過4個小時,75人的每周平均體育運動時間不超過4個小時.又因為樣本數據中有210份是關于男生的,90份是關于女生的,所以每周平均體育運動時間與性別的列聯表如下:,每周平均體育運動時間與性別列聯表,結合列聯表可算得K2的觀測值 所以在犯錯誤的概率不超過5%的前提下認為“該校學生的每周平均體育運動時間與性別有關”.,【加固訓練】(2014·長治模擬)為了調查某大學學生在周日上網的時間,隨機對100名男生和100名女生進行了不記名的問卷調查,得到了如下的統(tǒng)計結果: 表1 男生上網時間與頻數分布表 表2 女生上網時間與頻數分布表,(1)若該大學共有女生750人,試估計其中上網時間不少于60分鐘的人數. (2)完成表3的2×2列聯表,并回答能否在犯錯誤的概率不超過0.1的前提下認為“學生周日上網時間與性別有關”? (3)從表3的男生中“上網時間少于60分鐘”和“上網時間不少于60分鐘”的人數中用分層抽樣的方法抽取一個容量為5的樣本,再從中任取兩人,求至少有一人上網時間超過60分鐘的概率.,表3,【解析】(1)設上網時間不少于60分鐘的人數為x. 依據題意有 解得:x=225, 所以估計其中上網的時間不少于60分鐘的人數是225人.,(2)根據題目所給數據得到如下列聯表,,其中K2= ≈2.1982.706, 因此,不能在犯錯誤的概率不超過0.1的前提下認為“學生周日上網時間與性別有關”.,(3)因為上網時間少于60分鐘的有3個,記為A,B,C,上網時間不少于 60分鐘的有2人,記為D,E,所以從中任取兩人的所有基本事件為:(AB),(AC),(AD),(AE),(BC),(BD),(BE),(CD),(CE),(DE),共 10種,其中“至少有一人上網時間超過60分鐘”包含7種,所以P=,考點3 線性回歸分析及應用 知·考情 高考中對線性回歸分析的考查主要在兩個方面:一是求回歸直線方程,尤其是回歸直線必過樣本點中心是常考知識點;二是利用回歸直線方程進行預測.,明·角度 命題角度1:求線性回歸方程 【典例3】(2014·重慶高考)已知變量x與y正相關,且由觀測數據 算得樣本的平均數 =2.5, =3.5,則由觀測的數據得線性回歸方程可能為( ) A. =0.4x+2.3 B. =2x-2.4 C. =-2x+9.5 D. =-0.3x+4.4,【解題提示】利用回歸方程必過樣本點中心進行排除. 【規(guī)范解答】選A.因為y=bx+a正相關,則b0,所以排除C,D,因為 過( ),所以將 =2.5代入A,B,算得A中結果更接近3.5,所以選A.,命題角度2:線性回歸方程的應用 【典例4】(2014·新課標全國卷Ⅱ)某地區(qū)2007年至2013年農村居民家庭人均純收入y(單位:千元)的數據如下表:,(1)求y關于t的線性回歸方程. (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農村居民家庭人 均純收入的變化情況,并預測該地區(qū)2015年農村居民家庭人均純收入.,【解題提示】(1)利用公式求得回歸方程. (2)利用回歸方程中 的正負分析變化情況,將2015年的年份代號代入回歸方程,估計家庭人均純收入.,【規(guī)范解答】(1)因為,(2)因為 = 0,所以2007年至2013年該地區(qū)人均純收入穩(wěn)步增 長,預計到2015年,該地區(qū)人均純收入y= ×9+2.3=6.8(千元), 所以預計到2015年,該地區(qū)人均純收入約6 800元左右.,悟·技法 線性回歸分析問題的類型及解題方法 (1)求線性回歸方程. ①利用公式,求出回歸系數b,a. ②待定系數法:利用回歸直線過樣本點中心求系數. (2)利用回歸方程進行預測: 把回歸直線方程看作一次函數,求函數值. (3)利用回歸直線判斷正、負相關:決定正相關還是負相關的是系數b.,通·一類 1.(2013·湖北高考)四名同學根據各自的樣本數據研究變量x,y之間的相關關系,并求得回歸直線方程,分別得到以下四個結論: ①y與x負相關且 =2.347x-6.423; ②y與x負相關且 =-3.476x+5.648; ③y與x正相關且 =5.437x+8.493; ④y與x正相關且 =-4.326x-4.578. 其中一定不正確的結論的序號是( ) A.①② B.②③ C.③④ D.①④,【解題提示】x的系數的符號決定變量x,y之間的正、負相關關系. 【解析】選D.x的系數大于0為正相關,小于0為負相關.,2.(2015·沈陽模擬)高三某班學生每周用于物理學習的時間x(單位:小時)與物理成績y(單位:分)之間有如下關系:,根據上表可得回歸方程的斜率為3.53,則回歸直線在y軸上的截距為 .(答案保留到0.1),【解析】由已知可得 設回歸直線方程為 =3.53x+ ,則74.9=3.53×17.4+ ,解得 ≈13.5. 答案:13.5,3.(2015·重慶模擬)重慶市某知名中學高三年級甲班班主任近期對班上每位同學的成績作相關分析時,得到石周卓婷同學的某些成績數據如下:,(1)求總分年級名次關于數學總分的線性回歸方程 (必要時用分數表示). (2)若石周卓婷同學想在下次的測試時考入年級前100名,預測該同學下次測試的數學成績至少應考多少分(取整數,可四舍五入).,【解析】(1)因為 (2)因為y=100,所以100=- x+533,所以x≈128. 所以該同學下次測試的數學成績至少應考128分.,4.(2015·貴陽模擬)為了分析某個高三學生的學習狀態(tài),對其下一階段的學習提供指導性建議.現對他前7次考試的數學成績x、物理成績y進行分析.下面是該生7次考試的成績.,(1)他的數學成績與物理成績哪個更穩(wěn)定?請給出你的證明. (2)已知該生的物理成績y與數學成績x是線性相關的,若該生的物 理成績達到115分,請你估計他的數學成績大約是多少?并請你根據 物理成績與數學成績的相關性,給出該生在學習數學、物理上的合 理建議.(其中,數據(xi,yi)(i=1,2,…,n)的線性回歸方程為,【解析】(1)因為 從而 ,所以該生的物理成績更穩(wěn)定.,(2)由于x與y之間具有線性相關關系, 所以 所以線性回歸方程為 =0.5x+50.當y=115時,x=130. 建議:進一步加強對數學的學習,提高數學成績的穩(wěn)定性,這將有助于物理成績的進一步提高.,規(guī)范解答19 獨立性檢驗與概率的綜合應用 【典例】(12分)(2015·漳州模擬)某旅行社為調查市民喜歡“人文景觀”景點是否與年齡有關,隨機抽取了55名市民,得到數據如下表:,(1)判斷是否在犯錯誤的概率不超過0.5%的前提下認為喜歡“人文景觀”景點與年齡有關? (2)用分層抽樣的方法從喜歡“人文景觀”景點的市民中隨機抽取6人作進一步調查,將這6位市民作為一個樣本,從中任選2人,求恰有1位“大于40歲”的市民和1位“20歲至40歲”的市民的概率.,下面的臨界值表供參考:,(參考公式:K2= ,其中n=a+b+c+d),解題導思 研讀信息 快速破題,規(guī)范解答 閱卷標準 體會規(guī)范 (1) 所以在犯錯誤的概率不超過0.5%的前提下認為喜歡“人文景觀” 景點與年齡有關.………………………………………………5分,,(2)設所抽樣本中有m個“大于40歲”市民,則 得m=4, 所以樣本中有4個“大于40歲”的市民,2個“20歲至40歲”的市 民,分別記作B1,B2,B3,B4,C1,C2,從中任選2人的基本事件有 共15個. …………………………………………………………9分,,其中恰有1名“大于40歲”和1名“20歲至40歲”的市民的事件有(B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共8個. 所以恰有1名“大于40歲”的市民和1名“20歲至40歲”的市民的概 率為P= . ……………………………………………………12分,高考狀元 滿分心得 把握規(guī)則 爭取滿分 1.計算準確:數學往往通過數字說明問題,計算結果必須準確.如(1)中K2的計算要仔細,參考數據表的應用要對應準確. 2.獨立性檢驗中,K2值越大,兩變量有關的可能性越大,在(1)中下結論時易得出相反的錯誤結論. 3.古典概型中列舉基本事件時,要按照一定的順序列舉,做到不重不漏,在(2)中這是導致失分的主要原因.,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 高考數學 9.4 變量間的相關關系與統(tǒng)計案例課件 高考 數學 變量 相關 關系 統(tǒng)計 案例 課件
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://italysoccerbets.com/p-2182764.html