excel中的概率統(tǒng)計非常好的資料[共41頁]
《excel中的概率統(tǒng)計非常好的資料[共41頁]》由會員分享,可在線閱讀,更多相關《excel中的概率統(tǒng)計非常好的資料[共41頁](41頁珍藏版)》請在裝配圖網上搜索。
1、數(shù)理統(tǒng)計實驗 1 Excel基本操作 1.1 單元格操作 1.1.1 單元格的選取 Excel啟動后首先將自動選取第A列第1行的單元格即A1(或a1)作為活動格,我們可以用鍵盤或鼠標來選取其它單元格.用鼠標選取時,只需將鼠標移至希望選取的單元格上并單擊即可.被選取的單元格將以反色顯示. 1.1.2 選取單元格范圍(矩形區(qū)域) 可以按如下兩種方式選取單元格范圍. (1) 先選取范圍的起始點(左上角),即用鼠標單擊所需位置使其反色顯示.然后按住鼠標左鍵不放,拖動鼠標指針至終點(右下角)位置,然后放開鼠標即可. (2) 先選取范圍的起始點(左上角),即用鼠標單擊所需位置
2、使其反色顯示.然后將鼠標指針移到終點(右下角)位置,先按下Shift鍵不放,而后點擊鼠標左鍵. 1.1.3 選取特殊單元格 在實際中,有時要選取的單元格由若干不相連的單元格范圍組成的.此類有兩種情況. 第一種情況是間斷的單元格選取.選取方法是先選取第一個單元格,然后按住[Ctrl]鍵,再依次選取其它單元格即可. 第二種情況是間斷的單元格范圍選?。x取方法是先選取第一個單元格范圍,然后按住[Ctrl]鍵,用鼠標拖拉的方式選取第二個單元格范圍即可. 1.1.4 公式中的數(shù)值計算 要輸入計算公式,可先單擊待輸入公式的單元格,而后 鍵入=(等號),并接著鍵入公式,公式輸入完畢后按Enter
3、鍵即可確認..如果單擊了“編輯公式”按鈕 或“粘貼函數(shù)”按鈕,Excel將自動插入一個等號. 提示:(1) 通過先選定一個區(qū)域,再鍵入公式,然后按 CTRL+ENTER 組合鍵,可以在區(qū)域內的所有單元格中輸入同一公式. (2) 可以通過另一單元格復制公式,然后在目標區(qū)域內輸入同一公式. 公式是在工作表中對數(shù)據(jù)進行分析的等式.它可以對工作表數(shù)值進行加法、減法和乘法等運算.公式可以引用同一工作表中的其它單元格、同一工作簿不同工作表中的單元格,或者其它工作簿的工作表中的單元格.下面的示例中將單元格 B4 中的數(shù)值加上 25,再除以單元格 D5、E5 和 F5 中數(shù)值的和.
4、 =(B4+25)/SUM(D5:F5) 1.1.5 公式中的語法 公式語法也就是公式中元素的結構或順序.Excel 中的公式遵守一個特定的語法:最前面是等號(=),后面是參與計算的元素(運算數(shù))和運算符.每個運算數(shù)可以是不改變的數(shù)值(常量數(shù)值)、單元格或區(qū)域引用、標志、名稱,或工作表函數(shù). 在默認狀態(tài)下,Excel 從等號(=)開始,從左到右計算公式.可以通過修改公式語法來控制計算的順序.例如,公式=5+2*3的結果為 11,將 2 乘以 3(結果是 6),然后再加上 5.因為Excel 先計算乘法再計算加法;可以使用圓括號來改變語法,圓括號內的內容將首先被計算.公式=(
5、5+2)*3的結果 為21,即先用 5 加上 2,再用其結果乘以 3. 1.1.6 單元格引用 一個單元格中的數(shù)值或公式可以被另一個單元格引用.含有單元格引用公式的單元格稱為從屬單元格,它的值依賴于被引用單元格的值.只要被引用單元格做了修改,包含引用公式的單元格也就隨之修改.例如,公式“=B15*5”將單元格 B15 中的數(shù)值乘以 5.每當單元格 B15 中的值修改時,公式都將重新計算. 公式可以引用單元格組或單元格區(qū)域,還可以引用代表單元格或單元格區(qū)域的名稱或標志. 在默認狀態(tài)下,Excel 使用 A1 引用類型.這種類型用字母標志列(從 A 到 IV ,共 256
6、 列),用數(shù)字標志行(從 1 到 65536).如果要引用單元格,請順序輸入列字母和行數(shù)字.例如,D50 引用了列 D 和行 50 交叉處的單元格.如果要引用單元格區(qū)域,請輸入區(qū)域左上角單元格的引用、冒號(:)和區(qū)域右下角單元格的引用.下面是引用的示例. 單元格引用范圍 引用符號 在列 A 和行 10 中的單元格 A10 屬于列 A 和行 10 到行 20 中的單元格區(qū)域 A10:A20 屬于行 15 和列 B 到列 E 中的單元格區(qū)域 B15:E15 從列 A 行 10 到列E行 20 的矩形區(qū)域中的單元格 A10:E20 行 5 中的所有單元格 5:5 從行 5
7、到行 10 中的所有單元格 5:10 列 H 中的所有單元格 H:H 從列 H 到列 J 中的所有單元格 H:J 1.1.7 工作表函數(shù) Excel 包含許多預定義的,或稱內置的公式,它們被叫做函數(shù).函數(shù)可以進行簡單的或復雜的計算.工作表中常用的函數(shù)是“SUM”函數(shù),它被用來對單元格區(qū)域進行加法運算.雖然也可以通過創(chuàng)建公式來計算單元格中數(shù)值的總和,但是“SUM”工作表函數(shù)還可以方便地計算多個單元格區(qū)域. 函數(shù)的語法以函數(shù)名稱開始,后面是左圓括號、以逗號隔開的參數(shù)和右圓括號.如果函數(shù)以公式的形式出現(xiàn),請在函數(shù)名稱前面鍵入等號(=).當生成包含函數(shù)的公式時,公式選項板將
8、會提供相關的幫助. 使用公式的步驟: A. 單擊需要輸入公式的單元格. B. 如果公式以函數(shù)的形式出現(xiàn),請在編輯欄中單擊“編輯公式”按鈕 . C. 單擊“函數(shù)”下拉列表框 右端的下拉箭頭. D. 單擊選定需要添加到公式中的函數(shù).如果函數(shù)沒有出現(xiàn)在列表中,請單擊“其它函數(shù)”查看其它函數(shù)列表. E. 輸入參數(shù). F. 完成輸入公式后,請按 ENTER 鍵. 1.2 幾種常見的統(tǒng)計函數(shù) 1.2.1 均值 Excel計算平均數(shù)使用AVERAGE函數(shù),其格式如下: AVERAGE(參數(shù)1,參數(shù)2,…,參數(shù)30)
9、 范例:AVERAGE(12.6,13.4,11.9,12.8,13.0)=12.74 如果要計算單元格中A1到B20元素的平均數(shù),可用 AVERAGE(A1:B20). 1.2.2 標準差 計算標準差可依據(jù)樣本當作變量或總體當作變量來分別計算,根據(jù)樣本計算的結果稱作樣本標準差,而依據(jù)總體計算的結果稱作總體標準差. (1)樣本標準差 Excel計算樣本標準差采用無偏估計式,STDEV函數(shù)格式如下: STDEV(參數(shù)1,參數(shù)2,…,參數(shù)30) 范例:STDEV(3,5,6,4,6,7,5)=1.35 如果要計算單元格中A1到B20
10、元素的樣本標準差,可用 STDEV(A1:B20). (2)總體標準差 Excel計算總體標準差采用有偏估計式STDEVP函數(shù),其格式如下: STDEVP(參數(shù)1,參數(shù)2,…,參數(shù)30) 范例:STDEVP(3,5,6,4,6,7,5)=1.25 1.2.3 方差 方差為標準差的平方,在統(tǒng)計上亦分樣本方差與總體方差. (1)樣本方差 S2= Excel計算樣本方差使用VAR函數(shù),格式如下: VAR(參數(shù)1,參數(shù)2,…,參數(shù)30) 如果要計算單元格中A1到B20元素的樣本方差,可用 VAR(A1:B20). 范
11、例:VAR(3,5,6,4,6,7,5)=1.81 (2)總體方差 S2= Excel計算總體方差使用VARP函數(shù),格式如下: VARP(參數(shù)1,參數(shù)2,…,參數(shù)30) 范例:VAR(3,5,6,4,6,7,5)=1.55 1.2.4 正態(tài)分布函數(shù) Excel計算正態(tài)分布時,使用NORMDIST函數(shù),其格式如下: NORMDIST(變量,均值,標準差,累積) 其中: 變量(x):為分布要計算的x值; 均值(μ):分布的均值; 標準差(σ):分布的標準差; 累積:若為TRUE,則為分布函數(shù);若為FALSE,則為概率密度函數(shù). 范例:已
12、知X服從正態(tài)分布,μ=600,σ=100,求P{X≤500}.輸入公式 =NORMDIST(500,600,100,TRUE) 得到的結果為0.158655,即P{X≤500}=0.158655. 1.2.5 正態(tài)分布函數(shù)的反函數(shù) Excel計算正態(tài)分布函數(shù)的反函數(shù)使用NORMINV函數(shù),格式如下: NORMINV(下側概率,均值,標準差) 范例:已知概率P=0.841345,均值μ=360,標準差σ=40,求NORMINV函數(shù)的值.輸入公式 =NORMINV(0.841345,360,40) 得到結果為400,即P{X≤400}=0.841345.
13、 注意:(1) NORMDIST函數(shù)的反函數(shù)NORMINV用于分布函數(shù),而非概率密度函數(shù),請務必注意; (2) Excel 提供了計算標準正態(tài)分布函數(shù) NORMSDIST(x),及標準正態(tài)分布的反函數(shù) NORMSINV(概率). 范例:已知X~N(0,1), 計算=P{X<2}.輸入公式 =NORMSDIST(2) 得到0.97725,即=0.97725. 范例:輸入公式=NORMSINV(0.97725) ,得到數(shù)值2. 若求臨界值uα(n),則使用公式=NORMSINV(1-α). 1.2.6 t分布 Excel計算t分布的值(查表值)采用TDI
14、ST函數(shù),格式如下: TDIST(變量,自由度,側數(shù)) 其中: 變量(t):為判斷分布的數(shù)值; 自由度(v):以整數(shù)表明的自由度; 側數(shù):指明分布為單側或雙側:若為1,為單側;若為2,為雙側. 范例:設T服從t(n-1)分布,樣本數(shù)為25,求P(T>1.711). 已知t=1.711,n=25,采用單側,則T分布的值: =TDIST(1.711,24,1) 得到0.05,即P(T>1.711)=0.05. 若采用雙側,則T分布的值: =TDIST(1.711,24,2) 得到0.1,即. 1.2.7 t分布的反函數(shù) Exc
15、el使用TINV函數(shù)得到t分布的反函數(shù),格式如下: TINV(雙側概率,自由度) 范例:已知隨機變量服從t(10)分布,置信度為0.05,求t(10).輸入公式 =TINV(0.05,10) 得到2.2281,即. 若求臨界值tα(n),則使用公式=TINV(2*α, n). 范例:已知隨機變量服從t(10)分布,置信度為0.05,求t0.05 (10).輸入公式 =TINV(0.1,10) 得到1.812462,即t0.05 (10)= 1.812462. 1.2.8 F分布 Excel采用FDIST函數(shù)計算F分布的上側概率,格式如下: FDIST(變量
16、,自由度1,自由度2) 其中: 變量(x):判斷函數(shù)的變量值; 自由度1():代表第1個樣本的自由度; 自由度2():代表第2個樣本的自由度. 范例:設X服從自由度=5,=15的F分布,求P(X>2.9)的值.輸入公式 =FDIST(2.9,5,15) 得到值為0.05,相當于臨界值α. 1.2.9 F分布的反函數(shù) Excel使用FINV函數(shù)得到F分布的反函數(shù),即臨界值,格式為: FINV(上側概率,自由度1,自由度2) 范例:已知隨機變量X服從F(9,9)分布,臨界值α=0.05,求其上側0.05分位點F0.05(9,9).輸入公式
17、=FINV(0.05,9,9) 得到值為3.178897,即F0.05(9,9)= 3.178897. 若求單側百分位點F0.025(9,9),F(xiàn)0.975(9,9).可使用公式 =FINV(0.025,9,9) =FINV(0.975,9,9) 得到兩個臨界值4.025992和0.248386. 若求臨界值Fα(n1,n2),則使用公式=FINV(α, n1,n2). 1.2.10 卡方分布 Excel使用CHIDIST函數(shù)得到卡方分布的上側概率,其格式為: CHIDIST(數(shù)值,自由度) 其中: 數(shù)值(x):要判斷分布的數(shù)值; 自由度(v):指明自
18、由度的數(shù)字. 范例:若X服從自由度v=12的卡方分布,求P(X>5.226)的值.輸入公式 =CHIDIST(5.226,12) 得到0.95,即=0.95或=0.05. 1.2.11 卡方分布的反函數(shù) Excel使用CHIINV函數(shù)得到卡方分布的反函數(shù),即臨界值.格式為: CHIINV(上側概率值α,自由度n) 范例:下面的公式計算卡方分布的反函數(shù): =CHIINV(0.95,12) 得到值為5.226,即=5.226. 若求臨界值(n),則使用公式=CHIINV(α, n). 1.2.12 泊松分布 計算泊松分布使用POISSON函數(shù),格式如下:
19、 POISSON(變量,參數(shù),累計) 其中:變量:表示事件發(fā)生的次數(shù); 參數(shù):泊松分布的參數(shù)值; 累計:若TRUE,為泊松分布函數(shù)值;若FALSE,則為泊松分布概率分布值. 范例:設X服從參數(shù)為4的泊松分布,計算P{X=6}及P{X≤6}.輸入公式 =POISSON(6,4,FALSE) =POISSON(6,4,TRUE) 得到概率0.104196和0.889326. 在下面的實驗中,還將碰到一些其它函數(shù),例如:計算樣本容量的函數(shù)COUNT,開平方函數(shù)SQRT,和函數(shù)SUM,等等.關于這些函數(shù)的具體用法,可以查看Excel的關于函數(shù)的說明
20、,不再贅述. 2 區(qū)間估計實驗 計算置信區(qū)間的本質是輸入兩個公式,分別計算置信下限與置信上限.當熟悉了數(shù)據(jù)輸入方法及常見統(tǒng)計函數(shù)后,變得十分簡單. 2.1 單個正態(tài)總體均值與方差的區(qū)間估計: 2.1.1 s2已知時m的置信區(qū)間 置信區(qū)間為. 例1 隨機從一批苗木中抽取16株,測得其高度(單位:m)為:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.設苗高服從正態(tài)分布,求總體均值μ的0.95的置信區(qū)間.已知σ =0.0
21、1(米). 步驟: (1)在一個矩形區(qū)域內輸入觀測數(shù)據(jù),例如在矩形區(qū)域B3:G5內輸入樣本數(shù)據(jù). (2)計算置信下限和置信上限.可以在數(shù)據(jù)區(qū)域B3:G5以外的任意兩個單元格內分別輸入如下兩個表達式: =average(b3:g5)-normsinv(1-0.5*)*/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(1-0.5*)*/sqrt(count(b3:g5)) 上述第一個表達式計算置信下限,第二個表達式計算置信上限.其中,顯著性水平和標準差是具體的數(shù)值而不是符號.本例中,a =0.05, ,上述兩個公式應實際
22、輸入為 =average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5)) 計算結果為(1.148225, 1.158025). 2.1.2 s2未知時m的置信區(qū)間 置信區(qū)間為 . 例2 同例1,但未知. 輸入公式為: =average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) =average(b3:g5
23、)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) 計算結果為(1.133695, 1.172555). 2.1.3 m未知時s2的置信區(qū)間: 置信區(qū)間為 . 例3 從一批火箭推力裝置中隨機抽取10個進行試驗,它們的燃燒時間 (單位:s)如下: 50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5 試求總體方差的0.9的置信區(qū)間(設總體為正態(tài)). 操作步驟: (1)在單元格B3:C7分別輸入樣本數(shù)據(jù);
24、(2)在單元格C9中輸入樣本數(shù)或輸入公式=COUNT(B3:C7); (3)在單元格C10中輸入置信水平0.1. (4)計算樣本方差:在單元格C11中輸入公式=VAR(B3:C7) (5)計算兩個查表值:在單元格C12中輸入公式=CHIINV(C10/2,C9-1),在單元格C13中輸入公式=CHIINV(1-C10/2,C9-1) (6)計算置信區(qū)間下限:在單元格C14中輸入公式=(C9-1)*C11/C12 (7)計算置信區(qū)間上限:在單元格C15中輸入公式=(C9-1)*C11/C13. 當然,讀者可以在輸入數(shù)據(jù)后,直接輸入如下兩
25、個表達式計算兩個置信限: =(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1) =(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1) 2.2 兩正態(tài)總體均值差與方差比的區(qū)間估計 2.2.1 當s12 = s22 = s2但未知時m1-m2的置信區(qū)間 置信區(qū)間為 . 例4 在甲,乙兩地隨機抽取同一品種小麥籽粒的樣本,其容量分別為5和7,分析其蛋白質含量為 甲:12.6 13.4 11.9 12.8 13.0 乙:13.1
26、 13.4 12.8 13.5 13.3 12.7 12.4 蛋白質含量符合正態(tài)等方差條件,試估計甲,乙兩地小麥蛋白質含量差μ-μ所在的范圍.(取α=0.05) 實驗步驟: (1)在A2:A6輸入甲組數(shù)據(jù),在B2:B8輸入乙組數(shù)據(jù); (2)在單元格B11輸入公式=AVERAGE(A2:A6),在單元格B12中輸入公式=AVERAGE(B2:B8),分別計算出甲組和乙組樣本均值. (3)分別在單元格C11和C12分別輸入公式=VAR(A2:A6),=VAR(B2:B8),計算出兩組樣本的方差. (4)在單元格D11和D12分別輸入公式=COU
27、NT(A2:A6),=COUNT(B2:B8),計算各樣本的容量大?。? (5)將顯著性水平0.05輸入到單元格E11中. (6)分別在單元格B13和B14輸入 =B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7) 和 =B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7) 計算出置信區(qū)間的下限和上限. 2.2.2 m1和m2未知時方差比σ/σ的置信區(qū)間 置信區(qū)間為 . 例5 有兩個化驗員A、B,他們獨立地
28、對某種聚合物的含氯量用相同的方法各作了10次測定.其測定值的方差分別是S=0.5419,S=0.6065.設σ和σ分別是A、B所測量的數(shù)據(jù)總體(設為正態(tài)分布)的方差.求方差比σ/σ的 0.95置信區(qū)間. 操作步驟: (1)在單元格B2,B3輸入樣本數(shù),C2,C3輸入樣本方差,D2輸入置信度. (2)在B4和B5利用公式輸入 =C2/(C3*FINV(1-D2/2,B2-1,B3-1)) 和 =C2/(C3*FINV(D2/2,B2-1,B3-1)) 計算出A組和B組的方差比的置信區(qū)間上限和下限. 2.3 練習題 1. 已知某樹種的樹高服從正態(tài)分布,
29、隨機抽取了該樹種的60株林木組成樣本.樣本中各林木的樹高資料如下(單位:m) 22.3, 21.2, 19.2, 16.6, 23.1, 23.9, 24.8, 26.4, 26.6, 24.8, 23.9, 23.2, 23.3, 21.4, 19.8, 18.3, 20.0, 21.5, 18.7, 22.4, 26.6, 23.9, 24.8, 18.8, 27.1, 20.6, 25.0, 22.5, 23.5, 23.9, 25.3, 23.5, 22.6, 21.5, 20.6, 25.8, 24.0, 23.5, 22.6, 21.8, 20.8, 19.5, 20.9, 22
30、.1, 22.7, 23.6, 24.5, 23.6, 21.0, 21.3, 22.4,18.7, 21.3, 15.4, 22.9, 17.8, 21.7, 19.1, 20.3, 19.8 試以0.95的可靠性,對于該林地上全部林木的平均高進行估計. 2. 從一批燈泡中隨機抽取10個進行測試,測得它們的壽命(單位:100h)為: 50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5. 試求總體方差的0.9的置信區(qū)間(設總體為正態(tài)). 3. 已知某種玉米的產量服從正態(tài)分布,現(xiàn)有種植該玉米的兩個實驗區(qū),各分為10個小區(qū),
31、各小區(qū)的面積相同,在這兩個實驗區(qū)中,除第一實驗區(qū)施以磷肥外,其它條件相同,兩實驗區(qū)的玉米產量(kg)如下: 第一實驗區(qū): 62 57 65 60 63 58 57 60 60 58 第二實驗區(qū): 56 59 56 57 60 58 57 55 57 55 試求出施以磷肥的玉米產量均值和未施以磷肥的玉米產量均值之差的范圍(α=0.05) 3 假設檢驗實驗 實驗內容:單個總體均值的假設檢驗;兩個總體均值差的假設檢驗;兩個正態(tài)總體方差齊性的假設檢驗;擬合優(yōu)度檢驗. 實驗目的與要求:(1)理解假設檢驗的統(tǒng)計思想,掌握假設檢驗的計算步驟;(
32、2)掌握運用Excel進行假設檢驗的方法和操作步驟;(3)能夠利用試驗結果的信息,對所關心的事物作出合理的推斷. 3.1 單個正態(tài)總體均值μ的檢驗 3.1.1 s2已知時μ的U檢驗 例1 外地一良種作物,其1000m2產量(單位:kg)服從N(800, 502),引入本地試種,收獲時任取5塊地,其1000m2產量分別是800,850,780,900,820(kg),假定引種后1000m2產量X也服從正態(tài)分布,試問: (1)若方差未變,本地平均產量μ與原產地的平均產量μ=800kg 有無顯著變化. (2)本地平均產量μ是否比原產地的平均產量μ=800kg高.
33、 (3)本地平均產量μ是否比原產地的平均產量μ=800kg低. 操作步驟: (1)先建一個如下圖所示的工作表: (2)計算樣本均值(平均產量),在單元格D5輸入公式=AVERAGE(A3:E3); (3)在單元格D6輸入樣本數(shù)5; (4)在單元格D8輸入U檢驗值計算公式=(D5-800)/(50/SQRT(D6); (5)在單元格D9輸入U檢驗的臨界值=NORMSINV(0.975); (6)根據(jù)算出的數(shù)值作出推論.本例中,U的檢驗值1.341641小于臨界值1.959961,故接受原假設,即平均產量與原產地無顯著差異.
34、 (7)注:在例1中,問題(2)要計算U檢驗的右側臨界值:在單元格D10輸入U檢驗的上側臨界值=NORMSINV(0.95).問題(3)要計算U檢驗的下側臨界值,在單元格D11輸入U檢驗下側的臨界值=NORMSINV(0.05). 3.1.2 s2未知時的t檢驗 例2 某一引擎制造商新生產某一種引擎,將生產的引擎裝入汽車內進行速度測試,得到行駛速度如下: 250 238 265 242 248 258 255 236 245 261 254 256 246 242 247 256 258 259 262 263 該引擎制造商宣稱引擎的平均速度
35、高于250 km/h,請問樣本數(shù)據(jù)在顯著性水平為0.025時,是否和他的聲明抵觸? 操作步驟: (1)先建如圖所示的工作表: (2)計算樣本均值:在單元格D8輸入公式=AVERAGE(A3:E6); (3)計算標準差 :在單元格D9輸入公式=STDEV(A3:E6); (4)在單元格D10輸入樣本數(shù)20. (5)在單元格D11輸入t檢驗值計算公式=(D8-250)/(D9/(SQRT(D10)),得到結果1.06087; (6)在單元格D12輸入t檢驗上側臨界值計算公式=TINV(0.05, D10-1). 欲檢驗假設 H0
36、:μ=250;H:μ>250. 已知 t統(tǒng)計量的自由度為(n-1)=20-1=19,拒絕域為t>t =2.093.由上面計算得到t檢驗統(tǒng)計量的值1.06087落在接收域內,故接收原假設H0. 3.2 兩個正態(tài)總體參數(shù)的假設檢驗 3.2.1 當s12 = s22 = s2但未知時的檢驗 在此情況下,采用t檢驗. 例 試驗及觀測數(shù)據(jù)同11.2中的練習題3,試判別磷肥對玉米產量有無顯著影響? 欲檢驗假設 H:μ1=μ2;H:μ1>μ2. 操作步驟: (1) 建立如圖所示工作表: (2)選取“工具”—“數(shù)據(jù)分析”; (
37、3)選定“ t-檢驗:雙樣本等方差假設”. (4)選擇“確定”.顯示一個“t-檢驗:雙樣本等方差假設”對話框; (5)在“變量1的區(qū)域”輸入A2:A11. (6)在“變量2的區(qū)域”輸入B2:B11. (7)在“輸出區(qū)域”輸入D1,表示輸出結果放置于D1向右方的單元格中. (8)在顯著水平“α”框,輸入0.05. (9)在“假設平均差”窗口輸入0. (10)選擇“確定”,計算結果如D1:F14顯示. 得到t值為3.03,“t單尾臨界”值為1.734063.由于3.03>1.73,所以拒絕原假設,接收備擇假設,即認為使用
38、磷肥對提高玉米產量有顯著影響. 3.2.2 σ與σ已知時的U檢驗 例3 某班20人進行了數(shù)學測驗,第1組和第2組測驗結果如下: 第1組: 91 88 76 98 94 92 90 87 100 69 第2組: 90 91 80 92 92 94 98 78 86 91 已知兩組的總體方差分別是57與53,取α =0.05,可否認為兩組學生的成績有差異? 操作步驟: (1)建立如圖所示工作表: (2)選取“工具”—“數(shù)據(jù)分析”; (3)選定“z-檢驗:雙樣本平均差檢驗”;
39、(4)選擇“確定”,顯示一個“z-檢驗:雙樣本平均差檢驗”對話框; (5)在“變量1的區(qū)域”輸入A2:A11; (6)在“變量2的區(qū)域”輸入B2:B11; (7)在“輸出區(qū)域”輸入D1; (8)在顯著水平“α”框,輸入0.05; (9)在“假設平均差”窗口輸入0; (10)在“變量1的方差”窗口輸入57; (11)在“變量2的方差”窗口輸入53; (12)選擇“確定”,得到結果如圖所示. 計算結果得到z=-0.21106(即u統(tǒng)計量的值),其絕對值小于“z雙尾臨界”值1.959961,故接收原假設,表示無充分證據(jù)
40、表明兩組學生數(shù)學測驗成績有差異. 3.2.3 兩個正態(tài)總體的方差齊性的F檢驗 例5 羊毛在處理前與后分別抽樣分析其含脂率如下: 處理前:0.19 0.18 0.21 0.30 0.41 0.12 0.27 處理后:0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12 問處理前后含脂率的標準差是否有顯著差異? 欲檢驗假設 H:σ=σ; H:σ≠σ. 操作步驟如下: (1)建立如圖所示工作表: (2)選取“工具”—“數(shù)據(jù)分析”; (3)選定“F-檢驗 雙樣本方差”.
41、 (4)選擇“確定”,顯示一個“F-檢驗:雙樣本方差”對話框; (5)在“變量1的區(qū)域”輸入A2:A8. (6)在“變量2的區(qū)域”輸入B2:B9. (7)在顯著水平“α”框,輸入0.025. (8)在“輸出區(qū)域”框輸入D1. (9)選擇“確定”,得到結果如圖所示. 計算出F值2.35049小于“F單尾臨界”值5.118579,且P(F<=f)=0.144119>0.025,故接收原假設,表示無理由懷疑兩總體方差相等. 4 擬合優(yōu)度檢驗 擬合優(yōu)度檢驗使用統(tǒng)計量 , (1
42、1.1) Excel 在計算擬合優(yōu)度的卡方檢驗方面,提供了CHITEST函數(shù),其格式如下: CHITEST(實測頻數(shù)區(qū)域,理論頻數(shù)區(qū)域) 得到臨界概率 , 其中為上述統(tǒng)計量(1.11)的值.在應用中,可根據(jù)臨界概率,利用函數(shù)CHIINV確定統(tǒng)計量的值.即 CHIINV 例6 設總體X中抽取120個樣本觀察值,經計算整理得樣本均值209,樣本方差s=42.77及下表.試檢驗X是否服從正態(tài)分布(α=0.05). 組號 小區(qū)間 頻數(shù) 1 2 3 4 5 6 7 8 9 (-∞,198] (198,201] (210,204] (204,207]
43、 207,210] (210,213] (213,216] (216,219] (219,+∞) 6 7 14 20 23 22 14 8 6 ∑ 120 操作步驟: (1)輸入基本數(shù)據(jù) 建立如下圖所示工作表,輸入區(qū)間(A2:A10),端點值(B2:B10),實測頻數(shù)的值(C2:C10).區(qū)間可以不輸入,輸入是為了更清晰;端點值為區(qū)間右端點的值,當右端點是+∞時,為了便于處理,可輸入一個很大的數(shù)(本例取10000)代替+∞. (2)計算理論頻數(shù) 由極大似然估計得參數(shù),假設X~N(),則 P{a<X≤b}=F(b
44、)-F(a), 因此,事件{a<X≤b}發(fā)生的理論頻數(shù)為n(F(b)-F(a)). 將計算的理論頻數(shù)值放入D列. 在D2輸入=120*(NORMDIST(198,209,6.539877675,TRUE)) 在D3輸入=120*(NORMDIST(B3,209,6.539877675,TRUE) -NORMDIST(B2,209,6.539877675,TRUE)) 類似地,可算出D4至D10的值. 應用小技巧:計算D4到D10值的簡便方法:選定D3單元格,單擊鼠標右鍵彈出快捷菜單從中選擇“復制”,然后
45、選定單元格D4到D10,單擊鼠標右鍵彈出快捷菜單從中選擇"粘貼",即可得到D4到D10的值. (3)計算卡方統(tǒng)計量的值 本例中,估計參數(shù)2個,分組數(shù)k=9. ①使用CHITEST函數(shù)計算臨界概率. 在單元格E12輸入:=CHITEST(C2:C10,D2:D10),得到= 0.997499. ②根據(jù)臨界概率,利用函數(shù)CHIINV確定統(tǒng)計量的值. 在單元格E13輸入=CHIINV(E12, 8), 得到統(tǒng)計量的值=1.104413. (4)結果分析 先查出臨界值:在單元格E14輸入=CHIINV(0.05,6),得到12.59158.由于統(tǒng)計量的值1.1044
46、13小于臨界值12.5918,故接受原假設,認為X服從正態(tài)分布. 練習與習題 1. 某春小麥良種千粒重μ=34克,方差σ2=1.96,現(xiàn)自外地引入新品種,在8個小區(qū)上種植,得其千粒重為:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,問新引入品種的千粒重與當?shù)亓挤N有無顯著差異. 2. 為防止某種害蟲而將一種農藥施入土中,規(guī)定經三年后土壤中如有5ppm以上濃度時認為有殘效,現(xiàn)在施藥區(qū)分別抽取了10個土樣(施藥三年后)進行分析,它們濃度分別為: 1. 8, 3.2, 2.6, 6.0, 5.4, 7.6, 2.1, 2.
47、5, .1, 3.5 設測定值服從正態(tài)分布,問這種農藥三年后是否有殘效. 3. 設甲乙兩種甜菜的含糖率分別服從N(μ1,7.5)和N(μ2,6),現(xiàn)從兩種甜菜中分別抽取若干樣品,測其含糖率分別為: 甲種: 24.3,17.4,23.7,20.8,21.3 (%) 乙種: 20.2,16.9,16.7,18.2 (%) 問甲,乙兩種甜菜含糖率的平均值有無顯著變化. 4. 某化工原料在處理前后取樣分析,測得其含脂率的數(shù)據(jù)如下: 處理前:0.19,0.18,0.21,0.30,0.66,0.42,0.08,0.12,0.3
48、0,0.27. 處理后:0.19,0.24,1.04,0.08,0.20,0.12,0.31,0.29,0.13,0.07. 假定處理前后的含脂率都服從正態(tài)分布,且方差不變,給定顯著水平α=0.05,問處理前后含脂率的均值有無顯著變化. 5. 某農場為試驗磷肥能否提高水稻收獲量,在同類農場中選定面積為0.30m2的試驗地若干塊,試驗結果,未施肥的九塊地收獲量為: 8.6,7.9,9.3,10.7,11.4,9.8,9.5,10.1,8.5 另外八塊地施了磷肥,其收獲量為: 12.6,10.2,11.7,12.3,11.1,10.5,10.6
49、,12.2 試檢驗施肥后水稻的收獲量有無顯著提高.(假定水稻收獲量服從正態(tài)分 部). 提示:先檢驗方差齊性. 6. 在一個小時內電話總機每分鐘收到的呼喚次數(shù)統(tǒng)計如下: 呼喚次數(shù): 0 1 2 3 4 5 6 ≥7 頻數(shù): 8 16 17 10 6 2 1 0 試用卡方分布檢驗每小時電話總機收到呼喚次數(shù)是否服從泊松分布. 7. 下面是某系高等數(shù)學的成績: 87,75,85,78,62,90,72,66,75,74,73,77,75,8
50、4,64 78,90,65,90,78,57,71,48,74,72,53,69,68,74,62 90,80,70,84,86,65,60,68,89,72,53,69,68,74,73 65,71,68,70,85,79,43,79,80,77,88,93,68,74,51 試在顯著水平α=0.05小,檢驗這次成績的分布是否服從正態(tài)分布. 5 方差分析實驗 試驗內容:單因素方差分析;雙因素無重復試驗的方差分析;雙因素等重復試驗的方差分析. 試驗目的與教學要求:充分理解方差分析的統(tǒng)計思想;充分理解平方和分解的統(tǒng)計思想;學會
51、如何充分地利用試驗結果的信息,對所關心的事物(因素的影響作出合理的推斷. 5.1 單因素方差分析 例1 檢驗某種激素對羊羔增重的效應.選用3個劑量進行試驗,加上對照(不用激素)在內,每次試驗要用4只羊羔,若進行4次重復試驗,則共需16只羊羔.一種常用的試驗方法,是將16只羊羔隨機分配到16個試驗單元.在試驗單元間的試驗條件一致的情況下,經過200天的飼養(yǎng)后,羊羔的增重(kg)數(shù)據(jù)如下表. 處理 重復 1(對照) 2 3 4 1 2 3 4 47 52 62 51 50 54 67 57 57 53 69 57 54
52、 65 75 59 試問各種處理之間有無顯著差異? 操作步驟: (1)輸入數(shù)據(jù),如下圖所示: (2)選取“工具”—“數(shù)據(jù)分析”; (3)選定“單因素方差分析”; (4)選定“確定”,顯示“單因子方差分析”對話框; (5)在“輸入區(qū)域”框輸入數(shù)據(jù)矩陣(首坐標):(尾坐標),如上例為“A2:D6”,其中第二行“第一組,…,第四組”作為標記行; (6)在“分組方式”框選定“列”; (7)打開“分類軸標記行在第一行上”復選框.若關閉,則數(shù)據(jù)輸入域應為A3:D6. (8)指定顯著水平α=0.05; (9)選
53、擇輸出選項,本例選擇“輸出區(qū)域”緊接在數(shù)據(jù)區(qū)域下為:“A7”; (10)選擇“確定”,則得輸出結果. 結果分析:F crit=3.4903是α=0.05的F統(tǒng)計量臨界值,F(xiàn)=1.305047是F統(tǒng)計量的計算值, P-value=0.318=P{F>1.30505}. 由于1.30505<3.4903,因此接受原假設,即無顯著差異. 5.2 雙因素無重復試驗的方差分析: 例2 將土質基本相同的一塊耕地分成均等的五個地塊,每塊又分成均等的四個小區(qū).有四個品種的小麥,在每一地塊內隨機分種在四個小區(qū)上,每小區(qū)的播種量相同,測得收獲量如下表(單位:kg)
54、.試以顯著性水平α1 =0.05, α2=0.01,考察品種和地塊對收獲量的影響是否顯著. 地塊 品種 B1 B2 B3 B4 B5 A1 A2 A3 A4 32.3 33.2 30.8 29.5 34.0 33.6 34.4 26.2 34.7 36.8 32.3 28.1 36.0 34.3 35.8 28.5 35.5 36.1 32.8 29.4 操作步驟: (1)輸入數(shù)據(jù),如下圖所示: (2)選取“工具”—“數(shù)據(jù)分析”, (3)選定“雙因子方差分析:無重復試驗”
55、選項, (4)選定“確定”,顯示“雙因子方差分析:無重復試驗”對話框, (5)在“輸入區(qū)域”框輸入A1:F5. (6)在“輸出區(qū)域”輸入A7 (7)打開“標記”復選框. (8)指定顯著水平“α”為“0.05”或“0.01”. (9)選擇“確定”,則得輸出結果從第7行起顯示出來. 5.2.1 雙因素等重復試驗方差分析: 例3 一火箭使用了四種燃料、三種推進器作射程試驗,對于燃料與推進器的每一種搭配,各發(fā)射火箭兩次,測得結果如下表: 燃料 推 進 器 B1 B2 B3 A1 58.2 52.6 56.
56、2 41.2 65.3 60.8 A2 49.1 42.8 54.1 50.5 51.6 48.4 A3 60.1 58.3 70.9 73.2 39.2 40.7 A4 75.8 71.5 58.2 51.0 48.7 41.4 試檢驗燃料和推進器對火箭射程是否是顯著影響,兩因素的交互作用對火箭射程是否有顯著影響. 操作步驟: (1)輸入數(shù)據(jù),如下圖所示: (2)選取“工具”、“數(shù)據(jù)分析……”, (3)選定“雙因子方差分析:重復試驗”選項, (4)選定“確定”,顯示“雙因子方差分析:重復試驗”對話框,
57、 (5)在“輸入區(qū)域”框輸入A1:D9. (6)在“輸出區(qū)域”輸入A11. (7)在“每一樣本行數(shù)”框輸入“2”,代表兩行. (8)指定顯著水平“α”為“0.05”. (9)選擇“確定”,則得輸出結果從第11行起顯示出來. 本例假設:HA :因素A對試驗結果無顯著影響. HB:因素B對試驗結果無顯著影響. HAB:交互因素AB對試驗結果無顯著影響. 已算出: SA=261.675,MSA=87.225;SB=370.9808,MSB=185.4904;SAB=1768.693, MSAB=2
58、94.7821,誤差=236.95,MSe=19.74583,總計St=2638.293 F值與F-crit比較可以看出,F(xiàn)>F-crit,對α=0.05,各因素均顯著,應拒絕原假設HA, HB,HAB. 可以繼續(xù)計算對顯著水平α= 0.01的推斷結果. 5.3 練習與習題 1. 假設某醫(yī)院應用克矽平治療矽肺,治療前、中、后期患者血液中粘蛋白含量(mg%)觀察結果如下: 患者編號 治療前 治療中 治療后 1 6.5 4.5 3.5 2 7.3 4.4 3.6 3 7.3 5.9 3.7
59、 4 3 3.6 2.6 5 7.3 5.5 4.3 6 5.6 4.5 3.7 7 7.3 5.2 5 試問用克矽平治療矽肺對降低血液中粘蛋白含量是否有作用(α=0.05)? 2. 下面給出了小白鼠接種不同菌型傷寒桿菌的存活日數(shù),試問三種菌型的平均存活日數(shù)有否顯著差異(α=0.05)? 菌型 接種后存活日數(shù) A1 2,4,3,2,4,7,7,2,5,4 A2 5,6,8,5,10,7,12,6,6 A3 7,11,6,6,7,9,5,10,6,3,10
60、 3. 抽查某地區(qū)三所小學五年級男生的身高,得以下數(shù)據(jù): 小學 身高(cm) 第一小學 128.1 , 134.1 , 133.1 ,138.9,140.8,127.4 第二小學 150.3 , 147.9 , 136.8 ,126.0,150.7,155.8 第三小學 140.6 , 143.1 , 144.5 ,143.7,148.5,146.4 試問該地區(qū)這三所小學五年級男生的平均身高有否顯著差異(α=0.05)? 4. 下面記錄了某地區(qū)四個生產隊在1956—1959年的667m2小麥平均產量: 年份 生產隊產量 1 2 3 4 1956
61、 146 200 148 151 1957 258 303 282 290 1958 415 461 431 413 1959 454 452 453 415 試檢驗:(1)各生產隊間的差異是否顯著? (2)逐年產量的增長是否顯著(α=0.05)? 5. 下面記錄了三位操作工在四臺不同機器上操作三天的日產量: 機器 操 作 工 甲 乙 丙 M1 15,15,17 19,19,16 16,18,21 M2 17,17,17 15,15,15 19,22,22 M3 15,
62、17,16 18,17,16 18,18,18 M4 18,20,22 15,16,17 17,17,17 試檢驗:(1)操作工之間的差異是否顯著? (2)機器之間的差別是否顯著? (3)交互影響是否顯著(α=0.05)? 6 回歸分析實驗 實驗內容:一元線性回歸;多元線性回歸;回歸分析中其它函數(shù)的應用. 實驗目的與要求:掌握回歸分析的基本原理、實驗操作步驟,能夠應用回歸分析解決實際問題;根據(jù)實驗數(shù)據(jù),能夠熟練地建立回歸方程;熟練地掌握回歸方程的顯著性檢驗;熟練地掌握回歸系數(shù)的顯著性檢驗. 6.1 利用Excel進行
63、一元線性回歸分析 例1 今收集到某地區(qū)1950~1975年的工農業(yè)總產值(X)與貨運周轉量(Y)的歷史數(shù)據(jù)如下: X:0.50 0.87 1.20 1.60 1.90 2.20 2.50 2.80 3.60 4.00 4.10 3.20 3.40 4.4 4.70 5.40 5.65 5.60 5.70 5.90 6.30 6.65 6.70 7.05 7.06 7.30 Y:0.90 1.20 1.40 1.50 1.70 2.00 2.05 2.35 3.00 3.50 3
64、.20 2.40 2.80 3.2 3.40 3.70 4.00 4.40 4.35 4.34 4.35 4.40 4.55 4.70 4.60 5.20 試分析X與Y間的關系. 操作步驟: (1)首先在Excel中建立工作表,樣本X數(shù)據(jù)存放在A1:A27,其中A1存標記X;樣本Y數(shù)據(jù)存放在B1:B27,其中B1存標記Y. (2)選取“工具”、“數(shù)據(jù)分析”…. (3)選定“回歸”. (4)選擇“確定”. (5)在“輸入Y區(qū)域”框輸入B1:B27. (6)在“輸入X區(qū)域”框輸入A1:A27.
65、 (7)關閉“常數(shù)為零”復選框,表示保留截距項,使其不為0. (8)打開“標記”復選框,表示有標記行. (9)打開“置信水平”復選框,并使其值為95%. (10)在“輸出區(qū)域”框,確定單元格E2. 結果如圖所示.其中SS為平方和、MS表示均方、df為自由度.由此我們可義看出: (1)回歸方程:Y=0.6754+0.5951X; (2)F統(tǒng)計量的值:F=1107.942.由于P{F>1107.942}=1.34353E-21,故所建回歸方程極顯著. 6.2 利用EXCEL進行多元線性回歸分析 例2 今收
66、集到歷史數(shù)據(jù)如下: X1:7 1 11 11 7 11 3 1 2 21 1 11 10 14 12 X2:26 29 56 31 52 55 71 31 54 47 40 66 68 43 58 X3:6 15 8 8 6 9 17 22 18 4 23 9 8 12 18 X4:60 52 20 47 33 22 6 44 22 26 34 12 12 28 37 Y:79 75 103 88 96 108 100 75 94 116 84 115 110 99 107 使試分析X1, X2, X3, X4與Y之間的關系. 解 首先在Excel中建立工作表,其中樣本X數(shù)據(jù)輸入在A2:D16;樣本Y數(shù)據(jù)輸入在E2:E16. (1)選取“工具”—“數(shù)據(jù)分析”; (2)選定“回歸”; (3)選擇“確定”; (4)在“輸入Y區(qū)域”框輸E2:E16; (5)在“輸入X區(qū)域”框輸入A2:D16; (6)關閉“常數(shù)為零”復選框,表示保留截距項,使其不為0;
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。