《概率論與數(shù)理統(tǒng)計(jì)方差》由會員分享,可在線閱讀,更多相關(guān)《概率論與數(shù)理統(tǒng)計(jì)方差(23頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 我們已經(jīng)介紹了隨機(jī)變量的數(shù)學(xué)期望, 它體現(xiàn)了隨機(jī)變量取值的平均水平,是隨 機(jī)變量的一個(gè)重要的數(shù)字特征 . 但是在一些場合,僅僅知道平均值是 不夠的 . 例如,某零件的真實(shí)長度為 a,現(xiàn)用甲、 乙兩臺儀器各測量 10次,將測量結(jié)果 X用坐 標(biāo)上的點(diǎn)表示如圖: 若讓你就上述結(jié)果評價(jià)一下兩臺儀器的優(yōu) 劣,你認(rèn)為哪臺儀器好一些呢? a 甲儀器測量結(jié)果 a 乙儀器測量結(jié)果 較好 測量結(jié)果的 均值都是 a 因?yàn)橐覂x器的測量結(jié)果集中在均值附近 又如 ,甲、乙兩門炮同時(shí)向一目標(biāo)射擊 10發(fā)炮 彈,其落點(diǎn)距目標(biāo)的位置如圖: 你認(rèn)為哪門炮射擊效果好一些呢 ? 甲炮射擊結(jié)果 乙炮射擊結(jié)果 乙炮 因?yàn)橐遗诘膹椫c(diǎn)較
2、集中在中心附近 . 中心 中心 為此需要引進(jìn)另一個(gè)數(shù)字特征 ,用它 來度量隨機(jī)變量取值在其中心附近的離 散程度 . 這個(gè)數(shù)字特征就是我們要介紹的 方差 一、方差的定義 采用平方是為了保證一切 差值 X-E(X)都起正面的作用 由于它與 X具有相同的度量單位,在實(shí) 際問題中經(jīng)常使用 . 方差的算術(shù)平方根 稱為標(biāo)準(zhǔn)差 )( XD 設(shè) X是一個(gè)隨機(jī)變量 , 若 E(X-E(X)2, 則 稱 D(X)=EX-E(X)2 (1) 為 X的方差 . 若 X的取值比較分散, 則方差較大 . 若方差 D(X)=0,則 r.v X 以概率 1取常數(shù)值 . 方差刻劃了隨機(jī)變量的取值對于其數(shù)學(xué) 期望的離散程度 .
3、若 X的取值比較集中, 則方差較??; D(X)=EX-E(X)2 X為離散型, P(X=xk)=pk 由定義知,方差是隨機(jī)變量 X的函數(shù) g(X)=X-E(X)2的 數(shù)學(xué)期望 . ,)()( ,)( )( 2 1 2 dxxfXEx pXEx XD k k kk X為連續(xù)型, Xf(x) 二、計(jì)算方差的一個(gè)簡化公式 D(X)=E(X2)-E(X)2 展開 證: D(X)=EX-E(X)2 =EX2-2XE(X)+E(X)2 =E(X2)-2E(X)2+E(X)2 =E(X2)-E(X)2 利用期望 性質(zhì) 請自己用此公式計(jì)算常見分布的方差 . 例 1 設(shè) r.v X服從幾何分布,概率函數(shù)為 P(
4、X=k)=p(1-p)k-1, k=1,2, , n 其中 0p0, 2 或 由切比雪夫不等式可以看出,若 越 小,則事件 |X-E(X)| 的概率越大,即 隨機(jī)變量 X集中在期望附近的可能性越大 . 2 2 2 1|)(| XEXP 2 2 |)(| XEXP 由此可體會方差的概率意義: 它刻劃了隨機(jī)變量取值的離散程度 . 如圖所示 當(dāng)方差已知時(shí),切比雪夫不等式給出了 r.v X與它的期望的偏差不小于 的概率的估 計(jì)式 . 如取 3 2 2 |)(| XEXP 1 1 1.0 9 3|)(| 2 2 XEXP 可見,對任給的分布,只要期望和方差 存在,則 r.v X取值偏離 E(X)超過 3
5、 的 概率小于 0.111 . 2 例 3 已知正常男性成人血液中,每一毫升 白細(xì)胞數(shù)平均是 7300,均方差是 700 . 利用 切比雪夫不等式估計(jì)每毫升白細(xì)胞數(shù)在 52009400之間的概率 . 解:設(shè)每毫升白細(xì)胞數(shù)為 X 依題意, E(X)=7300,D(X)=7002 所求為 P(5200 X 9400) P(5200 X 9400) =P(5200-7300 X-7300 9400-7300) = P(-2100 X-E(X) 2100) 2)2 1 0 0( )(1 XD = P |X-E(X)| 2100 由切比雪夫不等式 P |X-E(X)| 2100 2) 21 00 70
6、0(1 9 8 9 11 即估計(jì)每毫升白細(xì)胞數(shù)在 52009400之間的 概率不小于 8/9 . 例 4 在每次試驗(yàn)中,事件 A發(fā)生的概率為 0.75, 利用切比雪夫不等式求: n需要多大時(shí), 才能使得在 n次獨(dú)立重復(fù)試驗(yàn)中 , 事件 A出現(xiàn)的 頻率在 0.740.76之間的概率至少為 0.90? 解:設(shè) X為 n 次試驗(yàn)中,事件 A出現(xiàn)的次數(shù), E(X)=0.75n, 的最小的 n . 900760740 .).( nXP 則 XB(n, 0.75) 所求為滿足 D(X)=0.75*0.25n=0.1875n =P(-0.01nX-0.75n 0.01n) 2)01.0( )(1 n XD
7、= P |X-E(X)| 0.01n 20 00 1.0 1 87 5.01 n n n 18751 P(0.74n X0.76n ) )76.074.0( nXP )76.074.0( nXP 可改寫為 在切比雪夫不等式中取 n,則 0 .0 1 = P |X-E(X)| 0.01n 1 87 509.01 1 87 5 n 解得 依題意,取 9.018 751 n 即 n 取 18750時(shí),可以使得在 n次獨(dú)立重復(fù) 試驗(yàn)中 , 事件 A出現(xiàn)的頻率在 0.740.76之間的 概率至少為 0.90 . 我們介紹了隨機(jī)變量的方差 . 它是刻劃隨機(jī)變量取值在其中心附近離 散程度的一個(gè)數(shù)字特征 . 下面我們將介紹刻劃兩 r.v間線性相關(guān)程度的 一個(gè)重要的數(shù)字特征: 相關(guān)系數(shù)