生物統(tǒng)計(jì)學(xué) 總結(jié)
《生物統(tǒng)計(jì)學(xué) 總結(jié)》由會員分享,可在線閱讀,更多相關(guān)《生物統(tǒng)計(jì)學(xué) 總結(jié)(25頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 生物統(tǒng)計(jì)學(xué) 總結(jié) 緒論 統(tǒng)計(jì)工作的四大步驟:設(shè)計(jì)、搜集、整理、分析 統(tǒng)計(jì)資料的三大類型: e 計(jì)量資料:對每個觀察值單位用定量方法測得每項(xiàng)指標(biāo)量的大小所得的資料 e 計(jì)數(shù)資料:將觀察單位按照某種屬性類別分組,所得的觀察單位數(shù) e 等級資料:將觀察單位按某種屬性的不同程度分組所得的資料 同質(zhì)與變異 同質(zhì):除研究因素外,其他因素相同或相近為同質(zhì) 變異:觀測值的不齊性 總體與樣本: 總體:根據(jù)研究目的所確定的同質(zhì)觀察單位的全體=所有研究對象 性質(zhì)相同的全體觀察單位某項(xiàng)變量值的集合 總體含量:總體中所包含的觀察單位數(shù) 有限總體:總體觀察單位數(shù)可數(shù) 無限總體:總
2、體觀察單位數(shù)不可數(shù) 樣本:從總體中隨機(jī)抽取的部分觀察單位 樣本含量:樣本中所包含的觀察單位數(shù) 抽樣:從總體中獲得樣本的過程 放回式抽樣 不放回式抽樣 抽樣誤差:因個體變異的存在,由抽樣而導(dǎo)致的樣本指標(biāo)與總體指標(biāo)之差 統(tǒng)計(jì)量:有樣本所得指標(biāo)或數(shù) 參數(shù):由總體所得指標(biāo),關(guān)于特征的表征 頻數(shù):完全相同的觀察只出現(xiàn)的次數(shù) 頻率:某一觀察值出現(xiàn)的次數(shù)與樣本含量的比值 概率:描述某事物發(fā)生可能性大小的一個度量 樣本空間:一次實(shí)驗(yàn)所有可能的結(jié)果的集合 基本事物:樣本空間每一個可能的結(jié)果 小概率事件:P<=0.05或P<=0.01的事件 小概率原理:小
3、概率事件在一次抽樣中不可能發(fā)生 計(jì)量資料的統(tǒng)計(jì)描述 集中趨勢的指標(biāo): 平均數(shù) 定義:描述一組同質(zhì)計(jì)量資料的集中趨勢,反映某一組觀察值的平均水平或某一分布的平均位置的指標(biāo) 作用:作為一組資料的代表值,可用于組間的分析比較 均數(shù)的兩個重要特征à代表性 1. 離均差和等于0 2. 離均差平方最小小于 常用平均數(shù)指標(biāo): 1.算術(shù)均數(shù) (1)定義:全部觀察值相加之和除以觀察值個數(shù)所得的商 總體均數(shù) 樣本均數(shù) (2)算法: 1)直接法: 2)加權(quán)法: 3)縮減法 (3)注意事項(xiàng): 1)只有在合理分組的基礎(chǔ)上對同質(zhì)數(shù)據(jù)取均數(shù)才有意義
4、 2)均數(shù)用于近似正態(tài)分布的對稱分布,尤其是正態(tài)分布 2.幾何均數(shù)G(不能用算術(shù)均數(shù)時) (1)定義:幾個觀察值相乘之積,開幾次方所得根 (2)計(jì)算 1)直接法 2) (3)應(yīng)用注意: 1)幾何均數(shù)適用于觀察值相差很大,甚至呈倍數(shù)關(guān)系(等比或幾何級數(shù)資料)或用于對數(shù)正態(tài)分布資料 2)觀察值不能有零,不能同時有正負(fù), 若都為負(fù),去符號最后加符號, 觀察值比較小或有零,可加1,最后減去 3)同一資料求得的幾何均數(shù)小于均數(shù) 中位數(shù)M (1)定義:把一組觀察值按大小順序排列,位次居中的 (2)計(jì)算: 1)直接法 2)頻數(shù)表法: (
5、3)注意事項(xiàng) 1)適用場合:偏態(tài),開口(一端或兩端無界限),分布不清的 2)特性:只代表了居中觀察值的特性,敏感性低,不受特小特大值的影響 3)對于正態(tài)分布資料,理論上,中位數(shù)=均數(shù)(數(shù)值上) 百分位數(shù) (1)定義:將n個觀察值由小到大排列,編上秩次,將n個秩次100等分,與X%秩次相對應(yīng)的數(shù)值,即X的百分位數(shù),是一個位置指標(biāo),以Px表示(x代表百分秩次) Px將整個數(shù)列分為兩半,X%比Px小,1-X%比Px大 (2)計(jì)算: (3)應(yīng)用注意 1)百分位數(shù)常用于描述一組資料(樣本或總體)在某百分位數(shù)上的水平和分布特征,多個百分位數(shù)結(jié)合使用,可全面描述
6、觀察值分布特征,包括位置的大小和變異度 2)一般分布中部的百分位數(shù)相當(dāng)穩(wěn)定,代表性好, 靠近兩端的百分位數(shù),只在樣本含量足夠大(>120個)才足夠穩(wěn)定, 所以當(dāng)樣本含量不夠大時,不宜取兩端百分位數(shù) 3)用百分位數(shù)確定正常值范圍,習(xí)慣上95% 離散趨勢的描述 1. 極差R: 樣本資料中最大值和最小值之差 在一定程度上能說明樣本波動幅度的大小,但它只受樣本中兩個極端個體數(shù)值大小的影響,不能反映樣本中各個觀測值的變異程度,穩(wěn)定性差 2. 四分位數(shù)間距: 是上四分位數(shù)與下四分位數(shù)之差,用四分位數(shù)間距可反映變異程度的大小. 穩(wěn)定性好,
7、靈敏度不夠 3. 標(biāo)準(zhǔn)差: 1) 定義:描述一組同質(zhì)計(jì)量資料離散程度大小的指標(biāo) 反映了均數(shù)對一組觀察值的代表性 說明了觀察值圍繞均數(shù)分布的離散程度,個體變異 2) 計(jì)算: 3) 應(yīng)用: 1. 表示變量分布的離散程度 2. 結(jié)合均數(shù)描述正態(tài)分布特征 3. 結(jié)合均數(shù)計(jì)算變異系數(shù) 4. 結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤 4) 注意: (1) 不同單位,相同標(biāo)準(zhǔn)差,不能比較 (2) 大個體差異大,變異度大,小個體則變異度小 4.變異系數(shù)CV 1) 定義:標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表示 2) 計(jì)算: 3) 應(yīng)用:單位不同的幾組資料變異度及均數(shù)相差懸殊的幾組資料的變異度的比
8、較,不單獨(dú)使用 自由度ν 泛指可以自由取值的變量的個數(shù) 正常值:正常動植物解剖生理生化等各種數(shù)據(jù)的波動范圍 1) 必要性 1. 區(qū)分正常和異常 2. 看不同種群在不同時間地域上某一指標(biāo)的差異 2) 選取 1. 極差中的一部分 2. 單側(cè)或雙側(cè)正常值之分,由指標(biāo)實(shí)際情況及實(shí)驗(yàn)要求確定 3. 方式之一為正常值范圍的百分位數(shù),習(xí)慣上95% 雙側(cè):確定P2.5或P97.5 單側(cè):P5或P95,看實(shí)驗(yàn)需要 計(jì)量資料的統(tǒng)計(jì)推斷 統(tǒng)計(jì)推斷 用樣本信息推斷總體特征 參數(shù)估計(jì):由樣本結(jié)果對總體參數(shù)在一定概率水平下所做出的估計(jì) 假設(shè)檢驗(yàn) 正態(tài)分布 1) 概念:一種
9、連續(xù)型隨機(jī)變量的概率分布 密度函數(shù): 分布函數(shù): 2) 特征: 1. 在橫軸上均數(shù)處最高 2. 以均數(shù)為中心,左右對稱 3. 有兩個參數(shù) 4. 曲線下的面積分布有一定的規(guī)律F(x) 3) 應(yīng)用: 1. 以曲線下的面積反映頻率及概率分布 2. 估計(jì)正常值范圍或正常值范圍的正態(tài)分布法à雙側(cè)正常值范圍 3. 質(zhì)量控制 4. 正態(tài)分布是很多種統(tǒng)計(jì)方法的理論基礎(chǔ) 標(biāo)準(zhǔn)正態(tài)分布,u分布 Uα與面積的關(guān)系 對數(shù)正態(tài)分布 原觀察值x呈偏態(tài)(正偏),取對數(shù)后,lgX呈正態(tài)分布àx服從對數(shù)正態(tài)分布 均數(shù)的抽樣誤差 1. 定
10、義:平均數(shù)與總體均數(shù)之差 2. 均數(shù)抽樣誤差大小的度量 標(biāo)準(zhǔn)誤 1) 定義:樣本均數(shù)的標(biāo)準(zhǔn)差 2) 意義:反映抽樣誤差的大小 是樣本均數(shù)圍繞總體均數(shù)分布的離散程度,衡量了樣本均數(shù)的可靠程度 3) 計(jì)算: 一般一次抽樣估計(jì) 總體沒有標(biāo)準(zhǔn)誤,只針對樣本 4) 用途: (1) 計(jì)算可信區(qū)間(參數(shù)估計(jì)) (2) 用于統(tǒng)計(jì)推斷(假設(shè)檢驗(yàn)) t分布 1. t變換與t變量 2. t分布的特征 1) 單峰,一0為中心,左右對稱 2) 曲線中間比正態(tài)分布低,兩端翹得比正態(tài)分布高 3) 有無數(shù)根,中間越低,兩端越翹 t分布與自由度有關(guān),自由度越小,中間越低,
11、兩端越翹 當(dāng)自由度趨向無窮時,t分布趨向標(biāo)準(zhǔn)正態(tài)分布,tàu 3. 概率密度函數(shù)與分布函數(shù) 4. t介值與t介值表 tα,ν:給定自由度為ν,兩側(cè)雙尾面積之和為α?xí)r,相應(yīng)t值。 5. t分布原理:P(-tα,ν<= t <= tα,ν)=1-α 方差分析 方差分析又叫變量分析,俗稱F檢驗(yàn) 用途: 1. 兩個或多個均數(shù)的比較 2. 分離各有關(guān)因素,并分別估計(jì)其對變異的作用 3. 分析兩個或多個因素的交互作用 4. 方差齊性檢驗(yàn) 適用條件(用于多個均數(shù)比較時) 1. 個樣本是相互獨(dú)立的隨機(jī)樣本 2. 小樣本要求正態(tài)方差齊 基本思想:把全部觀察值之間的變異,總
12、變異,按設(shè)計(jì)需要,分為兩個或多個組成部分再作分析 計(jì)算 總體均數(shù)的估計(jì) 1. 總估計(jì) 2. 區(qū)間估計(jì): 1) 定義:按一定的概率估計(jì)總體均數(shù)在什么范圍內(nèi) 可信區(qū)間:按一定的概率估計(jì)總體均數(shù)的可能范圍 2) 方式: 1. t分布法: 按t分布的原理估計(jì)總體均數(shù)在什么范圍內(nèi)適用于總體標(biāo)準(zhǔn)差未知且n<50的情形 總體均數(shù)在可信區(qū)間的概率1-α 可信度:1-α 置信水平:α 通常,我們?nèi)?5%或99%作可信區(qū)間 2. 正態(tài)分布法 適用于總體標(biāo)準(zhǔn)差已知或n>50 總體標(biāo)準(zhǔn)差已知: n>50: 假設(shè)
13、檢驗(yàn) 為什么做假設(shè)檢驗(yàn) 檢驗(yàn)差別是否由抽樣誤差造成的 基本思想 假定差別是由抽樣誤差引起的 然后計(jì)算由抽樣誤差引起這么大,甚至比這更大的差別的概率P 根據(jù)小概率原理,作出拒絕或者接受假設(shè)的判斷 步驟 1. 建立假設(shè),確定檢驗(yàn)水準(zhǔn) 先確定是單側(cè)還是雙側(cè)的 若考慮u,u0有誤差別à雙側(cè) 若不僅考慮差別,還關(guān)注u,u0大小à單側(cè) 一般認(rèn)為雙側(cè) 無效假設(shè)H0:從反證法的基礎(chǔ)上提出的,無論何時,假設(shè)差別是由抽樣誤差造成的,但具體問題具體分析 備擇假設(shè)H1:與H0相對立的假設(shè),是依H0而產(chǎn)生的,一旦H0不成立,只能接受H1,現(xiàn)在H0不成立à非H0 à體現(xiàn)單雙側(cè)之分 檢驗(yàn)水準(zhǔn)
14、α:界定小概率事件的一個標(biāo)準(zhǔn)(有單雙側(cè)之分) 通常α=0.05 2. 選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量 3. 確定P值,做出統(tǒng)計(jì)推斷 P值:指由H0所規(guī)定的總體中做隨機(jī)抽樣,獲得等于大于或小于現(xiàn)有統(tǒng)計(jì)量的概率。若P<=α,拒絕H0;若P>α,接受H0 第一類錯誤和第二類錯誤 e 第一類:拒絕實(shí)際上成立的H0 e 第二類:不拒絕實(shí)際上不成立的H0 客觀實(shí)際 拒絕H0 不拒絕H0 H0成立 第一類錯誤(α) 推斷正確(1-α) H0不成立 推斷正確(1-β) 第二類錯誤(β) e 可信度 1-α e 把握度 β:未知,只能估計(jì),不能單獨(dú)存在,只有與H1結(jié)合才有意義 e
15、 檢驗(yàn)效能1-β:計(jì)量總體卻有差別,按α水準(zhǔn),能夠發(fā)現(xiàn)他們有差別的能力 注意 1. 樣本的代表性à組間的均衡性à資料的可比性 2. 選用的假設(shè)檢驗(yàn)方法一定要符合其適用條件 3. 正確理解差別有無顯著性的含義(顯著、極顯著 不意味著差別的大?。? 4. 結(jié)論不能絕對化 5. 報(bào)告要規(guī)范化 檢驗(yàn)方法 一、完全隨機(jī)設(shè)計(jì) (一)樣本均數(shù)與已知總體均數(shù)比較的假設(shè)檢驗(yàn) 1. 小樣本,總體標(biāo)準(zhǔn)差σ未知àt檢驗(yàn)(要求 x 取自正態(tài)總體) 2. 大樣本,總體標(biāo)準(zhǔn)差σ未知: 1) t檢驗(yàn)(嚴(yán)格)à法2 無需來自正態(tài)總體 2) u檢驗(yàn)(νà∞,tàu)à法1 3. 大樣本,總體標(biāo)準(zhǔn)
16、差σ已知àu檢驗(yàn) (二)兩個樣本均數(shù)比較的假設(shè)檢驗(yàn) 1. 小樣本(有一個就算),總體標(biāo)準(zhǔn)差σ未知,正態(tài)方差齊àt檢驗(yàn) A. 先求合并方差 B. 再求兩樣本均數(shù)差的標(biāo)準(zhǔn)誤 C. 計(jì)算t值 2. 小樣本(有一個就算),總體標(biāo)準(zhǔn)差σ未知,方差不齊(非正態(tài)) 1) 采用適當(dāng)?shù)淖兞孔儞Q使達(dá)到方差齊性的要求 2) 采用不要求方差齊的方法比較à非參數(shù)統(tǒng)計(jì) 3) 采用近似的t‘檢驗(yàn) 3. 大樣本àu檢驗(yàn)(不考慮正態(tài)方差齊的情況下,仍可用t檢驗(yàn)) (三)兩個樣本幾何均數(shù)比較的假設(shè)檢驗(yàn) 對x取反對數(shù),用t檢驗(yàn)或者u檢驗(yàn) (四)多個樣本均數(shù)的比較(單因素方差分析) 條件: 1.
17、 個樣本是相互獨(dú)立的隨機(jī)樣本 2. 小樣本要求正態(tài)方差齊 *多個樣本均數(shù)間的兩兩比較àq檢驗(yàn) 二、配對設(shè)計(jì) (一)配對設(shè)計(jì)的計(jì)量資料的比較 小樣本,t檢驗(yàn)àt=dSd/n 三、配伍組設(shè)計(jì) (一)多個樣本均數(shù)的比較(兩因素方差分析) 多個性質(zhì)相同的配伍,同一配伍組中的N個受試對象分別接受k種處理 作用: 1.可改善處理組間的均衡性 2.可分析配伍因素的的影響 3.提高設(shè)計(jì)效率,分析兩個因素 *多個樣本均數(shù)間的兩兩比較àq檢驗(yàn) 正態(tài)性檢驗(yàn) 一、為什么做正態(tài)性檢驗(yàn) 特定統(tǒng)計(jì)方法要求的 描述統(tǒng)計(jì) 平均數(shù)、標(biāo)準(zhǔn)差
18、 正常值范圍的正態(tài)統(tǒng)計(jì)法 統(tǒng)計(jì)推斷 t檢驗(yàn) F檢驗(yàn) 二、定義 判定資料是否服從正態(tài)分布或樣本是否來自正態(tài)總體的一類檢驗(yàn)方法 三、何時用? 1. 為了說明資料是否服從正態(tài)分布à一定要做 2. 為了滿足特定統(tǒng)計(jì)方法的需要à可以不做 四、怎么做? 正態(tài)分布分布的特征: 1. 對稱性à偏度(正偏、對稱、負(fù)偏) 三階 偏度系數(shù) g1 態(tài)峰à翹度(正態(tài)峰、尖峭峰、平闊峰) 四階 峰度系數(shù) g2 方差齊性檢驗(yàn) 一、為什么? 1. t檢驗(yàn) F檢驗(yàn) 使用條件的要求 2. 方差的抽樣波動 二、定義 說明變量值的變異度有無差別,或
19、者通過樣本信息來推斷總體方差是否相等的一類檢驗(yàn)方法 三、何時做? 1. 說明變量值的變異度有無差別時à一定做 2. 為滿足t、F檢驗(yàn)方差齊性要求的à可不做 四、如何做? 多個方差的齊性檢驗(yàn)——X2檢驗(yàn) 變量變換 意義:通過改變觀察值的原初形式,使資料正太化,達(dá)到方差齊性的要求,以滿足t檢驗(yàn)及方差分析的應(yīng)用條件 依據(jù):只改變觀察值的分布形式,而不是其相對大小 常用方法: 1) 對數(shù)變換:以觀察值x的對數(shù)值作為新的分析數(shù)據(jù) 常用方式 適用場合: 1. 使服從對數(shù)正態(tài)分布的資料正態(tài)化 2. 使方差達(dá)到方差齊性要求,特別是標(biāo)準(zhǔn)差與均
20、數(shù)的比值接近時 3. 使指數(shù)曲線直線化,常用于曲線擬合 2) 平方根變換:以原觀察值x的平方根作為新的分析數(shù)據(jù) 常用方式 適用場合: 1. 使服從Poisson分布的計(jì)數(shù)資料或輕度偏態(tài)資料正態(tài)化 2. 使各樣本的方差與均數(shù)的正比例關(guān)系消除或削弱,達(dá)到方差齊性要求 3) 百分?jǐn)?shù)、平方根、正反弦變換 以原觀察值用百分?jǐn)?shù)表示,平方根反正弦值作為新的分析數(shù)據(jù) 適用場合:總體百分?jǐn)?shù)小于30%或大于70%的情形 計(jì)數(shù)資料的統(tǒng)計(jì)描述和推斷 相對數(shù) (一)為什么引入 絕對數(shù)不能做進(jìn)一步分析 (二)什么是相對
21、數(shù) 同一基礎(chǔ)上,兩個有聯(lián)系指標(biāo)之比 *常用指標(biāo) 1. 率/頻率指標(biāo):用以說明某現(xiàn)象發(fā)生的頻率與強(qiáng)度 計(jì)算 比例基數(shù)—依習(xí)慣而用 —使算的的率至少保留1-2位整數(shù) 2. 構(gòu)成比/構(gòu)成指標(biāo):用以說明某一事物內(nèi)部各組成部分所占的比重或分布→總和為100% 計(jì)算 *若總和不為100%:超減于大,低加在小 3. 相對比:兩個有關(guān)同類指標(biāo)之比,用以說明兩者的對比水平 計(jì)算 *指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù) 4. 動態(tài)數(shù)列:一系列按時間順序排列起來的統(tǒng)計(jì)指標(biāo),用以說明事物延時間發(fā)展的變化與趨勢 *指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù) *動態(tài)分析:(1
22、)絕對增量=統(tǒng)計(jì)期指標(biāo)-基期指標(biāo) 說明事物在一定時期增加的絕對數(shù)量 可分為 逐年的、逐期的:后比前,內(nèi)部波動 累計(jì)的:基期固定,總體結(jié)果 (2) 發(fā)展速度、增長速度: 反映事物在一定時期的速度變化,可分為定基與環(huán)基 發(fā)展速度=統(tǒng)計(jì)期指標(biāo)/基期指標(biāo) 增長速度=發(fā)展速度-1 (三)應(yīng)用相對數(shù)應(yīng)注意的問題 1. 計(jì)算相對數(shù)的分母一般不宜過小,對于動物實(shí)驗(yàn),可減小 2. 分析時不能以比代率 3. 計(jì)算觀察單位不等的幾個率的平均值時,不能直接相加求平均 4. 資料的對比應(yīng)注意可比性 5. 率和構(gòu)成比也可有抽樣誤差→假設(shè)檢驗(yàn) 二項(xiàng)分布及其應(yīng)用 (一)概念及其
23、應(yīng)用條件 對于某個性狀,常常可以把其資料分成兩個類型。即“非此即彼”兩種情況,彼此構(gòu)成對立事件,我們把這種“非此即彼”事件所構(gòu)成的總體,稱為二項(xiàng)總體,其概率分布稱為二項(xiàng)分布。 1. 二項(xiàng)分布的概率密度函數(shù): 重復(fù)做①n次相互獨(dú)立的實(shí)驗(yàn),每次實(shí)驗(yàn)②有相互獨(dú)立的結(jié)果, ③P(A)=Π P(A)=1-Π,則n次實(shí)驗(yàn)中A恰好發(fā)生x次的概率 2. 實(shí)驗(yàn)有①②③,則可用二項(xiàng)分布處理 3. 分布函數(shù) 4. 特征: Π=0.5 對稱,正態(tài) 0.3≤Π≤0.7 近似對稱,近似正態(tài) Π>0.7 或 Π<0.3 偏態(tài)嚴(yán)重,離0.5越遠(yuǎn),偏的越
24、厲害 二項(xiàng)分布近似正態(tài)分布的條件: 1) Π,1-Π 均大于0.01 à Π不接近0或1 2) nΠ,n(1-Π) 均大于5à n足夠大 5. 二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差、 (二)二項(xiàng)分布的應(yīng)用 1.總體率的可信區(qū)間 (1) 點(diǎn)估計(jì) (2) 區(qū)間估計(jì) 1) 查表法 2) 正態(tài)近似法(條件) 2. 樣本率與已知總體率比較的假設(shè)檢驗(yàn) (1) 直接計(jì)算概率法 利用二項(xiàng)分布的概率密度和分布函數(shù),求出p值,與所用的檢驗(yàn)水準(zhǔn)α進(jìn)行比較,做出統(tǒng)計(jì)推斷 適用條件:Π偏離0.5較遠(yuǎn),x較小 (2) 正態(tài)近似法(條件)
25、 (3) 兩個樣本率比較的u檢驗(yàn)(條件) Poisson分布及其應(yīng)用 (一)概念及應(yīng)用條件 是二項(xiàng)分布的一個特例,當(dāng)Π或1-Π很?。?0.05)而n很大時,二項(xiàng)分布近似于Poisson分布 常用于研究單位時間或單位面積或容積內(nèi),某罕見事件發(fā)生次數(shù)的分布 1. 概率密度函數(shù): 2. 應(yīng)用條件:同二項(xiàng)分布 3. 分布函數(shù) 4. 特點(diǎn): X 離散型分布,適用于計(jì)數(shù)資料 X 二項(xiàng)分布的特例,應(yīng)用條件同二項(xiàng)分布 X 方差等于均數(shù),σ=λ X λ≥20
26、時,Poission分布近似正態(tài)分布 X Poisson分布具有可加性 (二)應(yīng)用 1. 總體均數(shù)λ的估計(jì)(區(qū)間) 1) 查表法 x≤50 2) 正態(tài)近似法 2. 樣本均數(shù)與總體均數(shù)的比較 1) 直接計(jì)算概率法 2) 正態(tài)近似法 3. 兩個樣本均數(shù)的比較à u檢驗(yàn) 1) 兩個樣本觀察單位數(shù)相等 2) 兩樣本單位不同時 X2檢驗(yàn)及其應(yīng)用——同性質(zhì)、適合性、獨(dú)立性檢驗(yàn) 一、 X2分布 1. X2變量ν個標(biāo)準(zhǔn)正態(tài)變量平方和 2. 概率密度函數(shù) 3. 分布函數(shù) 4. X2介值表 5.
27、 X2分布與正態(tài)分布的關(guān)系 隨著自由度的增加 卡方分布近似于正態(tài)分布 當(dāng)ν=1時, 二、X2檢驗(yàn)的基本思想 在實(shí)際操作中,k個實(shí)際頻數(shù)ki 與其相應(yīng)的理論頻數(shù)T 的差值 i=1kAi-Ti2Ti① 表示實(shí)際頻數(shù)與理論頻數(shù)的吻合程度 *當(dāng)n>40,Ti>5時,上式①近似X2 *可以利用X2值檢驗(yàn)實(shí)際頻數(shù)與按假設(shè)檢驗(yàn)計(jì)算的理論頻數(shù)是否相等的問題 *如果假設(shè)成立,那X2 ≈ 0;不應(yīng)出現(xiàn)大X2的概率P<α,如果出現(xiàn),則可以懷疑假設(shè)是否成立,進(jìn)而拒絕他,反之不拒絕 X2的基本公式 X2=A-T2T n>40,T>5 TRC=nR?nCn Tmin=nRmin?
28、nCminn
ν=R-1C-1
四格表資料
處理
陽性數(shù)
陰性數(shù)
合計(jì)
陽性率
1
a
b
a+b
2
c
d
c+d
合計(jì)
a+c
b+d
n
X2基本公式的專用公式
X2=ad-bc2?na+bc+da+cb+d n>40,T>5
X2校正公式
X2=A-T-0.52T n>40,1 29、 n<40 或 T<1
配對計(jì)數(shù)資料的X2檢驗(yàn)
甲處理
乙處理
合計(jì)
+
-
+
a
b
a+b
-
c
d
c+d
合計(jì)
a+c
b+d
n
1) 兩種處理有誤差別
X2=b-c-12b+c b+c>40時可不校正
2) 兩種處理有無相關(guān)(雙向有序列聯(lián)表)
X2=ad-bc-n22a+bc+da+cb+d
R×C 列聯(lián)表X2檢驗(yàn)
基本數(shù)據(jù)中多于四格表
用途:
1. 多個樣本率的比較
2. 樣本構(gòu)成比的比較(三個以上)
3. 計(jì)數(shù)資料的相關(guān)分析
基本思想、基本公式、自由度的計(jì)算同前
X2=A2nR?n 30、C-1
應(yīng)用條件:
1.n>40
2.1 31、檢驗(yàn)——判定樣本頻數(shù)分布是否符合某一理論
Pi=Fu2-Fu1=Fx2-μσ-x1-μσ
ν=行-1
非參數(shù)統(tǒng)計(jì)
*不依賴于總體的分布形式,應(yīng)用時忽略分布類型是否已知
*檢驗(yàn)時比較分布而非參數(shù)
*適用范圍廣,不受分布形式限制
*可用于不能活未能精確測量的資料,尤其適用等級資料或適合于算中位數(shù)
*前提為變量變換后仍不能達(dá)到正態(tài)
缺點(diǎn):檢驗(yàn)效能低=參數(shù)統(tǒng)計(jì)×30%
適用場合:
①等級資料②偏態(tài)分布(經(jīng)變換后不能正態(tài),近似L型)③開口資料④分布不清的
⑤方差不齊(經(jīng)變換后仍不能達(dá)到齊性)
常用方法:
①符號檢驗(yàn) ②秩和檢驗(yàn) ③超越檢驗(yàn) ④游程檢驗(yàn) ⑤等級相 32、關(guān)分析
秩和檢驗(yàn)
(一) 配對比較的符號秩和檢驗(yàn)
(二) 兩個樣本比較的秩和檢驗(yàn)
(三) 多個樣本比較的秩和檢驗(yàn)
(四) 多個樣本兩兩比較的秩和檢驗(yàn)àt檢驗(yàn)
相關(guān)與回歸分析
直線相關(guān)
一、 概念
1. 兩變量間的關(guān)系
2. 直線相關(guān)分析:找出一個適當(dāng)?shù)闹笜?biāo)來描述兩個變量間的直線相關(guān)關(guān)系、相關(guān)密切程度及方向是怎樣的
3. 適用條件:雙變量正態(tài)分布或正態(tài)雙變量
二、 相關(guān)系數(shù)(指標(biāo))
1. 定義:描述兩個變量間有無直線變量關(guān)系及密切程度
樣本àr 總體àρ
2. 意義:通過取值描述不同的相關(guān)情形
3. 相關(guān)系 33、數(shù)的計(jì)算
4. r=0 推出 ρ =0 à r的假設(shè)檢驗(yàn)à t檢驗(yàn)
等級相關(guān)
用等級數(shù)據(jù)做直線相關(guān)分析
適用場合:
1.不服從雙變量正態(tài)分布的
2.總體分布型未知的
3.原始數(shù)據(jù)使用等級表示的
等級相關(guān)系數(shù):表明兩變量間的相關(guān)密切程度
樣本rs 總體ρs
rs的檢驗(yàn):1.查表法
2.t檢驗(yàn)
直線回歸
一、概念
研究兩變量在數(shù)量上的依存關(guān)系
直線回歸方程 y=a+bx+ε
*用容易測量的變量推算不易測得的變量
*對資料的要求:
1.正態(tài)雙變量:x à y & y à x 34、 的兩個方程(不同)
2.至少有一個是正態(tài)變量,必須是yà要求x是精確測定的
二、直線回歸方程
1.一般表達(dá)式
*數(shù)學(xué)模型:Y=a+bx+ε
*一般表達(dá)式:
2.系數(shù)a、b的求法
三、 直線回歸方程的圖示
四、 回歸系數(shù)的假設(shè)檢驗(yàn)
1. 方差分析(F檢驗(yàn))
2. 回歸系數(shù)b的t檢驗(yàn)
五、 回歸方程的應(yīng)用
1. 描述兩變量間的依存關(guān)系
2. 以容易測得的變量去推測不易測得的變量
3. 利用回歸方程進(jìn)行預(yù)測預(yù)報(bào)(一個區(qū)間)把變量x帶入回歸方程中去估計(jì)Y
35、
4. 利用直線回歸方程進(jìn)行控制
六、 應(yīng)用注意
1. 要有實(shí)際意義
2. 資料要符合要求
3. 自變量和因變量的選擇要符合實(shí)際
4. 直線回歸的范圍只限于取得原始資料的范圍
5. 直線回歸方程可以內(nèi)插,一般不能外延
6. 回歸方程必須經(jīng)過檢驗(yàn)
七、 相關(guān)與回歸的區(qū)別與聯(lián)系
區(qū)別
相關(guān)
回歸
資料要求
正態(tài)雙變量
至少有一個為正態(tài)變量
意義
反映相關(guān)關(guān)系
反映依存關(guān)系
應(yīng)用
說明有無相關(guān)關(guān)系
說明有無依存關(guān)系
r
b
意義
描述兩變量間有無相關(guān)關(guān)系及相關(guān)的密切程度和方向的指標(biāo)
x增減 36、一個單位,y平均改變b個單位
范圍
[-1,1]
(-∞,+∞)
單位
無
y單位或x單位
聯(lián)系:
1. 對同一正態(tài)雙變量資料,如果計(jì)算得r、b,則r與b符號一致
2. 相關(guān)系數(shù)的假設(shè)檢驗(yàn)與回歸系數(shù)的假設(shè)檢驗(yàn)一致,對同一資料,tr=tb
3. r與b的數(shù)值關(guān)系:
4. 回歸可解釋相關(guān)
曲線擬合
1. 用途:
1) 修勻(變成平滑曲線)
2) 估計(jì)(x,y之間不是函數(shù)關(guān)系)
3) 求極值及極值點(diǎn)(擬合二次曲線,三次曲線特有用途)
2. 步驟:
1)曲線定型:根據(jù)資料的性質(zhì)和散點(diǎn)圖的趨勢(可多定幾個,剩余平方和小的好)
2)對 37、稱化和直線化:通過變量變換以減弱或消除原散點(diǎn)圖的曲線趨勢(直線化)
通過變量變換以減弱或消除原散點(diǎn)圖的不對稱趨勢(對稱化)
3)按直線回歸,求a’,b’,會帶到原曲線方程中去
4)計(jì)算y與y,算殘差(逐個算)y-y進(jìn)行殘差分析
5)做曲線圖(專門軟件)
6)做假設(shè)檢驗(yàn)(對直線化的直線回歸方程中的b’做)
3.常見的曲線形及直線化
調(diào)查設(shè)計(jì)
設(shè)計(jì):為達(dá)到某種目的,所準(zhǔn)備采取的方法、母的、途徑等的有機(jī)結(jié)合,事件進(jìn)行前完成
統(tǒng)計(jì)設(shè)計(jì):拋開具體問題,共性是數(shù)據(jù)的收集、整理、分析,一個好的設(shè)計(jì)包括以上全過程,應(yīng)使三階段前后呼應(yīng)連為整體,保證調(diào)查和實(shí)驗(yàn)準(zhǔn)確進(jìn)行,節(jié)省人力 38、、財(cái)力、時間。
調(diào)查設(shè)計(jì)包含:調(diào)查計(jì)劃、整理分析計(jì)劃
一、 調(diào)查計(jì)劃
1. 明確目的和指標(biāo)
估計(jì)范圍、比較差別、尋找關(guān)系
指標(biāo)要求:具體、精選、盡量用客觀、有特異性的、計(jì)量指標(biāo)
2. 確定調(diào)查對象、觀察單位(樣方、采樣點(diǎn))
根據(jù)目的和指標(biāo)確定
實(shí)質(zhì)為劃定同質(zhì)總體范圍
3. 確定調(diào)查方法(抽樣?全面?典型?)
4. 收集原始資料的方式
*直接觀察(觀測)
*采訪、訪談、信訪
5. 確定調(diào)查項(xiàng)目、調(diào)查表
項(xiàng)目:
1) 分析項(xiàng)目
2) 備查項(xiàng)目
調(diào)查表:
1) 一覽表:多個觀察單位,項(xiàng)目少
2) 卡片:一個調(diào)查單位一張表,項(xiàng)目多
6. 制定調(diào)查的組織計(jì)劃
二、 整理分析計(jì)劃
1. 設(shè)計(jì)分組
2. 設(shè)計(jì)整理表
3. 確定歸組方式
四種基本抽樣方法
1. 單純隨機(jī)抽樣
2. 分層抽樣
3. 系統(tǒng)抽樣
4. 整群抽樣
樣本含量的估計(jì)
樣本含量的計(jì)算方法
實(shí)驗(yàn)設(shè)計(jì)(筆記)
(注:文檔可能無法思考全面,請瀏覽后下載,供參考??蓮?fù)制、編制,期待你的好評與關(guān)注?。?
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業(yè)管理制度:常見突發(fā)緊急事件應(yīng)急處置程序和方法
- 某物業(yè)公司冬季除雪工作應(yīng)急預(yù)案范文
- 物業(yè)管理制度:小區(qū)日常巡查工作規(guī)程
- 物業(yè)管理制度:設(shè)備設(shè)施故障應(yīng)急預(yù)案
- 某物業(yè)公司小區(qū)地下停車場管理制度
- 某物業(yè)公司巡查、檢查工作內(nèi)容、方法和要求
- 物業(yè)管理制度:安全防范十大應(yīng)急處理預(yù)案
- 物業(yè)公司巡查、檢查工作內(nèi)容、方法和要求
- 某物業(yè)公司保潔部門領(lǐng)班總結(jié)
- 某公司安全生產(chǎn)舉報(bào)獎勵制度
- 物業(yè)管理:火情火災(zāi)應(yīng)急預(yù)案
- 某物業(yè)安保崗位職責(zé)
- 物業(yè)管理制度:節(jié)前工作重點(diǎn)總結(jié)
- 物業(yè)管理:某小區(qū)消防演習(xí)方案
- 某物業(yè)公司客服部工作職責(zé)