《醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)》由會(huì)員分享,可在線閱讀,更多相關(guān)《醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)(26頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,*,*,統(tǒng)計(jì)學(xué)基本概念,公衛(wèi)學(xué)院流行病與統(tǒng)計(jì)學(xué)系,易偉寧 講師,什么是醫(yī)學(xué)統(tǒng)計(jì)學(xué),研究設(shè)計(jì),資料收集,資料整理,統(tǒng)計(jì)分析,應(yīng)用科學(xué),全程參與,數(shù)據(jù),提煉,信息,基本概念,population & sample,homogeneity,& variance,variable type: numerical,categorical (binary, nominal, ordinal),.,random,sample,r,epresentative,(typical),gender,age,blood type,
2、height / weight / bmi,obesity degree,方法選用與類型密切聯(lián)系,基本概念,error,samping,systematic,random,nonrandom,measurement,nonsystematic,舉例:對(duì)一組人的血壓測(cè)量,頻率與概率probability, P的特點(diǎn),小概率事件(P0.05或P0.01),small probability event,.,random,sample,gender,age,blood type,height / weight / bmi,obesity degree,描述與推斷,描述總體,描述樣本(統(tǒng)計(jì)指標(biāo)和圖表)
3、,樣本推斷總體,(估計(jì)總體參數(shù)和檢驗(yàn)),descriptive,statistics VS,statistical inference,數(shù)值變量的統(tǒng)計(jì)描述,公衛(wèi)學(xué)院流行病與統(tǒng)計(jì)學(xué)系,易偉寧 講師,統(tǒng)計(jì)描述,的主要內(nèi)容,反映分布特征:頻數(shù)表,(,frequency table,),、直方圖,(,histogram,),。,其外還有,箱圖、莖葉圖、正態(tài)Q-Q圖,反映集中趨勢(shì)(平均水平)的指標(biāo): 均數(shù)(mean)、中位數(shù)(median)、幾何均數(shù),反映離散趨勢(shì)(變異程度)的指標(biāo): 全距(range)、四分位間距(interquartile range)方差,和,標(biāo)準(zhǔn)差(variance,&,stan
4、dard deviation )、變異系數(shù),某年某地2歲男童的身高,資料,考察資料的分布類型,頻數(shù)表:將100個(gè)身高值等距分為約10個(gè)組,第1組包括最小值75.4,最末組包括最大值93.5,分別清點(diǎn)各組的身高個(gè)數(shù)(頻數(shù)),可編制出身高頻數(shù)表。,直方圖:以身高組段為橫軸,各組相應(yīng)頻數(shù)為縱軸,所作出的統(tǒng)計(jì)圖,從頻數(shù)表和直方圖總結(jié)出資料的分布特征是:中央位置,84 - 86cm處的身高值最多,以此為中心左右大致對(duì)稱。,據(jù)此認(rèn)為身高資料屬于對(duì)稱,分布或近似正態(tài)分布的資料,反映集中,離散,趨勢(shì),的指標(biāo),標(biāo)準(zhǔn)差為非負(fù)數(shù),值越小說明這組數(shù)的變異程度越大,樣本均數(shù)容易受特大或特小值的影響,要求必須是對(duì)稱分布資
5、料,正態(tài)分布資料的特征, 鐘型曲線, 均數(shù)為中心,左右對(duì)稱, 位置參數(shù)和變異度參數(shù),曲線下面積規(guī)律,95%,95%的身高值(77,92)范圍內(nèi),即身高的95%正常值范圍,一組帶瘤小鼠經(jīng)治療后的生存天數(shù),根據(jù)經(jīng)驗(yàn)可知,生存數(shù)據(jù)往往是不對(duì)稱,分布,(偏態(tài)分布)的,因此計(jì)算生存天數(shù)的算術(shù)平,均值不合理,應(yīng)改用中位生存天數(shù)描述其集中,趨勢(shì)。同理描述離散趨勢(shì)的指標(biāo)是四分位間距,SPSS軟件概述,公衛(wèi)學(xué)院流行病與統(tǒng)計(jì)學(xué)系,易偉寧 講師,SPSS是什么?,美國(guó)SPSS公司產(chǎn)品,,后被IBM公司收購(gòu),SPSS,曾經(jīng),是,社會(huì)科學(xué)統(tǒng)計(jì)軟件包,的縮寫,(,S,tatistical,P,ackage for,S,o
6、cial,S,ciences,),后來被,解釋,為,統(tǒng)計(jì)產(chǎn)品和服務(wù)解決方案,(,S,tatistical,P,roduct and,S,ervice,s,olutions,),主要功能:數(shù)據(jù),輸入,數(shù)據(jù),管理,統(tǒng)計(jì)分析,,,繪圖,SPSS常用窗口介紹,數(shù)據(jù)編輯窗口 Data Editor,類似Excel表格形式,每一行代表一個(gè)個(gè)體(case)每一列代表該個(gè)體的一個(gè)屬性。,結(jié)果瀏覽窗口 Output Viewer,可編輯和導(dǎo)出為word或html等格式。,對(duì)應(yīng)擴(kuò)展名為SAV, SPO的文件,數(shù)據(jù)輸入舉例,某地,100名一,年級(jí)兒童的體檢表,學(xué)號(hào):,40025,姓名:,略,性別:男 女,出生日期:
7、,20,0,8,年,1,月,2,日,體檢結(jié)果,身高,120.0,cm 體重,19.5,kg 肺活量,883,ml,變量清單,練習(xí),新建數(shù)據(jù)文件,,輸入體檢表,內(nèi)容,并保存 (SAV),注意正確的,變量命名,打開,SPSS,自帶的雇員數(shù)據(jù)文件( e,mployee data.sav,),默認(rèn)在,C:Program FilesSPSS,將其,另存為excel97格式的文件(XLS),用SPSS讀取,excel格式的雇員數(shù)據(jù),文件,注意讀取文件前要關(guān)閉EXCEL,軟件,Data菜單,定義變量屬性,復(fù)制數(shù)據(jù)屬性,定義日期,插入變量,插入個(gè)案,跳至.,排序,轉(zhuǎn)置,重構(gòu),合并文件,數(shù)據(jù)匯總,發(fā)現(xiàn)重復(fù)數(shù)據(jù),
8、正交設(shè)計(jì),分割文件,選擇觀測(cè),加權(quán),Transform菜單,計(jì)算,重編碼,可視化分組,計(jì)數(shù),數(shù)據(jù)編秩,自動(dòng)編碼,練習(xí)1(以Employee數(shù)據(jù)為例),1. 插入(或刪除)變量(或觀測(cè)對(duì)象),2.,對(duì),單個(gè)變量(如,受教育年數(shù)educ)排序,3. 對(duì)多個(gè)變量(如,性別gender,和,educ,),排序,4. 依,條件選擇觀測(cè),,如僅保存女性且職業(yè)類,別是經(jīng)理的觀測(cè)。(,gender = f & jobcat=3,),注意敲入的是純英文而非中文輸入狀態(tài)下的單引號(hào),5. 用,Compute,命令,產(chǎn)生新變量,d,反映年收入的增幅,即d = 當(dāng)前salary - 以前salary,6. 用,Reco
9、rd,命令產(chǎn)生新變量group,取值為1代表男性雇員,取值為2代表女性雇員,7. 用,Record,命令將男雇員年收入轉(zhuǎn)換為三檔,年收入3萬/年屬于低檔,3-3.6萬/年屬于中檔,其余屬于高檔,練習(xí)2,1. 對(duì)身高數(shù)據(jù)用,visual bander,命令將等距分為10組,2. Analyze Descriptive Statistics ,Frequencies Display Frequency table,命令作頻數(shù)表,3. Graphs histogram命令作直方圖,4. 計(jì)算合適的集中趨勢(shì)、離散趨勢(shì)指標(biāo),5.,對(duì)雇員salary(萬/年)變量重復(fù)上述分析過程,6. 利用身高的樣本數(shù)據(jù)估計(jì)其95%正常值范圍,