《醫(yī)學統(tǒng)計學基礎》由會員分享,可在線閱讀,更多相關《醫(yī)學統(tǒng)計學基礎(26頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單擊此處編輯母版標題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,*,*,*,,,,統(tǒng)計學基本概念,,公衛(wèi)學院流行病與統(tǒng)計學系,,易偉寧 講師,,,什么是醫(yī)學統(tǒng)計學,研究設計,資料收集,資料整理,統(tǒng)計分析,應用科學,,全程參與,數(shù)據(jù),提煉,信息,基本概念,population & sample,,homogeneity,& variance,,variable type: numerical,,categorical (binary, nominal, ordinal),,,,...,random,,sample,r,epresentative,,(typica
2、l),gender,age,blood type,height / weight / bmi,obesity degree,方法選用與類型密切聯(lián)系,基本概念,error,,,,,,,samping,systematic,random,nonrandom,measurement,nonsystematic,舉例:對一組人的血壓測量,,,,,,,頻率與概率probability, P的特點,,,,,,,小概率事件(P<0.05或P<0.01),,small probability event,,,,,,,...,random,,sample,,gender,age,blood type,heigh
3、t / weight / bmi,obesity degree,描述與推斷,描述總體,描述樣本(統(tǒng)計指標和圖表),樣本推斷總體,,(估計總體參數(shù)和檢驗),descriptive,statistics VS,statistical inference,數(shù)值變量的統(tǒng)計描述,,公衛(wèi)學院流行病與統(tǒng)計學系,,易偉寧 講師,,,統(tǒng)計描述,的主要內(nèi)容,反映分布特征:頻數(shù)表,(,frequency table,),、直方圖,(,histogram,),。,其外還有,箱圖、莖葉圖、正態(tài)Q-Q圖,,,反映集中趨勢(平均水平)的指標: 均數(shù)(mean)、中位數(shù)(median)、幾何均數(shù),,,反映離散趨勢(變異程度
4、)的指標: 全距(range)、四分位間距(interquartile range)方差,和,標準差(variance,&,standard deviation )、變異系數(shù),,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,某年某地2歲男童的身高,資料,考察資料的分布類型,頻數(shù)表:將100個身高值等距分為約10個組,第1組包括最小值75.4,最末組包括最大值93.5,分別清點各組的身高個數(shù)(頻數(shù)),可編制出身高頻數(shù)表。,,,直方圖:以身高組段
5、為橫軸,各組相應頻數(shù)為縱軸,所作出的統(tǒng)計圖,,從頻數(shù)表和直方圖總結出資料的分布特征是:中央位置,,84 - 86cm處的身高值最多,以此為中心左右大致對稱。,,據(jù)此認為身高資料屬于對稱,分布或近似正態(tài)分布的資料,反映集中,離散,趨勢,的指標,標準差為非負數(shù),值越小說明這組數(shù)的變異程度越大,樣本均數(shù)容易受特大或特小值的影響,要求必須是對稱分布資料,正態(tài)分布資料的特征,? 鐘型曲線,? 均數(shù)為中心,左右對稱,? 位置參數(shù)和變異度參數(shù),④,曲線下面積規(guī)律,95%,95%的身高值(77,92)范圍內(nèi),即身高的95%正常值范圍,√,√,一組帶瘤小鼠經(jīng)治療后的生存天數(shù),,,,,,,,,,,根據(jù)經(jīng)驗可知
6、,生存數(shù)據(jù)往往是不對稱,分布,,(偏態(tài)分布)的,因此計算生存天數(shù)的算術平,,均值不合理,應改用中位生存天數(shù)描述其集中,,趨勢。同理描述離散趨勢的指標是四分位間距,,,SPSS軟件概述,,公衛(wèi)學院流行病與統(tǒng)計學系,,易偉寧 講師,,,SPSS是什么?,,美國SPSS公司產(chǎn)品,,后被IBM公司收購,,SPSS,曾經(jīng),是,社會科學統(tǒng)計軟件包,的縮寫,,,(,S,tatistical,P,ackage for,S,ocial,S,ciences,),,后來被,解釋,為,統(tǒng)計產(chǎn)品和服務解決方案,,(,S,tatistical,P,roduct and,S,ervice,s,olutions,),,主要功
7、能:數(shù)據(jù),輸入,數(shù)據(jù),管理,統(tǒng)計分析,,,繪圖,SPSS常用窗口介紹,,數(shù)據(jù)編輯窗口 Data Editor,類似Excel表格形式,每一行代表一個個體(case)每一列代表該個體的一個屬性。,,,結果瀏覽窗口 Output Viewer,可編輯和導出為word或html等格式。,,,對應擴展名為SAV, SPO的文件,數(shù)據(jù)輸入舉例,,某地,100名一,年級兒童的體檢表,,,學號:,40025,姓名:,略,,,性別:男 女,√,出生日期:,20,0,8,年,1,月,2,日,,,體檢結果,,身高,120.0,cm 體重,19.5,kg 肺活量,883,ml,變量清單,,,,,,,,,,
8、,,,,,,,,,,,,,,,,,,,,,,,,,,,練習,,新建數(shù)據(jù)文件,,輸入體檢表,內(nèi)容,并保存 (SAV),,注意正確的,變量命名,,,打開,SPSS,自帶的雇員數(shù)據(jù)文件( e,mployee data.sav,),默認在,C:\Program Files\SPSS\,將其,另存為excel97格式的文件(XLS),,,用SPSS讀取,excel格式的雇員數(shù)據(jù),文件,注意讀取文件前要關閉EXCEL,軟件,Data菜單,,定義變量屬性,,復制數(shù)據(jù)屬性,,定義日期,,插入變量,√,,插入個案,√,,跳至..,,,排序,√,,轉置,,重構,,合并文件,,數(shù)據(jù)匯總,,發(fā)現(xiàn)重復數(shù)據(jù),,正交設計,
9、,,分割文件,,選擇觀測,√,,加權,√,Transform菜單,,計算√,,重編碼√,,可視化分組√,,計數(shù),,數(shù)據(jù)編秩,,自動編碼,,練習1(以Employee數(shù)據(jù)為例),,1. 插入(或刪除)變量(或觀測對象),,,2.,對,單個變量(如,受教育年數(shù)educ)排序,,,3. 對多個變量(如,性別gender,和,educ,),排序,,,4. 依,條件選擇觀測,,如僅保存女性且職業(yè)類,,別是經(jīng)理的觀測。(,gender = ‘f’ & jobcat=3,),,,注意敲入的是純英文而非中文輸入狀態(tài)下的單引號,,,5. 用,Compute,命令,產(chǎn)生新變量,d,反映年收入的增幅,即d = 當前
10、salary - 以前salary,,,6. 用,Record,命令產(chǎn)生新變量group,取值為1代表男性雇員,取值為2代表女性雇員,,,7. 用,Record,命令將男雇員年收入轉換為三檔,,,年收入<3萬/年屬于低檔,3-3.6萬/年屬于中檔,其余屬于高檔,,,練習2,,1. 對身高數(shù)據(jù)用,visual bander,命令將等距分為10組,,2. Analyze → Descriptive Statistics →,,Frequencies → Display Frequency table,,命令作頻數(shù)表,,3. Graphs → histogram命令作直方圖,,4. 計算合適的集中趨勢、離散趨勢指標,,5.,對雇員salary(萬/年)變量重復上述分析過程,,6. 利用身高的樣本數(shù)據(jù)估計其95%正常值范圍,,,,