統(tǒng)計(jì)數(shù)據(jù)的整理與顯示.ppt
《統(tǒng)計(jì)數(shù)據(jù)的整理與顯示.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《統(tǒng)計(jì)數(shù)據(jù)的整理與顯示.ppt(94頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
統(tǒng)計(jì)數(shù)據(jù)的整理與顯示,第三章,2,目錄,第一節(jié)數(shù)據(jù)的預(yù)處理第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的顯示,3,第一節(jié)數(shù)據(jù)的預(yù)處理,一、數(shù)據(jù)的審核二、數(shù)據(jù)的篩選三、數(shù)據(jù)的排序四、建立數(shù)據(jù)透視表,4,一、數(shù)據(jù)的審核,審核資料的完整性和及時(shí)性審核資料的正確性歷史資料的審核,數(shù)據(jù)的審核即對(duì)調(diào)查資料進(jìn)行審核,5,二、數(shù)據(jù)的篩選,1)當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選2)根據(jù)某種需要進(jìn)行篩選,6,用Excel進(jìn)行數(shù)據(jù)篩選,8名學(xué)生的考試成績(jī)數(shù)據(jù),數(shù)據(jù)篩選(datafilter),7,,數(shù)據(jù)篩選(datafilter),8,自動(dòng)篩選,9,高級(jí)篩選,10,高級(jí)篩選,11,三、數(shù)據(jù)的排序,按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)在某些場(chǎng)合,排序本身就是分析的目的之一排序可借助于計(jì)算機(jī)完成,12,數(shù)據(jù)排序(方法),分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分,13,2.數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)x(2)>…>x(n),數(shù)據(jù)排序(方法),14,在Excel中進(jìn)行排序(以8名學(xué)生的考試成績(jī)?yōu)槔?數(shù)據(jù)排序(方法),15,按統(tǒng)計(jì)學(xué)成績(jī)排序后的學(xué)生成績(jī)排名,數(shù)據(jù)排序(方法),16,四、建立數(shù)據(jù)透視表,從復(fù)雜的數(shù)據(jù)中提取有用的信息可以對(duì)數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進(jìn)行匯總和作圖,形成交叉表數(shù)據(jù)源表中的首行必須有列標(biāo)題,17,數(shù)據(jù)透視表,18,在Excel中建立數(shù)據(jù)透視表,19,形成的數(shù)據(jù)透視表,20,第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理,一、分類型數(shù)據(jù)的整理二、順序型數(shù)據(jù)的整理三、數(shù)值型數(shù)據(jù)的整理,21,一、分類數(shù)據(jù)整理—頻數(shù)分布表,,,,,,,【例1】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買飲料的品牌和顧客性別進(jìn)行了記錄。下頁(yè)表格就是記錄的原始數(shù)據(jù),用Excel制作頻數(shù)分布表,22,23,列出各類別計(jì)算各類別的頻數(shù)制作頻數(shù)分布表,分類數(shù)據(jù)的整理,,,1.基本過(guò)程,1.頻數(shù):落在各類別中的數(shù)據(jù)個(gè)數(shù)2.比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3.百分比:將對(duì)比的基數(shù)作為100而計(jì)算的比值4.比率:不同類別數(shù)值的比值,,,,24,,,,,,,,,,,2.頻數(shù)分布表(通過(guò)數(shù)據(jù)透視表在Excel中得到),分類數(shù)據(jù)的整理與顯示,25,利用SPSS的頻數(shù)分析得到,26,通過(guò)SPSS的交叉列聯(lián)表獲得,27,二、順序型數(shù)據(jù)的整理,1累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級(jí)累加2累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級(jí)累加,方向:向上累積:自類別順序的開始一方向最后一方累加向下累積:自類別順序的最后一方向開始一方累加,28,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),【例2】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。,24132225270300,8.044.075.090.0100.0,29,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),,,30027918010238,100.093.060.034.012.7,30,【例】某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個(gè))。試對(duì)數(shù)據(jù)進(jìn)行分組。,,三、數(shù)值型數(shù)據(jù)的整理,31,分組方法,分組方法,32,單變量值分組(要點(diǎn)),——將一個(gè)變量值作為一組1.適合于離散變量2.適合于變量值較少的情況,單變量值分組,33,單變量值分組表,34,組距分組(要點(diǎn)),——將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的離散型變量情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組,組距分組,35,等距分組(步驟),1.確定組數(shù)1)一般組數(shù)K:5≤K≤152)參考Sturges(斯特杰斯)公式來(lái)確定組數(shù)K,1.確定組數(shù)2.確定組距3.繪制頻數(shù)分布表,36,1.組限:各組的上限、下限值2.下限:一個(gè)組的最小值3.上限:一個(gè)組的最大值4.閉口組:上限和下限都齊全的組5.開口組:上限或下限有一個(gè)沒(méi)有的組,等距分組(概念),37,等距分組(步驟),2.確定組距組距=上限—下限(分組已確定)組距=(最大值-最小值)組數(shù)(原始數(shù)據(jù)),3.統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表,38,某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個(gè))。試對(duì)數(shù)據(jù)進(jìn)行分組。,數(shù)值型數(shù)據(jù)的分組,39,頻數(shù)分布表,上限不在組內(nèi),(1)上下組限重疊,40,(2)上下組限間斷,頻數(shù)分布表,41,常用的確定方法:1、按連續(xù)變量分組,由于相鄰兩組的上限和下限是同一數(shù)值,界限會(huì)重疊,為避免計(jì)算各組次數(shù)出現(xiàn)混亂,其原則是“上限不在內(nèi)”2、按離散變量分組,則相鄰的上、下限通常以兩個(gè)確定的不同整數(shù)值來(lái)表示,故相鄰兩組的上、下限可以不重合。,組限的確定,42,(3)開口組,頻數(shù)分布表,43,組中值:下限與上限之間的中點(diǎn)值。,組中值(classmidpoint),開口組,44,在Excel中通過(guò)FREQUENCY函數(shù)得到頻數(shù)分布表,45,在SPSS中得到的頻數(shù)分布表,46,第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的顯示,一、統(tǒng)計(jì)圖二、統(tǒng)計(jì)表,47,一、統(tǒng)計(jì)圖,分類型數(shù)據(jù)的統(tǒng)計(jì)圖順序型數(shù)據(jù)的統(tǒng)計(jì)圖數(shù)值型數(shù)據(jù)的統(tǒng)計(jì)圖,48,分類型數(shù)據(jù)的統(tǒng)計(jì)圖,條形圖餅圖,49,分類數(shù)據(jù)的圖示—條形圖,用寬度相同的條形高度或長(zhǎng)短來(lái)表示各類別數(shù)據(jù)的圖形;有單式條形圖、復(fù)式條形圖等形式;主要用于反映分類數(shù)據(jù)的頻數(shù)分布;繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。,50,在Excel中得到的條形圖,51,在SPSS中得到的條形圖(例題分析),52,在SPSS中得到的復(fù)式條形圖,53,分類數(shù)據(jù)的圖示—餅圖,也稱圓形圖,用扇形面積來(lái)表示數(shù)值大小的圖形;表示總體或樣本中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用;各部分所占的百分比用各個(gè)扇形面積表示,54,,,在Excel中得到的餅圖,55,在SPSS中得到的餅圖,56,順序型數(shù)據(jù)的統(tǒng)計(jì)圖,累積頻數(shù)分布圖環(huán)形圖,57,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),【例2】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。,24132225270300,8.044.075.090.0100.0,58,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),,,30027918010238,100.093.060.034.012.7,59,,,順序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖,圖甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布圖,(1)累積頻數(shù)分布圖,60,環(huán)形圖(在Excel中獲得),甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià),61,餅圖﹠環(huán)形圖,相同:都可用來(lái)研究結(jié)構(gòu)性問(wèn)題,即均表現(xiàn)部分與整體的關(guān)系,62,數(shù)值型數(shù)據(jù)的統(tǒng)計(jì)圖,直方圖莖葉圖箱線圖線圖散點(diǎn)圖,63,分組數(shù)據(jù)—直方圖,用矩形的面積來(lái)表示各組的頻數(shù)分布;橫軸→數(shù)據(jù)分組縱軸→頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖;3.直方圖的總面積等于1。,64,分組數(shù)據(jù)的圖示,,直方圖的面積之和等于1,某電腦公司銷售量分布的直方圖,,65,直方圖﹠條形圖,66,由“莖”和“葉”兩部分組成,反應(yīng)原始數(shù)據(jù)分布的圖形。對(duì)于一個(gè)數(shù)字,以其最后一位數(shù)字做樹葉,其余高位數(shù)字做樹莖。例:152莖→15葉→2,未分組數(shù)據(jù)—莖葉圖,67,未分組數(shù)據(jù)—莖葉圖(例題分析),68,未分組數(shù)據(jù)—莖葉圖(擴(kuò)展的莖葉圖),69,對(duì)于n(20≤n≤300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò)L=[10lg(n)],未分組數(shù)據(jù)—莖葉圖,70,未分組數(shù)據(jù)—莖葉圖,莖葉圖類似于橫置的直方圖,但又有區(qū)別:,71,未分組數(shù)據(jù)—箱線圖,由一個(gè)箱子和兩條線段組成。5個(gè)特征值:最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接,72,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成),73,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖,74,,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,【例】從某大學(xué)學(xué)生中隨機(jī)抽取11人,對(duì)8門課程的考試成績(jī)進(jìn)行調(diào)查,結(jié)果如表。試?yán)L制各科考試成績(jī)的比較箱線圖,并分析其分布特征,75,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(SPSS得到),8門課程成績(jī)箱線圖,76,11名學(xué)生8門課程考試成績(jī)的箱線圖,,,,,Min-Max,,25%-75%,,Medianvalue,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,45,55,65,75,85,95,105,,,,,,,,,,,,,,,學(xué)生1,學(xué)生2,學(xué)生3,學(xué)生4,學(xué)生5,學(xué)生6,學(xué)生7,學(xué)生8,學(xué)生9,學(xué)生10,學(xué)生11,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,77,時(shí)間序列數(shù)據(jù)—線圖(lineplot),繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸;圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷。,78,時(shí)間序列數(shù)據(jù)—線圖(例題分析),【例】已知1991~2000年我國(guó)城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如右表。試?yán)L制線圖。,79,時(shí)間序列數(shù)據(jù)—線圖(Excel得到),80,SPSS中得到的線圖,81,散點(diǎn)圖,用二維坐標(biāo)展示兩個(gè)變量之間關(guān)系使用的數(shù)據(jù)是成對(duì)的數(shù)據(jù),如(xi,yi)以變量x為橫軸,變量y為縱軸,在坐標(biāo)系中描出各數(shù)據(jù)點(diǎn),82,【例】小麥的單位面積產(chǎn)量與降雨量和溫度等有一定關(guān)系。收集到如下數(shù)據(jù)。試據(jù)此繪制散點(diǎn)圖。,多變量數(shù)據(jù)—散點(diǎn)圖,83,多變量數(shù)據(jù)—散點(diǎn)圖(Excel獲得),84,SPSS中獲得散點(diǎn)圖,85,二、統(tǒng)計(jì)表,統(tǒng)計(jì)表的概念和結(jié)構(gòu)統(tǒng)計(jì)表的種類編制統(tǒng)計(jì)表應(yīng)注意的問(wèn)題,86,統(tǒng)計(jì)表的結(jié)構(gòu),橫行標(biāo)題,縱覽標(biāo)題,數(shù)字資料,,,,,總標(biāo)題,附加,,,主詞,,,賓詞,,87,簡(jiǎn)單表:表的主詞未經(jīng)任何分組的統(tǒng)計(jì)表。其主詞一般按時(shí)間順序,或按總體各單位名稱排列,通常是對(duì)調(diào)查來(lái)的原始資料初步整理所采取的形式。2.分組表:表的主詞按某一標(biāo)志進(jìn)行分組的統(tǒng)計(jì)表。用于揭示不同類型現(xiàn)象的特征,說(shuō)明現(xiàn)象內(nèi)部的結(jié)構(gòu),分析現(xiàn)象之間的相互關(guān)系等。3.復(fù)合表:表的主詞按照兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行復(fù)合分組的統(tǒng)計(jì)表。能更深刻詳細(xì)地反映客觀,但并非分組越細(xì)越好。,統(tǒng)計(jì)表的種類,88,1998年某公司所屬兩企業(yè)合格品數(shù)量表,統(tǒng)計(jì)表類型-簡(jiǎn)單表,89,1998年某地區(qū)工業(yè)凈產(chǎn)值和職工人數(shù),統(tǒng)計(jì)表類型-分組表,90,統(tǒng)計(jì)表類型-復(fù)合表,91,標(biāo)題應(yīng)簡(jiǎn)明地概括所要反映的內(nèi)容。表中主詞各行和賓詞各欄,一般應(yīng)按先局部后整體的原則排列。統(tǒng)計(jì)表的欄數(shù)如果過(guò)多,要加以編號(hào),主詞和計(jì)量單位各欄用(甲)、(乙)、(丙)等文字編寫;賓詞指標(biāo)各欄則用(1)、(2)、(3)等數(shù)字編號(hào)。,編制統(tǒng)計(jì)表應(yīng)注意的問(wèn)題,92,編制統(tǒng)計(jì)表應(yīng)注意的問(wèn)題,4.表中數(shù)字要填寫整齊,位數(shù)對(duì)準(zhǔn)。當(dāng)不存在某項(xiàng)數(shù)字時(shí),用符號(hào)“—”表示;當(dāng)缺乏某項(xiàng)數(shù)字時(shí),用符號(hào)“…”表示。5.數(shù)字資料要注明計(jì)量單位。6.某些特殊資料需要說(shuō)明的,應(yīng)在表的下方加以注解;數(shù)字資料要在表下說(shuō)明來(lái)源,以備查考。7.統(tǒng)計(jì)表編制完畢審核后,制表人和主管部門負(fù)責(zé)人要簽字,并加蓋公章以示負(fù)責(zé)。,93,第三章小結(jié),1、預(yù)處理:審核、篩選、排序、數(shù)據(jù)透視表2、整理:分類數(shù)據(jù)——頻數(shù)分布表順序數(shù)據(jù)——累積頻數(shù)分布表(向上/向下)數(shù)值型數(shù)據(jù)——組距分組(3步),94,3、顯示:分類數(shù)據(jù)——條形圖、餅圖順序數(shù)據(jù)——累積頻數(shù)分布圖、環(huán)形圖數(shù)值型數(shù)據(jù)——直方圖、莖葉圖、箱線圖、線圖、散點(diǎn)圖4、對(duì)比:餅圖→環(huán)形圖;條形圖→直方圖;直方圖→莖葉圖,第三章小結(jié),- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 統(tǒng)計(jì)數(shù)據(jù) 整理 顯示
鏈接地址:http://italysoccerbets.com/p-3526044.html