《統(tǒng)計學(xué)原理-統(tǒng)計整理.ppt》由會員分享,可在線閱讀,更多相關(guān)《統(tǒng)計學(xué)原理-統(tǒng)計整理.ppt(80頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第三章 統(tǒng)計整理,統(tǒng)計整理的概念和內(nèi)容 統(tǒng)計分組 變量數(shù)列 變量數(shù)列的表示方法 統(tǒng)計匯總的組織與技術(shù) 統(tǒng)計表,第三章 統(tǒng)計整理,重點: 統(tǒng)計分組的方法 變量數(shù)列與統(tǒng)計表的概念和編制 運用計算機進行數(shù)據(jù)資料的處理和圖表的制作 難點: 頻數(shù)分布的編制; 組限的表現(xiàn)形式; 組距和組中值的計算,引例,按百分制記分,某班30位學(xué)生統(tǒng)計學(xué)考試成績(分)資料如下: 92 85 78 51 63 88 60 71 87 70 56 97 80 68 77 75 64 72 89 87 98 81 95 83 79 83 76 89 72 86,某班學(xué)生統(tǒng)計學(xué)考試成績表,第一節(jié) 統(tǒng)計整理的概念與內(nèi)容,一、統(tǒng)計整
2、理的概念 統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的和任務(wù),對統(tǒng)計調(diào)查所搜集到的大量原始資料進行科學(xué)的分類和匯總,為統(tǒng)計分析提供系統(tǒng)化和條理化的綜合統(tǒng)計資料的過程。,統(tǒng)計整理的意義,統(tǒng)計調(diào)查所搜集的反映個體量的原始資料是分散的,不是集中的;是零碎的,不是系統(tǒng)的。根據(jù)這些資料。人們難以從總體上分析和認識現(xiàn)象的數(shù)量表現(xiàn)。 至于某些已經(jīng)加工的綜合資料,則往往由于資料在分組方法、總體范圍或指標(biāo)涵義、口徑、計算方法等方面不同,而不能滿足統(tǒng)計分析的要求,也必須先通過統(tǒng)計整理,才能據(jù)以從總體上分析社會經(jīng)濟現(xiàn)象的數(shù)量表現(xiàn),,二、數(shù)據(jù)整理的內(nèi)容,統(tǒng)計資料整理的內(nèi)容,進行統(tǒng)計分組統(tǒng)計整理的基礎(chǔ) 進行資料的匯總統(tǒng)計整理的中心內(nèi)
3、容 編制統(tǒng)計表或統(tǒng)計圖統(tǒng)計整理的有效表達形式,第二節(jié) 統(tǒng)計分組,一、統(tǒng)計分組的意義和作用 統(tǒng)計分組就是根據(jù)統(tǒng)計研究目的和任務(wù),按照選定的變異標(biāo)志將總體劃分為若干部分或組別,使組與組之間具有差別性,而同一組內(nèi)單位保持相對的同質(zhì)性一種統(tǒng)計方法。 統(tǒng)計分組的意義在于:總體經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內(nèi)各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。,一、統(tǒng)計分組的意義和作用,統(tǒng)計分組的作用 區(qū)分社會經(jīng)濟現(xiàn)象的類型-類型分組 研究現(xiàn)象的內(nèi)部結(jié)構(gòu)-結(jié)構(gòu)分組 分析現(xiàn)象之間的依存關(guān)系-分析分組,某地區(qū)2008年底各類工業(yè)企業(yè)數(shù),,企業(yè)規(guī)模與流通費用率依存關(guān)系,13,社會經(jīng)濟現(xiàn)象之間不
4、同程度的存在著相互依存關(guān)系,通過統(tǒng)計分組,可以從數(shù)量上研究現(xiàn)象之間依存關(guān)系的規(guī)律性。 居民家庭隨著月收入的增加而月支出也在增加的相關(guān)關(guān)系,統(tǒng)計分組的要求 三個要素: 母項、子項、分組標(biāo)志 三個基本要求: 周延性、互斥性、分組標(biāo)志的同一性,二、統(tǒng)計分組的要求和方法,統(tǒng)計分組,例1:從業(yè)人員按文化程度分組 小學(xué)畢業(yè) 中學(xué)畢業(yè)(含中專) 大學(xué)畢業(yè),文盲或識字不多 小學(xué)畢業(yè) 中學(xué)畢業(yè)(含中專) 大專畢業(yè) 大學(xué)及大學(xué)以上 (),(),例2:某商場把服裝分為男裝、女裝、童裝。 () 成年裝(男女裝) 兒童裝(男女裝),統(tǒng)計分組,,(),統(tǒng)計分組
5、的方法 1、分組標(biāo)志的選擇 根據(jù)統(tǒng)計研究的具體任務(wù)和目的,選擇分組標(biāo)志。 在若干個標(biāo)志中,選擇能反映問題本質(zhì)的重要標(biāo)志進行分組。 結(jié)合研究現(xiàn)象所處的具體歷史條件或社會經(jīng)濟發(fā)展的條件選擇分組標(biāo)志。,二、統(tǒng)計分組的要求和方法,統(tǒng)計分組的方法 2、按品質(zhì)標(biāo)志和數(shù)量標(biāo)志分組,二、統(tǒng)計分組的要求和方法,經(jīng)調(diào)查,某地年末貨幣流通量為15.3億元,比上年增加4.5億元。,統(tǒng)計分組的方法 2、按品質(zhì)標(biāo)志和數(shù)量標(biāo)志分組,二、統(tǒng)計分組的要求和方法,經(jīng)調(diào)查,某地年末貨幣流通量為15.3億元,比上年增加4.5億元。,某廠第二季度工人平均日產(chǎn)量,21,3、簡單分組、復(fù)合分組和分組體系,根據(jù)分組選擇標(biāo)志的多少不同,統(tǒng)計分
6、組又可分為: 簡單分組 簡單分組是指對統(tǒng)計總體僅按一個標(biāo)志進行分組 復(fù)合分組 復(fù)合分組是指對同一總體采用兩個或兩個以上的標(biāo)志重疊起來進行分組 分組體系 對于復(fù)雜的研究對象,必須從各個方面進行觀察和分析研究,以獲得對事物全貌的認識,因此要采用一系列相互聯(lián)系、相互補充的標(biāo)志對現(xiàn)象進行多種分組,這些分組結(jié)合起來構(gòu)成一個體系,稱為分組體系。,22,簡單分組,復(fù)合分組,,按性別分類,按職稱分類,按年齡分類,,,男,女,,,,,高級,中級,初級,,,,,,青年,中年,共計12組232,對教師的分類,分組體系,對教師的分類,按性別分類,男性,女性,按職稱分類,按年齡分類,高級,中級,初級,青年,中年,,共計
7、7組 2+3+2,第三節(jié) 變量數(shù)列,一、變量數(shù)列的概念 在統(tǒng)計分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,形成總體中各個單位數(shù)在各組間的分布,這種表明總體單位數(shù)在各組分配情況的分組資料,成為次數(shù)分布,又稱分配數(shù)列 分布在各組的個體單位數(shù)叫次數(shù)或頻數(shù),各組次數(shù)占總次數(shù)的比重叫頻率,第三節(jié) 變量數(shù)列,一、變量數(shù)列的概念,分 類,按品質(zhì)標(biāo)志分組品質(zhì)數(shù)列,一般是單項式分組 某班學(xué)生的性別構(gòu)成情況,某廠第二季度工人平均日產(chǎn)量,某工廠工人完成生產(chǎn)定額情況表,某市人口結(jié)構(gòu)組成,某企業(yè)職工按工資分組表,組距數(shù)列中的幾個概念,1、組數(shù) 2、組限 3、組距 組距=本組上限本組下限 組距=本組上限本組下限+1
8、思考:開口組的組距? 4、組中值,二、變量數(shù)列的編制,1、陣列,求全距 2、確定變量數(shù)列的形式 3、確定組距和組數(shù) 4、確定組限 5、計算各組單位數(shù),二、變量數(shù)列的編制,0 1 2 3 4 1 1 1 3 3 3 3 4 5 1 5 0 5 3 3 4 4 3 4 4 3 3 2 2 3 3 2 2 3 3 2 2 2 2 2,50 60 71 76 80 91 52 64 72 77 81 99 54 62 73 77 82 92 63 72 78 83 94 65 73 79 84 96 67 74 76 86 68 75 75 87 64 75 74 85,,某車間50名工人日加工零件數(shù)
9、,117 122 124 129 139 107 117 130 122 125 110 118 123 126 133 134 127 123 118 112 108 131 125 117 122 133 126 122 118 108 112 134 127 123 119 113 120 123 118 112 137 114 120 128 124 115 139 128 124 121,50名工人分組步驟,確定組數(shù)k=1+3.322lg507 計算組距=(139-107)/7=4.65 確定組限,編制頻數(shù)分布表,工人日加工零件頻數(shù)分布表,第四節(jié) 變量數(shù)列的表示方法,一、列表法 即用
10、統(tǒng)計表格形式表述變量數(shù)列的內(nèi)容,這種表式也叫做次數(shù)分布表。,累計頻數(shù)(頻率),從變量值低的組開始,將各組次數(shù)(頻率)逐次向變量值高的組累計,說明某一組上限以下各組的累計次數(shù)(頻率)。,從變量值高的組開始,將各組次數(shù)(頻率)逐次向變量值低的組累計,說明某一組下限以上各組的累計次數(shù)(頻率)。,,41,向上累計較小制累計,指各組頻數(shù)或頻率由變量值低的組向變量值高的組累計。 累計數(shù)反映各組上限以下的累計頻數(shù)或頻率。 如右表:學(xué)生考試成績分布,42,向下累計較大制累計,指各組頻數(shù)或頻率由變量值高的組向變量值低的組累計。 累計數(shù)反映各組下限以上的累計頻數(shù)或頻率。 如右表:學(xué)生考試成績分布,,二、圖示法 次
11、數(shù)多邊形圖 次數(shù)直方圖 累計次數(shù)分布圖 次數(shù)分布曲線圖,次數(shù)多邊形圖及次數(shù)直方圖,累計次數(shù)(頻率)分布圖,在直角坐標(biāo)點系上將各組組距的上限與其相應(yīng)的累計頻數(shù)(頻率)構(gòu)成坐標(biāo)點,依次用直線(或光滑曲線)相連 。,在直角坐標(biāo)點系上將各組組距的下限與其相應(yīng)的累計頻數(shù)(頻率)構(gòu)成坐標(biāo)點,依次用直線(或光滑曲線)相連 。,累計次數(shù)(頻率)分布圖,49,次數(shù)分布曲線圖,50,特征:”兩頭小,中間大”,即靠近中間的變量值分布的次數(shù)多,靠近兩邊的變量分布次數(shù)少,形若古鐘。 根據(jù)其偏斜情況分為對稱鐘型分布、左偏鐘型分布和右偏鐘型分布。,(一)鐘型分布,次數(shù)分布曲線圖,51,對稱鐘型分布,也叫正態(tài)分布,以中心變量
12、值為對稱軸呈對稱分布。,人數(shù),年齡,02:23:39,52,左偏鐘型分布,也叫正偏鐘型分布,變量值小的次數(shù)較變量值大的次數(shù)多。,人數(shù),年齡,,,53,右偏鐘型分布,也叫負偏鐘型分布,變量值大的次數(shù)較變量值小的次數(shù)多。,,,人數(shù),年齡,02:23:39,54,特征:靠近中間的變量值分布的次數(shù)少,靠近兩端的變量值分布次數(shù)多,形成“兩頭大,中間小”的字型分布。 如人口死亡率按年齡分組。,(二)型分布,02:23:39,55,正J型分布:其特征是隨著變量值的增大,分布次數(shù)也隨之增多,若根據(jù)變量數(shù)列繪成線圖,形若英文字母“J”。 如老年人口按年齡分組的死亡人數(shù)分布曲線多呈正J型。,(三)J型分布,02
13、:23:39,56,反J型分布:其特征是隨著變量值的增大,分布次數(shù)也隨之減少,若根據(jù)變量數(shù)列繪成線圖,形若反寫的英文字母“J”, 如按年齡分組的人口總體的次數(shù)分布曲線多呈反J型。,反J型分布,02:23:39,57,洛倫茲曲線又稱集中曲線,用以檢驗社會收入分配的平等程度??赏卣褂糜谘芯靠傮w各單位標(biāo)志分布集中狀況或平均性的其他社會經(jīng)濟現(xiàn)象。,(四)洛倫茲分布,02:23:39,58,洛倫茲曲線以累計頻率為橫軸,以標(biāo)志值累計比重為縱軸。,(四)洛倫茲分布,,,,第五節(jié) 統(tǒng)計匯總的組織與技術(shù),一匯總前的審核 審核方面:及時、完整、準(zhǔn)確 審核方法:計算檢查、邏輯檢查,,第五節(jié) 統(tǒng)計匯總的組織與技術(shù),二
14、統(tǒng)計匯總的組織形式 逐級匯總 集中匯總,,第五節(jié) 統(tǒng)計匯總的組織與技術(shù),三統(tǒng)計匯總的技術(shù)方法 手工匯總 劃記法 過錄法 折疊法 卡片法 電子計算機匯總,,第六節(jié) 統(tǒng)計表,一統(tǒng)計表的概念和構(gòu)成 從廣義上說,統(tǒng)計表是以縱橫線條交叉結(jié)合成的表格,用來表現(xiàn)統(tǒng)計資料的一種形式,包括統(tǒng)計工作各個環(huán)節(jié)所用的別哦啊個。本節(jié)側(cè)重討論由統(tǒng)計資料匯總整理而成的統(tǒng)計表的內(nèi)容。,第六節(jié) 統(tǒng)計表,一統(tǒng)計表的概念和構(gòu)成,,,總 標(biāo) 題,,,主詞欄,賓詞欄,某地區(qū)2007和2008生產(chǎn)總值表,按賓詞指標(biāo)平行排列的統(tǒng)計表,,按賓詞指標(biāo)層疊排列的統(tǒng)計表,,,,二、統(tǒng)計表的種類 簡單表 分組表 復(fù)合表,簡單表 2005-200
15、8某省國內(nèi)生產(chǎn)總值 億元,02:23:40,68,簡單表,1999年國際旅游收入居世界前十名的國家,02:23:40,69,簡單分組表,1998年某公司所屬兩企業(yè)自行車合格品數(shù)量表,復(fù)合分組表 2009年末某地區(qū)人口數(shù),三、統(tǒng)計表的設(shè)計原則,練習(xí):某醫(yī)院急診病人就診等待時間如下,14 19 24 19 16 20 24 20 21 22 24 18 17 23 26 22 23 25 25 19 18 16 15 24 21 26 19 21 23 20 22 22 16 16 16 12 25 19 24 20 要求分5組。 1)構(gòu)筑頻數(shù)分布; 2)需急診服務(wù)的病人的等
16、待時間在20分鐘以上的所占的比例; 3)繪制直方圖; 4)上述數(shù)據(jù)顯示了需急診服務(wù)病人等待時間的何種狀況。,練習(xí):電子協(xié)會雇員選擇開始工作的時間,7:00 8:30 9:00 8:00 7:30 7:30 8:30 8:30 7:30 7:00 8:30 8:30 8:00 8:00 7:30 8:30 7:00 9:00 8:30 8:00 匯總數(shù)據(jù),構(gòu)建: a、頻數(shù)分布 b、百分?jǐn)?shù)頻數(shù)分布 c、餅形圖 d、匯總結(jié)果表明彈性時間系統(tǒng)中雇員有什么偏好?,練習(xí):某班學(xué)生統(tǒng)計學(xué)考試成績的分配數(shù)列如下表,1某企業(yè)對某所屬車間的生產(chǎn)計劃完成百分比采用如下分
17、組,請指出哪項是正確的( )。 A80__89 B80%以下 C80%以下 D85%以下 9099% 80.1__90% 80__100% 85__95% 100__109% 90.1__100% 100__110% 95__105% 110%以上 100.1__110% 110%以上 105__115%,單選題,2在進行組距式分組時,凡遇到某單位的標(biāo)志值剛好等于相鄰兩組上下限的數(shù)值時,一般是( ), A) 將此值歸入上限所在組 B) 將此值歸入下限所在組 C) 將此值歸入上限或下限所在的組均可 D) 另行分組,,3品質(zhì)分組和變量分組的區(qū)別在于( )。 A)分組的任
18、務(wù)和作用不同 B)選擇分組標(biāo)志的多少不同 C)選擇分組標(biāo)志的性質(zhì)不同 D)組數(shù)的多少不同,,4下列分組哪些是按品質(zhì)標(biāo)志分組( )。 A)職工按文化程度分 B)固定資產(chǎn)按用途分組 C)工人按工資分組 D)學(xué)生按性別分組 E)企業(yè)按生產(chǎn)計劃完成程度分組,多選題,5下列哪些分組是按數(shù)量標(biāo)志分組( )。 A) 工人按出勤率分組 B) 學(xué)生按健康狀況分組 C) 企業(yè)按固定資產(chǎn)原值分組 D) 家庭按收入水平分組 E) 人口按年齡分組,,6在次數(shù)分配數(shù)列中,( )。 A) 各組的頻數(shù)之和等于100 B) 各組的頻率大于0 C) 頻數(shù)越小,則該組的標(biāo)志值所起的作用越小 D) 總次數(shù)一定,頻數(shù)和頻率成反比 E) 頻率表明各組標(biāo)志值對總體的相對作用程度,,