高級統(tǒng)計師考試《高級統(tǒng)計實務與案例分析》備考:數(shù)值數(shù)據(jù)的整理與顯示
(資料圖片僅供參考)
數(shù)據(jù)匯總整理與統(tǒng)計分析模塊(五)數(shù)據(jù)匯總整理與統(tǒng)計分析
第一章 統(tǒng)計數(shù)據(jù)的整理與顯示
1.4 數(shù)值數(shù)據(jù)的整理與顯示數(shù)值型數(shù)據(jù)包括定距數(shù)據(jù)和定比數(shù)據(jù),在整理時通常要進行數(shù)據(jù)分組,按照某一標志分組。數(shù)據(jù)分組后,計算出各組總體單位的個數(shù)或數(shù)據(jù)出現(xiàn)的次數(shù),稱為頻數(shù)(Frequency,亦稱為次數(shù))。把各個組及其相應的頻數(shù)依一定的次序全部列出來,就形成了頻數(shù)分布(Frequency distribution,亦稱為次數(shù)分布)。統(tǒng)計總體按照某一標志分組以后,用以反映總體各單位分配情況的統(tǒng)計數(shù)列,稱分配數(shù)列,又可稱次數(shù)分配,或次數(shù)分布。1.4.1、 分配數(shù)列一、概念在統(tǒng)計分組的基礎上,將總體的所有單位按組歸類整理,并按一定的順序排列,形成總體單位在各組之間的分布,稱之為頻數(shù)分布、次數(shù)分布或分配數(shù)列。
二、分配數(shù)列的要素組別次數(shù)(頻數(shù)):分布在各組的總體單位數(shù)。各組的次數(shù)(頻數(shù))之和等于總體單位總數(shù)。頻率(比重):各組次數(shù)占總次數(shù)的比重。各組比重之和等于100%(或1)。分配數(shù)列實例我國土地狀況分組表
按海拔分組(米) | 面積(萬平方公里) | 占總面積比重(%) |
500以下 | 241.7 | 25.18 |
500~1000 | 162.5 | 16.93 |
1000~2000 | 239.9 | 24.99 |
2000~3000 | 67.6 | 7.04 |
3000以上 | 248.3 | 25.86 |
合計 | 960.0 | 100.00 |
組別(變量) | 次數(shù)(頻數(shù)) | 頻率(比率) |
三、分配數(shù)列的種類
1、按分組標志的性質不同品質變量數(shù)列:按品質變量分組形成數(shù)值變量數(shù)列:按數(shù)值編制分組形成2、數(shù)值變量數(shù)列又可分為:單項數(shù)列:每組只有一個變量值的變量數(shù)列組距數(shù)列:每組變量值是一段區(qū)間的變量數(shù)列組距數(shù)列 等距數(shù)列 異距數(shù)列單項式數(shù)列變量實例某市居民家庭按家庭人口數(shù)分組
家庭人口數(shù)(人) | 家庭數(shù)(千戶) | 比重(%) |
1 | 9.8 | 5.76 |
2 | 27.5 | 16.18 |
3 | 94.6 | 55.65 |
4 | 19.2 | 11.29 |
5 | 10.9 | 6.41 |
6 | 8.0 | 4.71 |
合計 | 170.0 | 100.00 |
數(shù)值變量分配數(shù)列實例某市餐飲業(yè)按營業(yè)額分組
家庭人口數(shù)(人) | 家庭數(shù)(千戶) | 比重(%) |
1 | 9.8 | 5.76 |
2 | 27.5 | 16.18 |
3 | 94.6 | 55.65 |
4 | 19.2 | 11.29 |
5 | 10.9 | 6.41 |
6 | 8.0 | 4.71 |
合計 | 170.0 | 100.00 |
四、分配數(shù)列的編制
1、概念術語(1)全距(R)=數(shù)列中最大變量值-最小變量值(2)組限:每一組的最大變量值與最小變量值上限:每一組的最大變量值下限:每一組的最小變量值(3)組距(d):每一組的最大變量值與最小變量值之差組距=上限-下限(4)組數(shù):數(shù)列中的分組個數(shù)(5)頻數(shù)(次數(shù))與頻率(比重)(6)品質數(shù)列與變量數(shù)列(7)等距數(shù)列與異距數(shù)列(8)次數(shù)密度:單位組距內分布的總體單位數(shù)。公式:次數(shù)密度=各組次數(shù)/各組組距(9) 開口組:缺上限或缺下限的組 閉口組:上下限齊全的組(10)組中值及計算★★①閉口組臨近組組限重合時:組中值=(上限+下限)/2臨近組組限間斷時:組中值=(下限+下組下限)/2②開口組缺上限時:組中值=下限+鄰組組距/2缺下限時:組中值=上限-鄰組組距/22、注意事項(1)組距最好為5或10的倍數(shù)。(2)最小組的下限略低于最小變量值,最大組的上限略高于最大變量值。(3)離散型變量分組,相鄰組的組限可以間斷,也可以重疊;連續(xù)型變量分組,相鄰組的組限必須重疊。(4)組限重疊時,臨界點的總體單位按“上限不在內”的原則歸組。3、次數(shù)分布數(shù)列的編制步驟組數(shù)和組距的關系☆ 定性關系:全距一定的情況下,組數(shù)和組距呈反方向變動。☆ 定量關系:組數(shù)=全距/組距=R/d組距=R/(1+3.322lgN)式二為確定組距的經(jīng)驗公式,其中N代表組數(shù)。簡單次數(shù)分布數(shù)列的編制實例數(shù)據(jù)資料某車間40名工人日產零件如下:65 72 66 57 90 86 83 68 7584 66 59 67 70 79 51 81 5478 86 94 64 77 74 76 96 6298 85 71 79 84 65 72 89 75? 編制步驟之一——數(shù)據(jù)排序并確定全距將數(shù)據(jù)從低到高排列,形成如下變量序列:51 54 57 59 62 64 65 65 66 6667 68 70 71 72 72 74 75 75 7676 77 78 78 79 81 83 84 84 8485 86 86 88 89 90 93 94 96 98計算全距=98-51=47? 編制步驟之二——確定變量數(shù)列的形式因變量值較多、變動幅度較大,適宜采用組距式數(shù)列。? 編制步驟之三——確定組數(shù)和組距【分析】全距為47,分為5組,組距為10。? 編制步驟之四——確定組限【分析】離散型變量分組,相鄰組的組限可以重疊,也可間斷,本例選擇重疊。? 編制步驟之五——計算各組的頻數(shù)和頻率【分析】根據(jù)排序后的變量序列清點各數(shù)據(jù)區(qū)間的頻數(shù)并計算比重,也可利用Excel統(tǒng)計軟件進行。? 編制步驟之六——繪制表格
日產零件數(shù)量(件) | 工人數(shù)(人) | 比重(%) |
50-60 | 4 | 10.00 |
60-70 | 8 | 20.00 |
70-80 | 13 | 32.50 |
80-90 | 10 | 25.00 |
90-100 | 5 | 12.50 |
合計 | 40 | 100.00 |
4、累計次數(shù)分布表(圖)的編制(1)累計次數(shù)和累計頻率反映總體單位分布特征的指標,用于說明總體中在某一變量值水平上下總共包含的總體單位次數(shù)和頻率。(2)累計次數(shù)和頻率的計算方法向上累計:是將各組的次數(shù)和頻率,由變量值低的組向高的組累計。說明各組上限以下包含的總體單位數(shù)和比率。向下累計:是將各組的次數(shù)和頻率,由變量值高的組向低的組累計。說明各組下限以上包含的總體單位數(shù)和比率。累計次數(shù)分布數(shù)列的編制實例根據(jù)簡單次數(shù)分布數(shù)列的實例,重新編制的累計次數(shù)分布表如下:
日產零件 數(shù)量(件) | 工人數(shù)(人) | 比重 (%) | 向上累計 | 向下累計 | ||
次數(shù) | 頻數(shù) | 次數(shù) | 頻數(shù) | |||
50-60 | 4 | 10.00 | 4 | 10.00 | 40 | 100.00 |
60-70 | 8 | 20.00 | 12 | 30.00 | 36 | 90.00 |
70-80 | 13 | 32.50 | 25 | 62.50 | 28 | 70.00 |
80-90 | 10 | 25.00 | 35 | 87.50 | 15 | 37.50 |
90-100 | 5 | 12.50 | 40 | 100.00 | 5 | 12.50 |
合計 | 40 | 100.00 | —— | —— | —— | —— |
1.4.2、 次數(shù)分布主要類型社會經(jīng)濟現(xiàn)象的分布主要有以下三種類型:(一)鐘形分布/丘形特征:“兩頭小,中間大”,即靠近中間的變量值分布的次數(shù)多,靠近兩端的變量值分布的次數(shù)少,其形狀宛如一口古鐘。種類:正態(tài)分布:左右兩側對稱分布偏態(tài)分布 左偏分布:存在極小變量值時曲線向左偏的非對稱分布 右偏分布:存在極大變量值時曲線向右偏的非對稱分布(二)U形分布特征:靠近中間的變量值分布的次數(shù)少,靠近兩端的變量值分布的次數(shù)多,其形狀宛如英文字母U。(三)J形分布特征:次數(shù)隨著變量值的增大而增多或隨變量值的增大而減少,其形狀宛如英文大寫字母J。具體有正J形分布和反J形分布兩種類型。+ 社會收入分配平等程度的衡量(洛倫茨曲\基尼系數(shù))為了衡量一個國家的貧富差別程度,奧地利統(tǒng)計學家洛倫茨提出了一種被廣泛使用的收入分配曲線——洛倫茨曲線。(最初用途是用與收入與財富分布的分析之中,現(xiàn)已被推廣至產業(yè)內相對集中度的分析和計量。1、洛倫茨曲線的含義洛倫茨曲線是反映社會財富分配平等程度的曲線2、絕對平等線、絕對不平等線、洛倫茨曲線洛倫茨曲線:一個用來顯示收入或財富不平等的程度的幾何圖形。顯然,洛倫茨曲線越向橫軸突出,它與完全平等曲線(通過原點的45度線)之間的面積越大,表明收入分配差距越大,即越不平等。當收入分配達到完全不平等時,洛倫茨曲線就成為折線。3、基尼系數(shù)基尼系數(shù)是意大利經(jīng)濟學家基尼于1912年提出的,定量測定收入分配差異程度,國際上用來綜合考察居民內部收入分配差異狀況的一個重要分析指標。它將研究對象按人均收入由低到高進行排序,分成若干組,計算每組人口比重(Pi)、每組收入比重(Wi)和累計比重(Qi),利用公式計算出來。基尼系數(shù)是根據(jù)洛倫茨曲線計算出的反映社會收入分配均等化的指標。當A=0時,基尼系數(shù)=0,絕對平等當B=0時,基尼系數(shù)=1,絕對不平等1>基尼系數(shù)>0基尼系數(shù)越小,收入分配越平等基尼系數(shù)越大,收入分配越不平等國際上用來分析和反映居民收入分配差距的方法和指標很多。基尼系數(shù)由于給出了反映居民之間貧富差異程度的數(shù)量界線,可以較客觀、直觀地反映和監(jiān)測居民之間的貧富差距,預報、預警和防止居民之間出現(xiàn)貧富兩極分化,因此得到世界各國的廣泛認同和普遍采用。國際通用標準(0.4為警戒線,0.6為危險線)
基尼系數(shù) | 收入分配公平程度 |
小于0.2 | 絕對平等 |
0.2-0.3 | 比較平等 |
0.3-0.4 | 基本合理 |
0.4-0.5 | 差距較大 |
0.5以上 | 差距懸殊 |
聯(lián)合國基尼系數(shù)排名(2007/2008年版)2003年至2008年,中國基尼系數(shù)分別為 0.479、0.473、0.485、0.487、0.484和0.491。 隨后,自2009年開始逐年回落,分別為:2009年0.490,2010年0.481,2011年0.477,2012年0.474,2013年0.473,2014年0.469。
[考試報名]全國高級統(tǒng)計師考試時間|報名時間|報名入口[成績查詢]全國高級統(tǒng)計師考試成績查詢時間|查詢入口[真題答案]全國高級統(tǒng)計師考試歷年真題及答案解析[考試政策]高級統(tǒng)計師報考條件|免考條件|考試科目[培訓課程]最新高級統(tǒng)計師資格考試高清視頻輔導課程試聽