2011年安全工程師《安全生產(chǎn)管理知識》資料:統計描述
四、統計描述與統計推斷
統計的主要工作就是對統計數據進(jìn)行統計描述和統計推斷。統計描述是統計分析的最基本內容,是指應用統計指標、統計表、統計圖等方法,對資料的數量特征及其分布規律進(jìn)行測定和描述;而統計推斷是指通過(guò)抽樣等方式進(jìn)行樣本估計總體特征的過(guò)程,包括參數估計和假設檢驗兩項內容。
?。ㄒ唬┙y計描述
1.計量資料的統計描述
計量資料的統計描述主要通過(guò)編制頻數分布表、計算集中趨勢指標和離散趁勢指標以及統計圖表來(lái)進(jìn)行。
?。?)集中趨勢。指頻數表中頻數分布表現為頻數向某一位置集中的趨勢。
集中趨勢的描述指標:
1)算術(shù)平均數。
直接法:
x為觀(guān)察值,,z為個(gè)數 加權法又稱(chēng)頻數表法,適用于頻數表資料,當觀(guān)察例數較多時(shí)用。
f為各組段的頻數。
2)幾何平均數(8e.mebic mean)。幾何平均數用符號G表示。用于反映一組經(jīng)對數轉換后呈對稱(chēng)分布的變量值在數量上的平均水平。
直接法:
加權法又稱(chēng)頻數表法,當觀(guān)察例數n較大時(shí),可先編制頻數分布表,用此法計算幾何平均數:
3)百分位數(percendle)與中位數(median)。百分位數是一種位置指標,用符號Px表示常用的百分位數有p2.5、p5、p25、p50、p95、p95、p99.5等,其中p25、p50、p75又稱(chēng)為四分位數。百分位數常用于描述一組觀(guān)察值在某百分位置上的水平,多個(gè)百分位結合使用,可更全面地描述資料的分布特征。
中位數是一個(gè)特定的百分位數即尸s.,用符號M表示。把一組觀(guān)察值按從小到大(或從大到?。┑拇涡蚺帕?,位置居于最中央的那個(gè)數據就是中位數。中位數也是反映頻數分布集中位置的統計指標,但它只由所處中間位置的部分變量值計算所得,不能反映所有數值的變化,故中位數缺乏敏感性。中位數理論上可用于任何分布類(lèi)型的資料,但實(shí)踐中常用于偏態(tài)分布資料和分布兩端無(wú)確定值的資料。其計算方法有直接法和頻數表法兩種。
直接法:當觀(guān)察例數n不大時(shí),此法常用。先將觀(guān)察值按大小順序排列,選用下列公式求M.
頻數表法:當觀(guān)察例數n較多時(shí),可先編制頻數表,再通過(guò)頻數表計算中位數。
公式為:
式中i是該組段的組距,L為其下限,∑fI為小于L各組的累計頻數,fX為中位數所在組段的頻數。
?。?)離散趨勢。指頻數雖然向某一位置集中,但頻數分布表現為各組段都有頻數分布,而不是所有頻數分布在集中位置的趨勢。
常用表示集中趨勢的指標有:
1)全距(range)計算公式為:
及=xMAX-Xmin.
全距越大,說(shuō)明變量的變異程度越大。其度量單位與原變量單位相同。
2)四分位數間距(quartile)是一組數值變量值中上四分數(即P75,記為Qu)與下四分
數(即P25,記為QL)之差,用符號QR表示。計算公式為:
QR=P75一P25
它一般和中位數一起描述偏態(tài)分布資料的分布特征。
2.計數資料的統計描述
計數資料與計量資料的統計描述有所不同,通常采用比、構成比、率3類(lèi)指標來(lái)描述,這些指標都是由兩個(gè)指標之比構成的,所以稱(chēng)為相對數。
?。?)比(又稱(chēng)為相對比)。是兩個(gè)相關(guān)指標之比,說(shuō)明甲為乙的若干倍或百分之幾。
?。?)構成比。也叫構成指標,是指一事物內部某一組成部分的觀(guān)察單位數與該事物
各組成部分的觀(guān)察單位總數之比,用以說(shuō)明某一事物內部各組成部分所占的比重或分布。
注意:各組成部分的構成比之和為100%,某一部分比重增大,則其他部分相應減少。
?。?)率。是指某種現象在一定條件下,實(shí)際發(fā)生的觀(guān)察單位數與可能發(fā)生該現象的總觀(guān)察單位數之比,用以說(shuō)明某種現象發(fā)生的頻率大小或強度
例如:發(fā)病率、患病率、死亡率、病死率等。
注意:不受其他指標的影響;各率相互獨立,其之和不為1(如是則屬巧合)。
應用相對數的注意事項:
1)分析時(shí)不能以(構成)比代(替)率。
2)計算相對數時(shí)分母不能太小。
3)總率(平均率)的計算:不能直接相加求和。
4)資料的可比性:兩個(gè)率要在相同的條件下進(jìn)行。如研究方法相同、研究對象同質(zhì)觀(guān)察時(shí)間相等、地區、民族、年齡、性別等。

