?

如何用頻率分布直方圖估計樣本總體的數字特征

2022-03-25 01:01李嬋平
語數外學習·高中版中旬 2022年1期
關鍵詞:標準差直方圖方差

李嬋平

在得到頻率分布直方圖后,我們常常要利用頻率分布直方圖估計總體的數字特征,即眾數、平均數、中位數、方差和標準差.

1.眾數是數據中出現次數最多的數.在頻率分布直方圖中,頻率最大的組的中點值就稱為眾數.若有多個組是相鄰組,且各組的頻率相等,那么我們可以把這幾組看成一個大組,將大組的中點值作為這組數據的眾數.

2.平均數是所有數據的和除以數據總個數的值,反映了數據的平均水平.但是在頻率分布直方圖中,所有數據的取值并不是具體的,給出的只是某組數據出現的頻率.因此,在求平均數時,我們可以取直方圖中這一組數據的中點值,將其作為這一組數據的代表值,記為 xi? ,并設該組內數據出現的頻數為 ni? ,那么這組數據的和就是nixi ,如果所有數據分布在 m 個組內,那么 i=1,2, …,m, 各組內數據的和依次是 n1x1, n2x2, …,nmxm , 所有數據的和就是n1x1+n2x2+…+nmxm ,,若數據總個數為 n ,則n =n1+n2+…+nm , 所有數據的平均數= n1x1+n2x2+…+nmxm該式可變形為= n x1+ n x2+…+ n xm , 由于第一組的頻率為f1= 第二組的頻率為 f2=? 第 m 組的頻率為fm= , 所以所有數據的平均數 =x1f1+x2f2+…+xmfm.這就是利用頻率分布直方圖計算平均數的公式.

3.中位數是指在按照大小順序排列的一組數中居于中間的一個數據.若中間有兩個數,則取這兩個數的平均數.在頻率分布直方圖中,不大于中位數的數據占所有數據的一半,這些數據出現的頻率是0.5;不小于中位數的數據占總數據的一半,這些數據出現的頻率也是0.5.因此,如果過中位數所在的點作一條垂直于橫軸的直線,那么這條直線把頻率分布直方圖中的矩形分成面積相等的兩部分,直線左側的矩形面積為一半,右側的也為一半.我們可以根據頻率分布直方圖的這個特點,通過累計頻率來求得中位數.其步驟為:第一步,將各組數據的頻率計算出來,列出表格;第二步,從第一組開始累計頻率,如果從第一組開始加到某一組時頻率之和大于0.5,那么中位數就在這一組數據內;第三步,設中位數為 m .求出m 所在組的頻率,并且根據頻率等于對應組的矩形的面積,得到一個關于 m 的一元一次方程,解方程就可以確定 m 的值.

下面舉例說明.

例1.一個社會調查機構就某地居民的月收入調查了1000人,并根據所得數據畫出樣本頻率分布直方圖.試根據圖形,求該地居民月收入的眾數、中位數、平均數.

解析:(1)求眾數.由于第三組和第四組所對應的矩形高度是相同的,且這兩組是相鄰的,需把第三組和第四組看成一個大組,即2000~3000,并且該組的中點值為2500,即該地居民月收入的眾數是2500元.

(2)求中位數.第一步,將各組的頻率計算出來,并列出表格,如表1:

第二步,從第一組起累計頻率,可知前三組頻率之和為0.55>0.5,故可以確定中位數在第三組.

第三步,設中位數為m ,根據中位數的特點可知,數據落在[1000, m )內的頻率為0.5,由于前兩組的頻率之和為0.1+0.2=0.3,所以[2000,m)內的頻率是0.2.在頻率分布直方圖中過橫軸上的點 m 作一條垂直于橫軸的直線,可以得到數據范圍[2000,m )所對應的小矩形,該矩形的面積是0.2,矩形的寬是 m -2000,高是△xi =0.0005, 所以( m -2000)×0.0005=0.2,解得 m =2400,故該地居民月收入的中位數是2400元.

(3)求平均數.第一步,將各組的頻率和中點值列成表格(見表2),

于是平均數 =1250×0.1+1750×0.2+2250×0.25+2750×0.25+3250×0.15+3750×0.05=2400,故該地居民月收入的平均數是2400元.

4.方差反映數據相對于它的平均數的偏離程度,方差公式是 s2=(x1-)2+(x2-)2+…+(xn -)2公式中的分子是 n 個數據 x1,x2, …,xn 分別與它們的平均數的差的平方的和,分母是數據的總個數.在頻率分布直方圖中,每一組數據的頻數就是每一組的中點值,套用方差公式,就可以求得所有數據的方差.設n 個數據分為 m 組, m 組的頻數分別是 n1,n2 , … ,nm? , 則 n1+ n2+…+nm=n , 所有數據的方差 s2=n1(x1-)2+n2(x2-)2+…+nm(xm -)2把分子拆開得,s2= n (x1-)2+ n (x2-)2+…+ n (xm -)2, 由于各組的頻率分別為f1= ,f2= , …,fm = , 所以 s2=f1(x1-)2+f2(x2-)2+…+fm(xm -)2, 這就是利用頻率分布直方圖求方差的公式,這里 x1,x2,…,xm 分別是各組的中點值,而 xˉ 是所有數據的平均數.

5.標準差是方差的算術平方根,標準差公式為

例2.求例1中該地居民月收入的標準差(保留兩位小數).

解析:先求方差.由例1知該地居民月收入的平均數是 2400 元,即 xˉ= 2400, 而各組的代表數據分別是x1 = 1250,x2 = 1750,x3 = 2250,x4 = 2750,x5 = 3250,x6 = 3750,又由表1知各組頻率分別為 f1 = 0.1,f2 = 0.2,f3 = f4 = 0.25,f5 = 0.15,f6 = 0.05, 因此方差 ,

再求標準差. s = s2 = 452500 ≈ 672.68, 故該地居民月收入的標準差是672.68元.

利用頻率分布直方圖求數據的眾數、中位數、平均數及標準差,是現實生活中經常遇到的問題,這也是高考試題中經??疾榈膯栴},解題的關鍵是要記住公式,明確眾數、中位數、平均數、方差及標準差等數字特征的意義,并會正確套用公式進行計算.

(作者單位:陜西省神木市第七中學)

猜你喜歡
標準差直方圖方差
用直方圖控制畫面影調
過程能力指數法在改進中小學教學質量中的應用
方差生活秀
例析頻率分布直方圖
中考頻數分布直方圖題型展示
揭秘平均數和方差的變化規律
方差越小越好?
方差在“三數兩差”問題中的妙用
語音信號幅值分布的統計分析
方差中亟待澄清的兩個錯誤觀點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合