平均差、标准差和方差都是衡量数据离散程度的统计量,下面分别介绍它们的求法:
平均差
平均差是总体所有单位与其算术平均数的离差绝对值的算术平均数。
简单平均式(未分组数据):
设一组数据为 x1,x2,⋯,xn,首先计算这组数据的平均数 x=n1∑i=1nxi。
然后计算各数据与平均数的离差绝对值 ∣xi−x∣(i=1,2,⋯,n)。
最后求平均差 A.D.=n1∑i=1n∣xi−x∣。
加权平均式(分组数据):
若数据分为 k 组,每组的组中值为 x1,x2,⋯,xk,频数为 f1,f2,⋯,fk。先计算加权平均数 x=∑i=1kfi∑i=1kfixi。
接着计算每组数据与加权平均数的离差绝对值 ∣xi−x∣ 与频数 fi 的乘积 fi∣xi−x∣(i=1,2,⋯,k)。
平均差 A.D.=∑i=1kfi∑i=1kfi∣xi−x∣。
方差
方差是各个数据与其算术平均数的离差平方和的平均数。
简单随机样本方差(未分组数据):
对于样本数据 x1,x2,⋯,xn,先求出样本均值 x=n1∑i=1nxi。
再计算离差平方 (xi−x)2(i=1,2,⋯,n)。
样本方差 s2=n−11∑i=1n(xi−x)2 。这里除以 n−1 是为了使样本方差是总体方差的无偏估计。
总体方差(未分组数据):
当数据是总体数据 X,包含 N 个数据 x1,x2,⋯,xN ,总体均值 μ=N1∑i=1Nxi。
总体方差 σ2=N1∑i=1N(xi−μ)2。
分组数据方差:
与分组数据计算平均差类似,数据分为 k 组,组中值为 x1,x2,⋯,xk,频数为 f1,f2,⋯,fk,先求加权平均数 x=∑i=1kfi∑i=1kfixi。
然后计算 (xi−x)2fi(i=1,2,⋯,k)。
方差 s2=∑i=1kfi−1∑i=1kfi(xi−x)2(样本情况);若是总体情况,分母为 ∑i=1kfi 。
标准差
标准差是方差的算术平方根。
样本标准差:在求出样本方差 s2 后,样本标准差 s=s2
=n−11∑i=1n(xi−x)2
。
总体标准差:求出总体方差 σ2 后,总体标准差 σ=σ2
=N1∑i=1N(xi−μ)2
。
例如,有一组数据 1,2,3,4,5:
计算平均差:
平均数 x=51+2+3+4+5=3。
离差绝对值分别为 ∣1−3∣=2,∣2−3∣=1,∣3−3∣=0,∣4−3∣=1,∣5−3∣=2。
平均差 A.D.=52+1+0+1+2=56=1.2。
计算方差:
离差平方分别为 (1−3)2=4,(2−3)2=1,(3−3)2=0,(4−3)2=1,(5−3)2=4。
样本方差 s2=5−14+1+0+1+4=410=2.5。
计算标准差:
样本标准差 s=2.5
≈1.58 。