一、方差的定义和公式
设一组数据x1,x2,x3……xn中,各组数据与它们的平均数x的差的平方分别是(x1-x)2,(x2-x)2……(xn-x)2,那么就可以用他们的平均数对其进行衡量,公式为
该公式主要用来衡量这组数据的波动大小,并把它叫做这组数据的方差。为了简便我们也可以将其记做
(其中x为该组数据的平均值)
如果一组数据的方差越小,那么就证明该组数据的稳定性较高。
二、正态分布的期望和方差
数学期望反映随机变量平均取值的大小。
方差为各个数据与平均数之差的平方的和的平均数,即
其中,x表示样本的平均数,n表示样本的数量,xi表示个体,而s²就表示方差。
三、方差的相关知识点
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
样本中各数据与样本平均数的差的平方和的平均数为样本方差;样本方差的算术平方根为样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差为测算离散趋势最重要、最常用的指标,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。