本文于 2019-03-22 13:17 更新,已是最新版。
协方差定义为:
COV(X,Y)=E[(X-E(X))(Y-E(Y))]
等价计算式为COV(X,Y)=E(XY)-E(X)E(Y)。
例如:
Xi 1.1 1.9 3
Yi 5.0 10.4 14.6
E(X) = (1.1+1.9+3)/3=2
E(Y) = (5.0+10.4+14.6)/3=10
E(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3=23.02
Cov(X,Y)=E(XY)-E(X)E(Y)=23.02-2×10=3.02
扩展资料:
协方差公式推导
cov(X,Y)=∑ni=1(Xi−X¯)(Yi−Y¯)n=E[(X−E[X])(Y−E[Y])]cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n=E[(X−E[X])(Y−E[Y])]
=E[XY−E[X]Y−XE[Y]+E[X]E[Y]]=E[XY−E[X]Y−XE[Y]+E[X]E[Y]]
因为均值计算是线性的,即(a和b均为常数):
E[aX+bY]=aE[X]+bE[Y]E[aX+bY]=aE[X]+bE[Y]
附:方差的概念与计算公式
两人的5次测验成绩如下:X: 50,100,100,60,50 E(X)=72;Y: 73, 70, 75,72,70 E(Y)=72。平均成绩相同,但X 不稳定,对平均值的偏离大。方差描述随机变量对于数学期望的偏离程度。单个偏离是消除符号影响方差即偏离平方的均值,记为D(X):直接计算公式分离散型和连续型。推导另一种计算公式得到:“方差等于各个数据与其算术平均数的离差平方和的平均数”。其中,分别为离散型和连续型计算公式。 称为标准差或均方差,方差描述波动程度。