Kovarians

Fra testwiki
Spring til navigation Spring til søgning

En kovarians er et spredningsforhold mellem to forskellige stokastiske variabler X og Y og betegnes Cov(X,Y). Den regnes:


Cov(X,Y)=E[(XE(X))(YE(Y))]


hvor E(X) angiver middelværdien for X. En fortolkning af formlen er, at hvis X er høj i forhold til sin middelværdi når Y er høj i forhold til sin middelværdi (og ligeledes med lav), varierer X og Y "sammen" (derfra navnet kovarians, ko = sammen).

Kovarians er ikke uafhængig overfor skalering: Hvis X bliver fordoblet, bliver kovariansen også fordoblet. Korrelation er et andet mål, som kan bruges, når man vil undgå dette problem.

Empiriske størrelser

For en stikprøve med n datapunkter (x1,x2,,xn) og (y1,,yn) beregnes empiriske kovarians således:

Cov(X,Y)=1ni=1n(xix¯)(yiy¯)

hvor x¯ er gennemsnittet af x

Regneregler

Rækkefølgen af X og Y er ligegyldig:

 Cov(X,Y)=Cov(Y,X)

Kovariansen mellem en variabel og sig selv er lig variansen:

 Cov(X,X)=Var(X)

Skaleres X og Y med konstanterne a henholdvist b, vil kovariansen skaleres med produktet af de to konstanter:

Cov(aX,bY)=abCov(X,Y)

Kovarians kan også skrives

Cov(X,Y)=E(XY)E(X)E(Y)

Heraf følger, at hvis X og Y er uafhængige, vil kovariansen være nul, da E(XY)=E(X)E(Y) for uafhængige variable.

Se også

Skabelon:Matematikstub Skabelon:Autoritetsdata