¿Son incorreladas dos variables aleatorias independientes cuya covarianza es cero?

Sean X e Y dos variables aleatorias independientes cuya covarianza es igual a cero. ¿Podemos decir que el coeficiente de correlación lineal entre ellas también vale cero?

En esta entrada se presenta un ejemplo que demuestra que, estrictamente hablando, la respuesta a la pregunta es negativa. La razón es que para que el coeficiente de correlación esté bien definido hay que imponer condiciones a la existencia de momentos de las variables. Además, estas condiciones son ligeramente más restrictivas que las necesarias para que exista la covarianza.

Se trata de una cuestión sobre todo técnica, pero es necesario tenerla en cuenta al aplicar el coeficiente de correlación a variables con colas pesadas como las que aparecen, por ejemplo, en datos económicos. Y en cualquier caso hay que tenerla en cuenta para hacer afirmaciones matemáticamente correctas.

El ejemplo

Como punto de partida consideramos Z_1,\ldots,Z_5 v.a.i.i.d. con distribución normal estándar. Definimos X=Z_1^2 e Y=(Z^2_2+Z^2_3+Z^2_4+Z^2_5)^{-1}. Obviamente X e Y son v.a. independientes. Además X e Y verifican las siguientes propiedades:

  1. E(X)=E(Z_1^2)=1.
  2. E(Y)=1/2, ya que Y es la inversa de una v.a. con distribución chi-cuadrado con 4 grados de libertad. (Se aplica la fórmula que aparece en esta entrada de wikipedia.)
  3. Dado que 4XY tiene distribución F con 1 y 4 grados de libertad  también se verifica E(4XY)=2 (de nuevo, se puede consultar la fórmula en wikipedia) y, por lo tanto, E(XY)=1/2.
  4. Como consecuencia de los tres puntos anteriores Cov(X,Y)=E(XY)-E(X)E(Y)=0.
  5. Sin embargo, Var(Y)=\infty ya que la varianza de la inversa de una chi-cuadrado con n grados de libertad solo es finita si n>4. Por lo tanto el coeficiente de correlación entre X e Y no está definido.

He tomado el ejemplo anterior de Mukhopadhyay (2010). En el artículo se presenta también un ejemplo aún más sencillo en el que las variables son independientes pero ni siquiera la covarianza está definida. Basta tomar X=Z_1 e Y=Z_2^{-1}, con lo que XY=Z_1/Z_2 tiene distribución de Cauchy y E(XY) no es finita.

Referencias

Mukhopadhyay, N. (2010). When finiteness matters: counterexamples to notions of covariance, correlation, and independence. The American Statistician, 64, 231-233.

 

Anuncios
Esta entrada fue publicada en estadística, probabilidad y etiquetada , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s