Los dados de Efron

Disponemos de un conjunto de cuatro dados en cuyas caras aparecen otros números en lugar de los tradicionales 1 a 6:

DadosEfron

Imaginemos una partida entre dos jugadores en la que cada uno tira uno de estos dados y gana aquel que obtenga una mayor puntuación. Si vuestro caballeroso oponente os deja elegir primero el dado con el que queréis jugar, ¿cuál elegiríais?

Un juego no transitivo

La respuesta es que no importa cuál seleccionéis, vuestro adversario siempre puede elegir otro con el que os gana con probabilidad 2/3. Por ejemplo, si seleccionáis el aburrido dado B (siempre sale 3) entonces A gana con probabilidad 2/3 (cada vez que sale 4), pero si animados por este cálculo seleccionáis el dado A, entonces también D gana a A con probabilidad 2/3 (ejercicio fácil). Podéis pensar en el dado que elegiríais vosotros si es vuestro adversario el que elige primero para cada una de las dos opciones restantes (la respuesta más abajo).

Este ejemplo, que demuestra que ciertas relaciones entre variables aleatorias no tienen por qué ser transitivas, se debe a  Bradley Efron, un estadístico de la Universidad de Stanford conocido sobre todo por introducir a finales de los 70 del siglo XX las técnicas de remuestreo bootstrap. Sus contribuciones en estadística son muy variadas y relevantes, como se puede comprobar en su perfil de Google Académico. En 1998, Efron fue investido doctor honoris causa por la Universidad Carlos III de Madrid (por cierto, su discurso de investidura, que resume la evolución de la estadística en el siglo XX, fue muy interesante y aún se puede encontrar aquí traducido al castellano).

Volviendo a los dados de Efron, el código de R siguiente (que podéis modificar si queréis experimentar con otros dados) simula 10.000.000 de partidas entre algunos pares de los cuatro dados y devuelve la proporción de veces que cada uno gana a otro. El 66,6% de las veces A le gana a B, B le gana a C, C le gana a D, pero también D le gana al dado A. Intuitivamente, cada dado tiene ventajas e inconvenientes que son las que determinan si es mejor o peor que otro. Lo que supone una ventaja en unas comparaciones puede no serlo tanto en otras.

# Esta función simula R partidas entre dos dados
# y devuelve la proporción de veces que el primero le gana
# al segundo

partidas = function(dado1, dado2, R=10^7){
# dado1 y dado2 son vectores con los 6 números de cada dado
sample1 = sample(dado1, R, rep=TRUE)
sample2 = sample(dado2, R, rep=TRUE)
return(sum(sample1 > sample2)/R)
}

# Aplicamos la función a los datos de Efron
dadoA = c(0, 0, 4, 4, 4, 4)
dadoB = c(3, 3, 3, 3, 3, 3)
dadoC = c(2, 2, 2, 2, 6, 6)
dadoD = c(1, 1, 1, 5, 5, 5)

set.seed(100) # para reproducir los resultados
partidas(dadoA, dadoB)
partidas(dadoB, dadoC)
partidas(dadoC, dadoD)
partidas(dadoD, dadoA)

La paradoja de Steinhaus-Trybula

En términos más generales, supongamos que X, Y, Z,\ldots son variables aleatorias que representan el beneficio obtenido, por ejemplo, en diferentes inversiones. Decimos que la inversión X es mejor que la inversión Y (notación, X\succ Y) si es más probable ganar más con X que con Y, es decir, si \mathbb{P}(X>Y)> 0.5. Podría pensarse que si una inversión X es mejor que otra Y, y a su vez Y es mejor que una tercera Z, entonces X también será mejor que Z. Sin embargo, los dados de Efron proporcionan un ejemplo de que la relación no es transitiva. De hecho, es posible encontrar tres variables X,Y,Z tales que  X\succ YY\succ Z, pero Z\succ X (es muy fácil comprobar que el dado C le gana al A con probabilidad 5/9>1/2). A este hecho a veces se le llama la paradoja de Steinhaus-Trybula.

En Trybula (1965) se demuestra que si X_1,X_2,X_3,X_4 son variables aleatorias independientes, entonces

\min\{\mathbb{P}(X_1>X_2),\mathbb{P}(X_2>X_3),\mathbb{P}(X_3>X_4),\mathbb{P}(X_4>X_1)\} \leq 2/3.

Teniendo en cuenta esta cota, los dados de Efron constituyen un ejemplo que no puede mejorarse en el sentido de que no es posible encontrar cuatro variables independientes tales que las cuatro probabilidades anteriores sean todas ellas estrictamente mayores que 2/3.

Para tres variables independientes puede probarse

\min\{\mathbb{P}(X_1>X_2),\mathbb{P}(X_2>X_3),\mathbb{P}(X_3>X_1)\} \leq \varphi -1,

donde \varphi = (1+\sqrt{5})/2\approx 1.618 es la proporción áurea, que de pronto aparece en este contexto. En particular, no es posible diseñar tres dados de forma que A le gane a B, B a C y C a A, siempre con probabilidad 2/3.

El artículo de Trybula contiene cotas para un número arbitrario n de variables aleatorias. Si p_n es la cota para n variables independientes (los ejemplos anteriores corresponden a p_3 y p_4) entonces p_n es una sucesión creciente que converge a 3/4. Otros resultados en relación con la paradoja de Steinhaus-Trybula se pueden encontrar, por ejemplo, en Usiskin (1964) y Savage (1994).

 

 

Anuncios
Esta entrada fue publicada en probabilidad, R y etiquetada . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s