La distancia entre dos puntos aleatorios en un círculo

Consideramos en esta entrada un problema de geometría estocástica: sean X_1 y X_2 dos puntos seleccionados aleatoria  e independientemente, con distribución uniforme, en un círculo de radio R. ¿Cuál es el valor medio de la distancia Y=\|X_1-X_2\| entre ellos? En la figura siguiente se muestran realizaciones de la variable Y para 10 pares de puntos:

distancias10Esta es la  función de R que he usado para simular pares de puntos y distancias:

# Calcula distancias entre n pares de puntos uniformes
# en un círculo de radio R
distancia.circulo = function(n, R=1){
 r = runif(n, 0, R^2)
 theta = runif(n, 0, 2*pi)
 x1 = cbind(sqrt(r)*cos(theta), sqrt(r)*sin(theta))
 r = runif(n, 0, R^2)
 theta = runif(n, 0, 2*pi)
 x2 = cbind(sqrt(r)*cos(theta), sqrt(r)*sin(theta))
 distancias = sqrt(apply( (x1-x2)^2, 1, sum))
 return(list(distancias, x1, x2))
}

#---------------------------------------------------------

# Un ejemplo
set.seed(10) # para reproducir los resultados
n = 10000 # pares de puntos
distancias = distancia.circulo(n)[[1]]
mean(distancias)

En el ejemplo el radio es 1 y la distancia media entre los 10000 pares de puntos generados ha sido 0.9031, es decir, parece que la distancia media es ligeramente inferior al radio del círculo.

A pesar de lo fácil que es entender el planteamiento de este problema, dar una fórmula teórica que justifique el resultado de la simulación anterior no es tan sencillo. Sin embargo, hay una manera de calcular no solo la distancia media entre los dos puntos, sino la función de densidad de la variable aleatoria Y. El resultado es conocido y aparece -demostrado por distintos métodos- en varios artículos diferentes. Resulta que la distancia media es \frac{128}{45\pi}R\approx 0.9054R, que coincide aproximadamente con lo que hemos observado en la simulación.

Se puede encontrar en esta nota un esquema de una de las posibles demostraciones del resultado. También se incluye el cálculo de la función de densidad de Y, así como algunos comentarios adicionales sobre el problema.

En la siguiente figura he representado el resultado de una simulación para 200 pares de puntos. En el gráfico de la izquierda aparecen los puntos y los segmentos que definen. En el de la derecha aparece el histograma de las 200 distancias junto con la función de densidad teórica, dada por la fórmula derivada en la nota anterior. Es una manera de comprobar empíricamente que los cálculos son correctos:

distancias200

Dejo para más adelante una entrada en la que comentar las aplicaciones prácticas en estadística de considerar distancias entre pares de puntos aleatorios en un conjunto.

Anuncios
Esta entrada fue publicada en probabilidad y etiquetada . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s