El cierre convexo y el bisonte de la pradera

Imaginemos un bisonte vagando por las grandes praderas de Misuri. Él no es consciente pero, gracias al GPS, alguien está registrando en todo momento el lugar en que se encuentra. Su trayectoria, vista desde arriba, podría pasar por la red de calles de una ciudad antigua o incluso por la tela de una araña:

TrayectoriaBisonte

Los ecólogos están interesados en determinar el área de campeo (home range) de diferentes especies animales. En nuestro ejemplo, determinar la zona en la que vive y por la que se mueve el bisonte. El problema estadístico es utilizar la trayectoria seguida por los animales  para estimar su área de campeo. Se trata de un problema estadístico peculiar ya que lo que queremos estimar es en realidad un conjunto. Es un ejemplo de estadística infinito-dimensional (el espacio al que pertenece lo que queremos estimar tiene dimensión infinita).

En esta entrada describimos dos estimadores del área de campeo, uno de ellos se ha propuesto en un artículo (de donde he tomado la imagen anterior) que publicará próximamente un investigador de nuestro proyecto. En la imagen, el estimador calculado a partir de la trayectoria aparece en rojo. Más adelante en esta entrada se define este estimador y se explica cómo se puede calcular con R.

El cierre convexo

Un conjunto es convexo si dados dos puntos del conjunto, el segmento que los une también está totalmente incluido en el conjunto. El cierre convexo de un conjunto de puntos es el conjunto convexo más pequeño que los incluye. Por ejemplo, la frontera del cierre convexo de los puntos de la izquierda se ha representado en azul a la derecha.

CierreConvexo

Si los puntos corresponden a los  lugares en los que se ha localizado nuestro bisonte, el cierre convexo se puede usar para estimar su área de vida. Si bien el cierre convexo es un estimador muy utilizado por su sencillez, en la literatura sobre el tema se han puesto de manifiesto sus sesgos. Parece claro que imponer que el área de campeo sea un conjunto convexo es una hipótesis demasiado fuerte. Esto significaría que dados dos puntos cualesquiera en los que se ha localizado al bisonte, el segmento que los une también está incluido en la zona en la que se mueve. Sin embargo, esto podría ser imposible debido a la presencia de barreras naturales, entre otras posibles causas.

La función relevante en R para el cálculo y representación gráfica del cierre convexo es chull(). Su argumento es una matriz n\times 2 cuyas filas son las coordenadas de los puntos para los que se desea calcular el cierre convexo. Lo que esta función devuelve son los índices ordenados correspondientes a los vértices del cierre. El siguiente código de R calcula el cierre convexo de n puntos cuyas coordenadas son normales estándar independientes (reproduce el gráfico de la parte derecha de la figura anterior):

set.seed(100) # para reproducir los resultados
n = 50
puntos = cbind(rnorm(n), rnorm(n))
indices= chull(puntos)
plot(puntos, pch=16, bty='l', xlab='', ylab='')
polygon(puntos[indices, ], lwd=2, border = 'blue')
points(puntos[indices,], col='red', pch=16, cex=1.1)

 

El cierre alfa-convexo

En una investigación reciente llevada a cabo por A. CholaquidisR. Fraiman -miembro de nuestro proyecto de investigación-, G. Lugosi y B. Pateiro-López, se estudian estimadores que no requieren la hipótesis de convexidad. Se utiliza como modelo para el desplazamiento del animal un movimiento browniano (reflejado en la frontera del conjunto que se desea estimar). Como estimador del conjunto se utiliza el cierre alfa-convexo de los puntos observados de la trayectoria del proceso. Este estimador resulta mucho más flexible y de aplicación mucho más general que el cierre convexo. La investigación se publicará próximamente en Journal of the Royal Statistical Society, series B.

Veamos cómo se define el estimador en este artículo. Un conjunto es alfa-convexo (para un valor \alpha>0 prefijado) si dado un punto que no está en el conjunto, existe un círculo abierto (sin incluir la circunferencia) de radio \alpha, centrado en el punto, que no toca al conjunto; es decir, la circunferencia separa al punto del conjunto ya que el punto queda dentro del círculo y el conjunto fuera. La figura siguiente muestra uno de estos conjuntos:

alfaconvexo

 

El cierre alfa-convexo de un conjunto de puntos es el menor conjunto alfa-convexo que lo contiene. Si el radio \alpha de los círculos es grande, las circunferencias se asemejan más a rectas con lo que el cierre alfa-convexo se parece bastante al cierre convexo. Sin embargo, para valores pequeños de \alpha, el cierre alfa-convexo puede estar muy lejos de ser un conjunto convexo. En la figura siguiente se compara el cierre convexo (su frontera en azul) con el cierre alfa-convexo (su frontera en negro) con \alpha=1 para los mismos puntos de la figura anterior.

alfaconvexo1

En R, es muy fácil calcular y representar gráficamente el cierre alfa-convexo, gracias al paquete alphahull, escrito por Beatriz Pateiro-López y Alberto Rodríguez-Casal, de la Universidad de Santiago de Compostela. Basta usar el comando ahull() de este paquete y aplicar plot() al objeto resultante. El código para obtener la figura anterior ha sido el siguiente (usa el resultado del código mostrado anteriormente):

library(alphahull) # instalar previamente el paquete
alfaconvexo = ahull(puntos, alpha=1)
plot(alfaconvexo)
polygon(puntos[indices, ], lwd=2, border = 'blue')

En la figura siguiente se muestra cómo varía el cierre alfa-convexo al cambiar el valor de \alpha:
alfaconvexo2

Se observa que para \alpha=5.5 el cierre alfa-convexo y el cierre convexo ya son muy similares.

En el artículo mencionado se estudian, entre otros resultados relacionados con el perímetro y la superficie de estos conjuntos, condiciones bajo las cuales el cierre alfa-convexo converge al verdadero conjunto que se desea estimar a medida que crece el número de posiciones del animal observadas, así como la velocidad de convergencia. Este tipo de análisis requiere estudiar sucesiones de conjuntos aleatorios, y determinar qué significa que estas sucesiones se aproximan a un conjunto límite. La estadística tiene estas cosas, permite conectar conceptos matemáticos sofisticados (alfa-convexidad, movimiento browniano, convergencia de sucesiones de conjuntos) con problemas relacionados con la vida cotidiana, por lo menos con la vida cotidiana de los bisontes.

 

Anuncios
Esta entrada fue publicada en estadística y etiquetada , , , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s