Buscando la máxima concordancia entre particiones: un problema abierto

Para la primera contribución invitada de este blog, tenemos la gran suerte de contar con una entrada escrita por José Enrique Chacón. José Enrique es profesor titular de Estadística en el Departamento de Matemáticas de la Universidad de Extremadura, miembro del Instituto de Matemáticas de esa universidad y también miembro del equipo de investigación de … Sigue leyendo Buscando la máxima concordancia entre particiones: un problema abierto →

Bendición de la dimensionalidad y clasificación perfecta de datos funcionales

Cuando la dimensión de los datos es muy alta (se miden para cada individuo muchas variables) muchas regiones del espacio muestral están vacías de datos por lo que algunos métodos estadísticos fallan. Un ejemplo son los métodos que requieren optimizar funciones complicadas que dependen de muchas variables, ya que el espacio a explorar buscando el … Sigue leyendo Bendición de la dimensionalidad y clasificación perfecta de datos funcionales →

Las componentes lineales de una regla de clasificación cuadrática

¿Cuándo una regla lineal es equivalente a una cuadrática? Las reglas de clasificación cuadráticas son muy flexibles y permiten distinguir poblaciones que difieren no solo en las medias sino también en la estructura de covarianzas. De hecho, si queremos clasificar entre dos poblaciones normales con matrices de covarianzas distintas, la regla óptima (o regla Bayes) … Sigue leyendo Las componentes lineales de una regla de clasificación cuadrática →

Una introducción al paquete CARET

El paquete CARET (classification and regression training, Kuhn (2016)) incluye una serie de funciones que actúan como interfaz para decenas de métodos complejos de clasificación y regresión. Utilizar este paquete en lugar de las funciones originales de los métodos presenta dos ventajas: Permite utilizar un código unificado para aplicar reglas de clasificación muy distintas, implementadas … Sigue leyendo Una introducción al paquete CARET →

Estadística II (Grado en Matemáticas)

Añado a la página de cursos del blog la mayor parte del material que he estado utilizando los dos últimos cursos en la asignatura Estadística II, optativa en el Grado en Matemáticas de la UAM. Dado que es un material de clase que tal vez requeriría más tiempo para ser revisado es posible que aún queden errores … Sigue leyendo Estadística II (Grado en Matemáticas) →

Una (dulce) receta con R

El brazo de gitano (llamado en los países anglosajones Swiss roll) es un conocido bizcocho relleno y enrollado en forma de cilindro. En esta entrada se describe cómo generar una muestra aleatoria en $latex \mathbb{R}^3$ que tiene la forma de este dulce, y cómo representar estos datos en un gráfico tridimensional. Este ejercicio de simulación … Sigue leyendo Una (dulce) receta con R →

Máquinas de vectores soporte con R

He añadido a la página de R del blog una introducción a la aplicación de máquinas de vectores soporte (SVM, iniciales en inglés) con R. Hay varios paquetes que se pueden utilizar. Yo he elegido la función svm del paquete e1071. En función de los parámetros y del núcleo seleccionado, las máquinas de vectores soporte incluyen bajo una … Sigue leyendo Máquinas de vectores soporte con R →

El clasificador tangente

En un problema de clasificación supervisada, las reglas de clasificación lineales son preferibles a otras más complicadas debido a que se pueden interpretar con mayor facilidad. Por ejemplo, con una regla lineal es posible determinar qué variables son importantes y qué variables no son relevantes a efectos de clasificar una nueva observación. Sin embargo, las … Sigue leyendo El clasificador tangente →

Clasificación supervisada con R

Añado una nueva práctica de R sobre clasificación supervisada. He utilizado algunas variables de un popular conjunto de datos para ilustrar algunos de los métodos más conocidos de análisis discriminante: la regla lineal de Fisher, la regla cuadrática (es decir, la regla Bayes bajo normalidad) y la regla de k vecinos más próximos. Los datos … Sigue leyendo Clasificación supervisada con R →