Buscando la máxima concordancia entre particiones: un problema abierto

Para la primera contribución invitada de este blog, tenemos la gran suerte de contar con una entrada escrita por José Enrique Chacón. José Enrique es profesor titular de Estadística en el Departamento de Matemáticas de la Universidad de Extremadura, miembro del Instituto de Matemáticas de esa universidad y también miembro del equipo de investigación de … Sigue leyendo Buscando la máxima concordancia entre particiones: un problema abierto

Bendición de la dimensionalidad y clasificación perfecta de datos funcionales

Cuando la dimensión de los datos es muy alta (se miden para cada individuo muchas variables) muchas regiones del espacio muestral están vacías de datos por lo que algunos métodos estadísticos fallan. Un ejemplo son los métodos que requieren optimizar funciones complicadas que dependen de muchas variables, ya que el espacio a explorar buscando el … Sigue leyendo Bendición de la dimensionalidad y clasificación perfecta de datos funcionales

Las componentes lineales de una regla de clasificación cuadrática

¿Cuándo una regla lineal es equivalente a una cuadrática? Las reglas de clasificación cuadráticas son muy flexibles y permiten distinguir poblaciones que difieren no solo en las medias sino también en la estructura de covarianzas. De hecho, si queremos clasificar entre dos poblaciones  normales con matrices de covarianzas distintas, la regla óptima (o regla Bayes) … Sigue leyendo Las componentes lineales de una regla de clasificación cuadrática

Una introducción al paquete CARET

El paquete CARET (classification and regression training, Kuhn (2016)) incluye una serie de funciones que actúan como interfaz para decenas de métodos complejos de clasificación y regresión. Utilizar este paquete en lugar de las funciones originales de los métodos presenta dos ventajas: Permite utilizar un código unificado para aplicar reglas de clasificación muy distintas, implementadas … Sigue leyendo Una introducción al paquete CARET

El clasificador tangente

En un problema de clasificación supervisada, las reglas de clasificación lineales son preferibles a otras más complicadas debido a que se pueden interpretar con mayor facilidad. Por ejemplo, con una regla lineal es posible determinar qué variables son importantes  y qué variables no son relevantes a efectos de clasificar una nueva observación. Sin embargo, las … Sigue leyendo El clasificador tangente

Clasificación supervisada con R

Añado una nueva práctica de R sobre clasificación supervisada. He utilizado algunas variables de un  popular conjunto de datos para ilustrar algunos de los métodos más conocidos de análisis discriminante: la regla lineal de Fisher, la regla cuadrática (es decir, la regla Bayes bajo normalidad) y la regla de k vecinos más próximos. Los datos … Sigue leyendo Clasificación supervisada con R