Entrevista con un profesor del MIT en El País

Me pareció interesante esta entrevista con Roberto Rigobón publicada en El País. Rigobón es un profesor del MIT que enseña un curso sobre Cómo ser un mejor usuario de datos. Reflexiona en la entrevista sobre la diferencia que hay entre tener datos y tener información, y sobre la necesidad de profesionales que sean capaces de llevar a cabo la tarea de llegar a la información a partir de los datos:

P. ¿Si no se trata de fuerza bruta, de qué se trata? ¿Es más el software o las personas?

R. No hay una carrera universitaria de análisis de datos. Y quien se dedique a esto va a necesitar un poco de conocimiento de ingeniería técnica, un poco de economía, un poco de sociología, un poco de psicología… y eso todavía no existe.

Me parece significativo que no diga que quien se dedique al análisis de datos va a necesitar un poco de estadística, que es la ciencia que desde hace varios siglos se dedica a analizar datos. Puede ser un síntoma de que la estadística ha perdido parte de su sitio, precisamente cuando resultaría más necesaria dado el volumen inmenso de datos disponibles en la actualidad. El año pasado un artículo en el boletín de la ASA trataba este mismo asunto:

Big Data are data on a massive scale in terms of volume, intensity, and complexity, and their promise for transforming business, health care, scientific discovery, public policy, and a host of other areas has been proclaimed widely. But, despite the enormous potential for contributions by statisticians, our profession and the ASA have not been very involved in Big Data activities. We are often missing from Big Data discussions in the media.

There are three reasons for this disconnect. First, the media and public lack a general understanding of what statisticians contribute to society (the issue that motivated the International Year of Statistics). Second, few statisticians are engaged in Big Data projects or have the special skills necessary to handle Big Data challenges.

Third, the statistical community is disconnected from the new (and vaguely defined) community of data scientists, who are completely identified with Big Data in the eyes of the media and policymakers.

Creo que en general serán necesarios cambios en la formación que reciben los estadísticos si queremos tener algo que decir como analistas de datos en el futuro. Tal y como yo lo veo será necesaria formación sobre los siguientes aspectos:

  • Las herramientas informáticas (bases de datos, procesamiento en paralelo,…) necesarias para manejar un volumen ingente de datos.
  • Cómo comunicar bien los resultados de los análisis llevados a cabo.
  • Las matemáticas seguirán siendo importantes. Creo que hay que aumentar el énfasis en técnicas matemáticas de optimización.
  • Respecto a la formación más concreta en estadística, las técnicas de selección de variables y de reducción de la dimensión parecen muy relevantes en el análisis de grandes bases de datos. También los métodos puramente descriptivos o exploratorios, especialmente sobre datos de alta dimensión. Estos temas no son todavía muy importantes en los cursos que impartimos en comparación con el tiempo que le dedicamos a la inferencia paramétrica.
Anuncios
Esta entrada fue publicada en estadística y etiquetada , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s