Un plan de acción para extender el ámbito de la estadística

Ya es un poco viejo: tiene 12 años. Pero su contenido es de lo más actual. Se trata de un artículo de Cleveland titulado Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics que se plantea extender el ámbito de acción de la estadística (tradicional) a nuevas áreas (emergentes entonces) y cuyo objetivo es definir un conjunto de contenidos que deberían conformar el bagaje del analista de datos (hoy lo llamaríamos científico de datos o data scientist).

Las principales áreas de conocimiento serían:

  • Investigación multidisciplinar (25 %): se refiere a la colaboración en proyectos en diversas áreas, motivado en gran parte por la experiencia histórica: Fisher, Tukey y Box, por ejemplo, trabajaron en problemas aplicados en agronomía, ingeniería o química analítica.
  • Modelos y métodos para el análisis de datos (20 %),  la estadística aplicada tradicional.
  • Informática (15 %): algoritmos, lenguajes de programación, etc., orientados al procesamiento de datos.
  • Pedagogía (15 %): cómo enseñar esta materia y, aunque Cleveland no lo diga explícitamente, cómo interactuar con colaboradores menos versados en asuntos de naturaleza cuantitativa.
  • Evaluación de herramientas (5 %): tiene que ver con la formación continua y la reevaluación de técnicas, que pudiera conducir a nuevos avances
  • Teoría (20 %): las matemáticas (y no solo las matemáticas) subyacentes.