Un plan de acción para extender el ámbito de la estadística
Ya es un poco viejo: tiene 12 años. Pero su contenido es de lo más actual. Se trata de un artículo de Cleveland titulado Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics que se plantea extender el ámbito de acción de la estadística (tradicional) a nuevas áreas (emergentes entonces) y cuyo objetivo es definir un conjunto de contenidos que deberían conformar el bagaje del analista de datos (hoy lo llamaríamos científico de datos o data scientist).
Las principales áreas de conocimiento serían:
- Investigación multidisciplinar (25 %): se refiere a la colaboración en proyectos en diversas áreas, motivado en gran parte por la experiencia histórica: Fisher, Tukey y Box, por ejemplo, trabajaron en problemas aplicados en agronomía, ingeniería o química analítica.
- Modelos y métodos para el análisis de datos (20 %), la estadística aplicada tradicional.
- Informática (15 %): algoritmos, lenguajes de programación, etc., orientados al procesamiento de datos.
- Pedagogía (15 %): cómo enseñar esta materia y, aunque Cleveland no lo diga explícitamente, cómo interactuar con colaboradores menos versados en asuntos de naturaleza cuantitativa.
- Evaluación de herramientas (5 %): tiene que ver con la formación continua y la reevaluación de técnicas, que pudiera conducir a nuevos avances
- Teoría (20 %): las matemáticas (y no solo las matemáticas) subyacentes.