Por si alguien se lo perdió, están aquí. De los seis, mencionaré tres que me están resultando muy útiles en un proyecto actual.
De todos ellos, el que más a rajatabla sigo es el primero: ajustar muchos modelos. Pudiera parecer trampa: buscar y rebuscar por si sale algo. Sin embargo, es una técnica que plantearse como una manera de familiarizarse y aprender la estructura de los datos. Los modelos (explicativos, como los que justifican esta entrada) no dejan de ser resúmenes de conjuntos de datos y no es sino ajustando diversos modelos que uno aprende si, por ejemplo, un coeficiente varía por año o provincia.
El segundo es un prerrequisito para el anterior: modelar rápida, eficiente y robustamente. Es conveniente comenzar con un subconjunto de los datos (p.e., una provincia de cada tipo; unos cuantos años y no todos). Poder correr una serie de modelos en bucle (e, incluso, en paralelo) para extraer rápidamente la información relevante y poder…
… representarla gráficamente, que viene a ser el tercer consejo y una condición sine qua non para alcanzar el objetivo final: comprender la estructura de los datos.