Tres de seis consejos para mejorar las regresiones

Por si alguien se lo perdió, están aquí. De los seis, mencionaré tres que me están resultando muy útiles en un proyecto actual.

De todos ellos, el que más a rajatabla sigo es el primero: ajustar muchos modelos. Pudiera parecer trampa: buscar y rebuscar por si sale algo. Sin embargo, es una técnica que plantearse como una manera de familiarizarse y aprender la estructura de los datos. Los modelos (explicativos, como los que justifican esta entrada) no dejan de ser resúmenes de conjuntos de datos y no es sino ajustando diversos modelos que uno aprende si, por ejemplo, un coeficiente varía por año o provincia.

El segundo es un prerrequisito para el anterior: modelar rápida, eficiente y robustamente. Es conveniente comenzar con un subconjunto de los datos (p.e., una provincia de cada tipo; unos cuantos años y no todos). Poder correr una serie de modelos en bucle (e, incluso, en paralelo) para extraer rápidamente la información relevante y poder…

representarla gráficamente, que viene a ser el tercer consejo y una condición sine qua non para alcanzar el objetivo final: comprender la estructura de los datos.