Algunos problemas de la regresión paso a paso ("stepwise")
Fueron problemas planteados por Frank Harrell, recopilados aquí y ahora traducidos por mí para mi bitácora.
Problemas de la regresión paso a paso:
- La R-cuadrado obtenida está muy sesgada hacia arriba.
- Los test F y chi-cuadrado que aparecen al lado de las variables no siguen dichas distribuciones.
- Los intervalos de confianza son demasiado (e incorrectamente) estrechos.
- Los p-valores obtenidos no tienen el significado esperado y el de corregirlos adecuadamente es un problema muy difícil.
- Proporciona coeficientes sesgados y excesivamente grandes.
- Tiene problemas serios en caso de colinealidad en las variables.
- Está basado en métodos que fueron pensados para probar hipótesis preestablecidas.
- Incrementar el número de muestras no corrige los problemas anteriores.
- Nos permite no tener que pensar sobre el problema.
- Consume mucho papel.
Algunas conclusiones: