"Proxys": error y sesgo en modelos lineales
El otro día publiqué un minihilo en Twitter que terminaba con una encuesta. Proponía el siguiente problema:
- Quiero, abusando del lenguaje, estimar el efecto de $x$ sobre $y$ usando el modelo lineal clásico $y = a_0 + a_1 x + \epsilon_1$.
- Pero no puedo medir $x$ con precisión. Solo tengo una medida ruidosa/aproximada de $x$, $z = x + \eta$, donde $\eta$ es normal, independiente de $\epsilon_1$, etc.
- Uso el modelo $y = b_0 + b_1 z + \epsilon_2$.
La pregunta que planteé consistía en elegir entre las siguientes tres opciones: