Errores en modelos. Zillow. Control de alquileres.
I. Errores en modelos
A menudo he usado
plot(cars$speed, cars$dist)
abline(lm(dist ~ speed, data = cars), col = "red")
con el que se crea la requetemanida gráfica
útil para ilustrar aspectos relacionados con el ajuste de modelos. Hoy, toca de nuevo.
Salvo que uno haga cosas muy extravagantes, los errores de un modelo están tanto por arriba como por debajo de la predicción. De hecho, en una amplia clase de modelos $\sum_i e_i =0$ en entrenamiento y, usualmente, la suma de los errores no debe de quedar muy lejos de cero tampoco en validación (y en el mundo real). Uno puede casi siempre decir: unas veces me quedaré corto; otras largo y la ley de los grandes números me da ciertas garantías de que lo dado compensará lo servido en el largo plazo.