Estadística en las ciencias blandas
Voy a comenzar con una simulación inofensiva,
set.seed(1)
n <- 10000
sigma <- .1
x <- runif(n)
# coeficientes:
indep <- -1
b_0 <- .5
# variable objetivo:
error <- rnorm(n, 0, sigma)
y_0 <- indep + x * b_0 + error
# modelo:
modelo_0 <- lm(y_0 ~ x)
summary(modelo_0)
que da como resultado
Call:
lm(formula = y_0 ~ x)
Residuals:
Min 1Q Median 3Q Max
-0.42844 -0.06697 -0.00133 0.06640 0.37449
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.001951 0.001967 -509.5 <2e-16 ***
x 0.500706 0.003398 147.3 <2e-16 ***
Residual standard error: 0.0989 on 9998 degrees of freedom
Multiple R-squared: 0.6847, Adjusted R-squared: 0.6846
F-statistic: 2.171e+04 on 1 and 9998 DF, p-value: < 2.2e-16
Me he limitado a construir el típico conjunto de datos que cumple las condiciones de libro para poder aplicar la regresión lineal y he reconstruido los parámetros originales a través del resultado de esta: el término independiente (-1), la pendiente (.5), la desviación estándar del error (.1), etc.