Por supuesto que tengo más variables que observaciones... ¿y?
He intentado replicar los resultados de la entrada de ayer con GAM (vía mgcv
) así (véase el enlace anterior para la definición de los datos):
library(mgcv)
modelo_gam <- gam(
y ~ x + s(id, bs = "re"),
data = datos,
method = "REML",
family = "poisson")
gam vs rrff (y, en general, modelos generativos vs cajas negras)
Para modelizar una serie temporal, y simplificándolo mucho, ¿gam o rrff? Como todo, depende. El otro día oí de un caso en el que los segundos vencían a los primeros claramente. Natural.
Hay contextos con una estructura matemática clara y potente. En particular, muchos en los que trabajo actualmente. ¿Para qué usar una herramienta genérica cuando cuento con una específica? Esos datos, mis datos, exigen estructura matemática.
Luego hay otros casos en los que uno se lanza al río. Luego uno siempre quiere invertir el proceso y ver qué carajos está ocurriendo con los datos (véase esto).
gam/bam admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
gam
/bam
admiten efectos aleatorios
Y solo me enteré anoche (gracias a José Luis Cañadas).
Mezcolanza: de INLA a GAM pasando por la frenología
Combino en uno cuatro asuntos demasiado prolijos para Twitter pero sobre los que no sé lo suficiente como para desarrollarlos en una entrada entera.
El paquete stpp
de R tiene muy buena pinta para el análisis de conteos espacio-temporales. Se recomienda leer el artículo que lo describe. Para el tipo de problemas que plantea, se me habría ocurrido tirar de INLA. Desafortunadamente, a los autores del artículo no se les ocurrió compararlos. Cosas de la academia.
GAM
Hoy he dado una charla en la Carlos III. En la comida me han preguntado, algo extrañados, por un ejemplo que había enseñado en el que ajustaba un modelo usando GAMs.
El motivo era que quienes preguntaban —que trabajan con ese tipo de modelos— encuentran muy difícil, se ve, convencer a otros usuarios de los métodos estadísticos (economistas, etc.) de adoptarlos. Yo he contestado que hace unos pocos días a unos primíparos que acababan de ajustar sus tres primeros lms
con R les invité a probar GAMs con sus datos. ¿Por qué no?