Censos

Unas cuantas notas sobre estadística

Uno de los metaprincipios de la construcción de modelos estadísticos es que la calidad de los modelos es función de la cantidad de información que hay en los datos de entrenamiento. No existe el bootstrap en el sentido etimológico del término: no puede uno levantarse en el aire tirando hacia arriba de los cordones de los zapatos. Pero al hilo de una noticia reciente, Gelman discute si añadir ruido a los datos permite reducir el sobreajuste. Además, en la discusión al respecto, alguien cita el artículo de 1995 Training with Noise is Equivalent to Tikhonov Regularization, una especie de penalización en el tamaño de los coeficientes al modo de la regresión ridge.

Una serie de asuntos sobre encuestas, mercados de predicciones y su intersección

Este es un largo artículo de Andrew Gelman sobre lo que fue el gran pequeño tema de hace unas semanas: ¿funciona eso de preguntar en las encuestas sobre lo que opinan los vecinos o familiares de los encuestados? ¿Qué nos dice la evidencia?

Escribí una vez (aquí) sobre las cuestiones éticas y económicas que subyacen en los mercados de predicciones. El resumen es más o menos que estos mercados generan grandes externalidades positivas, pero que los agentes llamados a operar en ellos no pueden capturar suficiente valor, no les sale a cuenta. Por eso, algunos han llegado a plantear la posibilidad de subvencionarlos —es decir, ofrecerles incentivos externos— para que participen. Pero el hecho de que se intenten manipular (como se cuenta aquí) es, en el fondo, una buena noticia: no son irrelevantes.