Ruido

Unas cuantas notas sobre estadística

Uno de los metaprincipios de la construcción de modelos estadísticos es que la calidad de los modelos es función de la cantidad de información que hay en los datos de entrenamiento. No existe el bootstrap en el sentido etimológico del término: no puede uno levantarse en el aire tirando hacia arriba de los cordones de los zapatos. Pero al hilo de una noticia reciente, Gelman discute si añadir ruido a los datos permite reducir el sobreajuste. Además, en la discusión al respecto, alguien cita el artículo de 1995 Training with Noise is Equivalent to Tikhonov Regularization, una especie de penalización en el tamaño de los coeficientes al modo de la regresión ridge.

Pokemoneando ruido

Quería escribir una entrada totalmente distinta y me ha bloqueado el no contar con una buena traducción para chase noise.

¿Cazar ruido? Pero la caza es una actividad casi solipsista: dos perros y un tipo con escopeta caminando al contraviento por el orillo de un monte por si vuela una perdiz. Nada que ver con ese refrescar compulsivo de las páginas que dan cuenta de casos y decesos, tan colectivo e histérico.

Guasa tiene que habiendo tanto economista por ahí tenga yo que escribir esta cosa hoy

Tiene que ver mi entrada de hoy con Why did Big Data fail Clinton?, que trata de lo que el título indica: toda la tontería que se ha escrito de Cambridge Analytica. Enlazo todo lo demás, por otro lado, con el nóbel de economía de 2016 (Hart y otro).

¿Por qué? De acuerdo con lo que muchos han escrito, una empresa de siete friquis en el Reino Unido con acceso a los likes de 50000 donnadies y poco más tienen poder para quitar y poner reyes con unos cuantos clicks. Poco menos que en sus manos está el hacer periclitar, si no occidente entero, al menos, sí sus democracias. (Que es un relato sumamente interesado: ¿cómo justificar, si no, todo el tinglado de la GDPR?)

Vivir del ruido

  1. Tienes acceso a la serie histórica de hospitalizaciones (p.e. en Madrid) por diversas (muchas) causas.

  2. Tienes acceso a la serie histórica de mediciones de distintos factores ambientales (p.e., en Madrid): ruido, óxidos de nitrógeno, partículas en suspensión,…

  3. Buscas correlaciones (y, por supuesto, las encuentras).

  4. Les asocias p-valore espurios.

  5. Lo escribes en inglés (frecuentemente) y publicas:

    • Effect of Environmental Factors on Low Weight in Non-Premature Births: A Time Series Analysis
    • Effects of noise on telephone calls to the Madrid Regional Medical Emergency Service (SUMMA 112)
    • Short-term association between environmental factors and hospital admissions due to Dementia in Madrid
    • Impacto de la contaminación asociada al tráfico y la temperatura sobre variables adversas al nacimiento en Madrid. Un análisis de series temporales.
    • Short-term association between road traffic noise and demand for health care generated by Parkinson’s disease in Madrid
    • Traffic noise and adverse births outcomes in Madrid
    • Evaluation of short-term mortality attributable to particulate matter pollution in Spain
    • Impact of road traffic noise on cause-specific mortality in Madrid (Spain)
    • Association between environmental factors and emergency hospital admissions due to Alzheimer’s disease in Madrid
    • Saharan dust intrusions in Spain: Health impacts and associated synoptic conditions
    • Emergency multiple sclerosis hospital admissions attributable to chemical and acoustic pollution: Madrid (Spain), 2001-2009

¡Eso es a lo que Lakatos llama un señor programa de investigación científica!

Dos análisis y una pregunta

El primero:

Crece la productividad: Para el conjunto del año 2015 la economía crecerá cerca del 3,5%. Estos datos muestran que está aumentando la productividad, es decir, mientras la economía española crece a ritmos cercanos al 3,5% anual, el empleo lo está haciendo al 3%.

Rafael Pampillón Olmedo. Expansión, 24 de julio de 2015 (enlace)

El segundo:

La productividad se estanca: Tal como publicó el INE este jueves en tasa anual durante el segundo trimestre de este año, la economía creció un 3,1%. Sin embargo, mientras la economía creció en los últimos doce meses un 3,1%, el empleo lo hizo en un 3%.